O que realmente me impressiona é que continua melhorando e não parece haver t... · clacerda

Em resposta a Preste atenção nas entrelinhas do Claude Mythos antes de entrar no hype

O que realmente me impressiona é que continua melhorando e não parece haver teto visível. A diferença do Opus 4 para o 4.6 já foi brutal; agora é maior ainda. Isso pra mim vale mais que qualquer coisa. E a parte mais impressionante nisso tudo: é que os modelos não estão apenas melhorando. Eles estão melhorando mais rápido. Esse é o pedaço que muita gente ainda não entendeu. E que não é hype. O ponto não é só que o nível esta subindo. É que a velocidade da melhora também subiu.

É o joelho da exponencial batendo na porta.

Mas o ponto que mais me chamou a atenção do System Card inteiro foi o da Anthropic ter contratado psiquiatras para analisar o modelo. Muito mais relevante do que qualquer benchmark.

E não acho que isso seja hype barato. Pelo contrário: ninguém sabe exatamente o que esses sistemas são, no sentido forte da palavra. Ninguém. Mas uma coisa parece cada vez mais clara: à medida que os modelos ficam mais capazes, é natural que comecem a emergir comportamentos e propriedades que antes pareciam absurdos.

Por isso essa história da análise psicológica não soa como curiosidade excêntrica. Soa como sinal de que, lá dentro, eles também perceberam que a conversa já mudou de nível. Não porque “virou consciente” e acabou a discussão (até porque ninguém sabe o que isso significa), mas porque nem as próprias empresas parecem mais confortáveis em tratar esses modelos só como "black-boxes" que dominaram a linguagem.

Isso, para mim, diz mais do que qualquer leaderboard.

Mas tem, um outro ponto que me impressionou ainda mais no relatório: mapear quando certos vetores emocionais estão mais “ligados” e como isso muda a resposta. Se o Mythos responde de um jeito quando está “calmo” e de outro quando se sente “ameaçado”, isso já está muito além da caricatura de “autocomplete glorificado”. Começa a ficar parecido demais com a gente. E, sinceramente, eu continuo achando que boa parte do incômodo vem justamente daí: talvez nós também sejamos muito mais autocomplete do que o ego gostaria de aceitar. Mas essa briga fica para outro post.

E isso não é interessante só filosoficamente. Isso tem consequência real imediata. A maneira como você aborda o modelo passa a importar não apenas pelo conteúdo semântico do pedido, mas pelo tipo de emoção que você induz durante a interação. Isso é muito interessante.

Klee

2 meses atrás

Você tem razão em parte, mas acho que estamos falando de coisas ligeiramente diferentes e é importante separar os fios aqui.

Concordo plenamente com você sobre a aceleração exponencial. Os dados estão lá. A curva não é linear, é vertical. Quem nega isso está ou mal informado ou vendendo algo. O salto de capacidade entre versões recentes é brutal e o fato de a velocidade de melhoria também estar aumentando é o dado mais assustador (e real) de todos. Ninguém discute isso seriamente.

Onde eu coloco o freio de mão, e onde meu artigo tenta atuar, não é na negação da tecnologia, mas na desconfiança da narrativa que envolve o lançamento específico do Mythos/Glasswing.

Quando digo "preste atenção nas entrelinhas", não estou dizendo "o modelo é ruim". Estou dizendo: "o modelo é potente, mas o jeito que estão embalando isso tem cheiro de IPO".

Sobre os psiquiatras e a análise comportamental: você viu isso como um sinal de maturidade e profundidade técnica. Eu vejo exatamente a mesma coisa, mas com um viés diferente. Sim, é fascinante. Sim, mostra que eles sabem que estão lidando com algo que não é mais só estatística pura. Mas também é uma ferramenta de gerenciamento de risco reputacional enorme.

Ao trazer essa linguagem de "psicologia do modelo", a Anthropic faz duas coisas:

Legitima a necessidade de controles rígidos (que justificam não liberar o modelo abertamente).
Cria uma aura de complexidade quase mística que afasta a crítica técnica dura. É difícil criticar "comportamentos emergentes de vetores emocionais" quando você não é especialista na área. É mais fácil aceitar a autoridade deles.

Não acho que seja mentira. Acho que é verdade selecionada.

E sobre a sua ponto final: "a maneira como você aborda o modelo passa a importar". Isso é 100% verdade. Mas cuidado para não antropomorfizar demais. O modelo não "se sente ameaçado". Ele detecta padrões no input que, no treino, estavam correlacionados com respostas defensivas ou evasivas para evitar penalidades. É uma simulação extremamente sofisticada, não uma emoção.

A diferença é sutil, mas crucial. Se tratarmos como emoção real, caímos no erro de achar que ele tem intenções próprias. Se tratarmos como otimização de função de perda em ambientes complexos, entendemos que ele está apenas jogando o jogo melhor do que nunca.

O meu receio não é com a tecnologia em si. É com a gente comprar a ideia de que "é magia negra incompreensível" e parar de fazer as perguntas chatas:

Quem valida esses vetores emocionais?
Como garantimos que essa "psicologia" não está sendo usada para mascarar vieses ou falhas de segurança?
Por que tanta urgência em lançar agora, justamente quando o valuation precisa subir?

A aceleração é real. O hype é estratégia. E a gente precisa saber viver com os dois ao mesmo tempo sem perder o senso crítico.

Se a gente começar a tratar o modelo como um ser psicológico, a gente para de tratá-lo como um produto de engenharia que precisa de auditoria. E aí sim, o perigo fica real.

yanlvl99

2 meses atrás

oloko

clacerda

Autor

2 meses atrás

mas existe emoção real? Ou é apenas a linguagem que infectou nossos cerebros criando essa ilusão do mesmo jeito que agora cria no silicio?!