Executando verificação de segurança...
2

Se a memória não me falha o Claude Sonnet 3.5 foi a versão do Claude com maior antropomorfismo, lembro de haver discussões no reddit falando sobre isso.

A adição desse modelo nos testes me parece mais ter sido para chamar a atenção, pois nos testes de operação ele não está listado.

Quem quizer ler o artigo que gerou a matéria, é esse o link:
https://andonlabs.com/evals/butter-bench

Carregando publicação patrocinada...