1

Você compartilhou 5 links. 3 deles são críticas diretas ao Mythos, 1 deles é uma crítica geral à AI slop e somente 1 é neutro. Sem querer ofender ninguém, mas me parece desonestidade intelectual (e das grandes) uma pessoa responder à isso focando só no que é neutro e ignorando todo o resto. Colocando em porcentagem, a pessoa ignorou 80% da questão e focou nos 20% que lhe convém.

Vale lembrar que supostamente o Mythos seria absurdamente melhor que o Fable. Então críticas ao Mythos são críticas ao Fable, que é uma versão limitada do primeiro.


Agora, falando especificamente sobre o primeiro artigo. É importante destacar que artigo científico deve ter teor neutro e não crítico, pois o objetivo de um artigo científico é divulgar resultados de uma pesquisa e não criticar nada nem ninguém. Então é óbvio que o artigo não irá indicar diretamente falta de qualidade em nenhum dos modelos testados.

Mas os dados estão lá:

  • Página 8, tabela 1, mostra o GPT-5.5 tendo pontuação significamente melhor que o Fable, por um custo muito menor e terminando a tarefa na metade do tempo.
  • Página 9 mostra o GPT-5.5 com resultados melhores ou quase idênticos em todas as áreas. Exceto agricultura e meio ambiente, sendo a única área que o Fable realmente se saiu significamente melhor.
  • Página 37 mostra que o GPT-5.5 custou $326 e teve uma pontuação de 45.8% e o Fable custou $2.402 e pontuou 40.5%. Pontuação significamente menor e custo muito maior.

Os dados estão no artigo. Quem é proficientemente alfabetizado e consegue interpretar dados, vê claramente: O Fable é muito mais caro e significamente pior que o GPT 5.5.

Então, dizer que o Fable é uma bosta é uma conclusão plenamente justificada pelos resultados da pesquisa.

Carregando publicação patrocinada...
1

Então, dizer que o Fable é uma bosta é uma conclusão plenamente justificada pelos resultados da pesquisa.

Olhar para o segundo melhor modelo do benchmark e carimbá-lo como 'bosta' é forçar uma narrativa emocional que os próprios dados você trouxe para a discussão simplemente não sustentam!!! Preço abusivo, talvez. Marketing exagerado, com certeza. Mas não confunda as coisas.

1

Mas eu não preciso de dados ou evidências para sustentar uma opinião. Entenda: se a pessoa acha algo uma bosta ou a melhor coisa do mundo, isso é uma questão de opinião. E opinião não precisa de evidências, nem é possível de evidenciá-la. O que é possível, é justificar a opinião.

E a opinião está muito bem justificada: A Anthropic fez um marketing absurdo como se fosse revolucionar tudo com o novo modelo, para no final entregar algo pior e mais caro que a sua principal concorrente.

Acho que o pensamento "nossa, que bosta" é o pensamento mais sensato para se ter em uma situação como esta. Pagar mais para receber menos é uma bosta.

Segundo melhor? É sim. E isso seria aceitável se tivesse um preço condizente com o segundo melhor e um marketing condizente com o segundo melhor. Mas o marketing foi feito como se fossem lançar uma revolução e estão cobrando como se fosse uma revolução.

É, é uma bosta.

1

Beleza, se o seu ponto agora é sobre a sua opinião pessoal...

Minha única divergência lá atrás foi quando o colega afirmou que 'o paper prova... que o Fable 5 é uma bosta'.