Você compartilhou 5 links. 3 deles são críticas diretas ao Mythos, 1 deles é uma crítica geral à AI slop e somente 1 é neutro. Sem querer ofender ninguém, mas me parece desonestidade intelectual (e das grandes) uma pessoa responder à isso focando só no que é neutro e ignorando todo o resto. Colocando em porcentagem, a pessoa ignorou 80% da questão e focou nos 20% que lhe convém.
Vale lembrar que supostamente o Mythos seria absurdamente melhor que o Fable. Então críticas ao Mythos são críticas ao Fable, que é uma versão limitada do primeiro.
Agora, falando especificamente sobre o primeiro artigo. É importante destacar que artigo científico deve ter teor neutro e não crítico, pois o objetivo de um artigo científico é divulgar resultados de uma pesquisa e não criticar nada nem ninguém. Então é óbvio que o artigo não irá indicar diretamente falta de qualidade em nenhum dos modelos testados.
Mas os dados estão lá:
- Página 8, tabela 1, mostra o GPT-5.5 tendo pontuação significamente melhor que o Fable, por um custo muito menor e terminando a tarefa na metade do tempo.
- Página 9 mostra o GPT-5.5 com resultados melhores ou quase idênticos em todas as áreas. Exceto agricultura e meio ambiente, sendo a única área que o Fable realmente se saiu significamente melhor.
- Página 37 mostra que o GPT-5.5 custou $326 e teve uma pontuação de 45.8% e o Fable custou $2.402 e pontuou 40.5%. Pontuação significamente menor e custo muito maior.
Os dados estão no artigo. Quem é proficientemente alfabetizado e consegue interpretar dados, vê claramente: O Fable é muito mais caro e significamente pior que o GPT 5.5.
Então, dizer que o Fable é uma bosta é uma conclusão plenamente justificada pelos resultados da pesquisa.