Executando verificação de segurança...
2

Sobre a dificuldade das AIs com este tipo de assunto, talvez você ache interessante o desafio Arc Prize:

https://arcprize.org/arc-agi

Quando a questão envolve questões espaciais, problemas simples que crianças de 5 anos resolvem com facilidade, as LLMs tomam pau.

https://github.com/fchollet/ARC-AGI

Os scores são bem baixos, a maioria em torno de 38% de acerto.

Olha o resultado do ano passado:

https://arcprize.org/competitions/2025/

O vencedor teve 24% de acerto.

Carregando publicação patrocinada...