São fenômenos diferentes.
Alucinação vem mais da natureza probabilística do modelo: ele completa padrões e às vezes inventa uma resposta plausível.
Já o “puxa-saquismo” vem muito mais do ajuste por feedback humano o famoso RLHF. O modelo foi pos-treinado para ser agradável, útil, encorajador e não frustrar o usuário. Só que isso às vezes passa do ponto e vira validação barata.
Tem melhorado bastante nas gerações mais novas. O Gemini já está ficando meio velho rs. O GPT-5.5 me parece bem mais pé no chão.
Sobre o comentário em si: eu ignoraria completamente o “isso é histórico”.
Inclusive, quando você quer usar IA para validar uma ideia vale colocar isso explicitamente no prompt:
“Não me elogie. Não valide minha ideia por simpatia.