Não acho que essa pesquisa possa ser usado para definir taxa de alucinação.
Foi algo muito mais próximo de incapacidade de validar verdade de falso de conteúdos novos, do que alucinação que é quando não sabe a resposta e mesmo assim gera com confiança a resposta. (Simplificando muito o termo, é claro).
Link do artigo na integra:
https://www.cjr.org/tow_center/we-compared-eight-ai-search-engines-theyre-all-bad-at-citing-news.php