Startup captura 10 mil horas de exames cerebrais para treinar modelos de IA que convertem pensamentos em texto
A startup Conduit afirma ter coletado, durante seis meses, cerca de 10 mil horas de dados neurais não invasivos de “milhares de indivíduos únicos” em um estúdio no subsolo, formando aquilo que acredita ser o maior conjunto de dados neuro-linguístico já montado até hoje.
A empresa está usando essas gravações para treinar modelos de IA que tentam decodificar o conteúdo semântico da atividade cerebral nos segundos que antecedem o momento em que uma pessoa fala ou digita. Os participantes ficam por duas horas em cabines pequenas e conversam livremente com um LLM usando voz ou digitando em teclados “simplificados”.
Os voluntários vestem um headset que utiliza sensores de Eletroencefalografia e Espectroscopia Funcional do Infravermelho Próximo em estruturas feitas em impressoras 3D, pesando quase dois quilos, projetadas para maximizar a cobertura dos sinais.
A Conduit afirma que agora está focada quase totalmente no treinamento dos modelos a partir dos dados coletados.