Molecular Olfaction Architecture (MOA): Uma proposta conceitual para olfato em LLMs
Hoje eu tive um brainstorm e cheguei numa ideia que achei interessante o suficiente pra documentar e compartilhar.
O problema
LLMs hoje percebem o mundo por texto, imagem e áudio. Esses três canais têm uma coisa em comum: todos são capturáveis digitalmente de forma barata e padronizada. Olfato nunca teve essa ponte. Modelos podem falar sobre cheiros — sabem que geosmin cheira a terra molhada após chuva — mas não conseguem perceber cheiros. Não existe encoder olfativo pra nenhum LLM hoje.
A arquitetura MOA
A proposta é um pipeline de três estágios:
Estágio 1 — Detecção molecular. Um sensor químico ou espectrômetro de massa identifica os compostos orgânicos voláteis (VOCs) presentes no ambiente, com concentrações aproximadas. É o equivalente ao encoder de imagem nos modelos de visão.
Estágio 2 — Formatação estruturada. Os compostos detectados viram uma lista estruturada:
2-Furfurylthiol: alto | Pirazinas: alto | Diacetil: médio | Guaiacol: baixo
Estágio 3 — Raciocínio semântico via LLM. A lista é passada pra um LLM que usa o conhecimento químico já presente no seu pré-treinamento pra produzir uma descrição em linguagem natural do cheiro detectado.
O insight central é que o Estágio 3 não precisa de fine-tuning nem de modelo especializado. O conhecimento já está nos LLMs gerais. MOA só fornece o canal de entrada que estava faltando.
Prova de conceito informal
Pra validar a camada de raciocínio independente do hardware, compus manualmente uma lista de compostos do café quente e enviei pro Gemini com o seguinte prompt:
"você é um teste de uma arquitetura nova surgindo pra olfatos pra LLMs, identifique esse cheiro e direi se esta correto: 2-Furfurylthiol, Geosmin, Diacetil, Pirazinas, Ácido acético, Ácido fórmico, Guaiacol, Furaneol"
O modelo identificou corretamente como café recém-passado torrado e detalhou a contribuição de cada composto.
Limitação importante: a lista foi composta por um humano que já sabia o alvo, não gerada por sensor real. Isso valida só o Estágio 3, não o pipeline completo.
Aplicações potenciais
- Robótica: robô sabe que o café tá pronto, que tem gás vazando, que a comida estragou — por cheiro, com raciocínio contextual
- Diagnóstico médico: câncer de pulmão precoce tem perfil volátil característico no hálito (hexanal e heptanal elevados). MOA poderia fazer triagem não invasiva com output em linguagem natural
- Acessibilidade: descrever cheiros ambientes em linguagem natural pra pessoas com anosmia
Limitações honestas
- Hardware de detecção molecular precisa ainda é caro e não portátil
- Sensores consumer-grade detectam classes de compostos, não moléculas específicas
- LLMs podem alucinar em combinações incomuns
- Nenhum experimento empírico foi realizado ainda
Conclusão
Dos cinco sentidos humanos, olfato é o único sem representação como input em tempo real em qualquer sistema de IA. MOA propõe um caminho pra fechar essa lacuna.
O conceito também abre espaço pra uma categoria de modelos especializados em olfação rodando dentro dessa arquitetura — que um amigo @pedrodev2026 chamou de LOMs (Large Olfaction Models).
O paper completo em inglês está disponível no Zenodo: https://zenodo.org/records/19798903
Concept paper especulativo. Nenhum experimento empírico foi conduzido.