2 min de leitura ·

O problema não é a IA gerar código ruim. O problema é você deixar.

O "UAU" do Claude Code durou 10 dias. O choro do legado vai durar anos. (Brincadeira)

Mas agora falando sério: Vi o LinkedIn inteiro vibrar com o "fim da programação" na semana passada. Hoje, vejo os mesmos perfis reclamando de alucinações, resultados catastróficos e códigos que são verdadeiras bombas-relógio de segurança.

Sabe por que isso acontece? Porque o mercado ainda trata a IA como um gênio da lâmpada, e não como um componente de software de baixa confiança (untrusted component).

Enquanto a maioria está "vibrando" com prompts, eu estou construindo um pipeline de manufatura de software com 11 camadas de governança e determinismo.

O que eu chamo de Anti-Alucinação não é um prompt melhor. É arquitetura bruta.

Para garantir que a velocidade da IA não vire dívida técnica, eu empacotei minha metodologia em ferramentas que forçam o determinismo. São todos open source de minha autoria:

intent-compiler (Lançamento)
https://mikaelcarrara.github.io/intent-compiler/
A Camada de Intenção. É o contrato original em Markdown que serve de DNA para o sistema. Sem contrato, não há geração.

prompt-sheet
https://mikaelcarrara.github.io/prompt-sheet/
A Camada de Estruturação. O framework que organiza o pensamento e as restrições de entrada. Ele garante que a IA opere dentro de um "grid" mental previsível, eliminando a margem para invenções criativas indesejadas.

Orquestrador de Blueprints (Python + Anthropic)
O "Cérebro" que valida cada linha contra as regras do negócio antes do build. Se a IA tenta "inventar", o pipeline trava. É o fim da alucinação silenciosa. O pipeline não começa com uma pergunta. Ele começa injetando as restrições rígidas do meu sistema: os tokens do Underlith e os protocolos do proto-md. A IA recebe um mundo onde ela não tem "vontade própria"; ela só pode operar dentro dos slots que eu defini.

html-md-sync
https://mikaelcarrara.github.io/html-md-sync/
A Camada de Sincronia. Garante que o que está na documentação é rigorosamente o que está em produção.

Underlith
https://mikaelcarrara.github.io/underlith/
A Camada Atômica. Um motor de design tokens que remove a "vontade própria" da IA na estilização, forçando infraestrutura de design sólida.

O mercado vai continuar nesse ciclo de euforia e frustração enquanto ignorar que IA sem governança é apenas entropia acelerada.

Eu não vendo código gerado por IA. Eu vendo Sistemas de Engenharia Determinísticos que utilizam IA como operário de sintaxe, sob uma blindagem arquitetural de 11 camadas.

O que você está construindo hoje para garantir que o seu "eu" do futuro não odeie o código que você gerou hoje com IA?

Menos "Vibe", mais Protocolo. Menos Ruído, mais Sinal.

Fonte: https://mikaelcarrara.github.io/

eugabrieldesousa

4 meses atrás

isto é algo que você vem aplicado por si empirico ou analisado alguma metodologia academica e moldado pra si? Não estou falando isso para querer desmerecer ou nada do tipo, mas só pra eu dar uma estudada nisso, o que venho estudado atualmente é o Spec Driven Development e aplicado em meus projetos profissionais e pessoais, mas o que voce comentou me pareceu bem pertinente,
isso já esta consolodidado ou ainda é experimental?

mikatronico

Autor

4 meses atrás

Para te responder diretamente: A metodologia é empírica, mas os fundamentos são clássicos. O que você estuda como Spec Driven Development é o primo próximo do que aplico. A diferença é que, no meu workflow, a 'Spec' não é apenas um documento de referência; ela é o input determinístico que o meu pipeline usa para travar o espaço amostral da IA.

A dor da alucinação é um problema de Entropia. Se você dá liberdade criativa para um modelo probabilístico (IA), ele vai alucinar por definição. Resolver isso com camadas de restrição (Constraints) não é experimental, é a única forma de usar IA em sistemas de missão crítica. O mercado de 'AI Engineering' sério está migrando para esse modelo de Blueprints e Contratos.

O Underlith, por exemplo, já está 'em produção' no ecossistema da Kobana (fintech que exige rigor absurdo), servindo como a verdade única de design para os agentes. As outras ferramentas que listei são a materialização desse sucesso que decidi abrir agora.

Por que a Governança resolve a Alucinação (Independente da minha ferramenta):
A alucinação ocorre no 'vácuo de contexto'. Se você pede para a IA 'criar um botão', ela inventa. Se você injeta uma camada de governança que diz: 'Estes são os únicos 4 tokens de cor permitidos e este é o contrato de acessibilidade', você não está 'pedindo', você está compilando uma intenção.

leocgpe

4 meses atrás

Tdd (de verdade), e alguns md, skills ou qq coisa do genero para dar as orientações de estilo, arquitetura etc resolvem o problema.

Para manter controle da IA, ela precisa seguir regras e TDD é o contrato que ela precisava. Crie ou gere testes reais e uteis, validados antes que a ia saia implementando o código final e impeça que ela altere os testes. Mantenha o controle, essas pessoas que se gabam de rodar 5 agentes em paralelo, mas não dão conta de revisar e garantir o trabalho de 1, estão contando apenas com a sorte.

felipex

3 meses atrás

Pois é, @leocgpe. Outro dia eu ouvi um cara dizendo num podcast que depois que começou a usar IA ele num escreveu mais nenhum teste mão. E ninguém argumentou contra :( Eu sempre achei isso errado, mas parece que tá cheio de programador preguiçoso por aí. Também concordo que é contar demais com a sorte.

felipex

4 meses atrás

Boa iniciativa, mikatronico, parabén!

Vou dar uma olhada assim que passar o aperreio.
Estou procurando/fazendo/tentando uma coisa parecida, mas ainda não me dei por satisfeito com o que eu já vi, inclusive Spec-Driven Development. Não por achar que são ruins, mas só porque acho que a abordagem que prefiro é outra, mas também não estou certo se é tão melhor assim.
Em vez de ter arquivos md, json e yaml como fonte de verdade, eu, como desenvolvedor, prefiro muito mais escrever as classes de domínio(e cabeçalho dos testes) na linguagem de programação que estiver usando e jogar o restante pra IA resolver. Por exemplo, estou tentando aplicar agora em sisteminha em Django, eu simplesmente escrevo os models e o OpenCode vai fazendo o restante.

Na verdade, o meu sonho é criar apenas o diagrama de classes em MermaidJS, PlantUML ou algo parecido e os agentes geraram o código completo, dessa forma ficaria até independente da linguagem de programação. Aí até usaria os arquivos md, json ou yaml, mas só como suporte ao verdadeiro núcleo, que seriam as classes.

Pelas minhas contas daria pra economizar uma ruma de token, já que muitas das tarefas poderiam ser feitas só com if/else ou até um pouco que de IA simbólica que é bem mais barata e determinística. O Django do Python já faz algo bem parecido, mas ainda acho que tá faltando alguma coisa.