Pitch: O Martelo e o Prego .:. Um livro prescritivo sobre adoção de IA para empresas brasileiras · rogernet

Fala ae, Turma! Quero compartilhar aqui o lançamento de um projeto que tomou conta dos últimos meses da minha vida: escrevi um livro.

O primeiro lugar em que escolhi fazer um pitch oficial é aqui no TabNews, pela qualidade da audiência e porque sei que aqui ninguém tem paciência para hype sem substância. Então vou direto ao ponto, inclusive com as partes técnicas que aprendi escrevendo e vivendo tudo isso.

O problema que motivou o livro

Depois de quase 30 anos em transformação digital em grandes cias, acumulei uma frustração específica:

A maioria das iniciativas de IA nas empresas brasileiras não falha por falta de tecnologia. Falha por falta de método.

E o mercado editorial está cheio de livros que explicam o que é IA. Faltava um que escancarasse como decidir quando e onde aplicá-la, considerando o contexto real: cultura organizacional brasileira, maturidade digital das equipes, regulação local e pressão de curto prazo dos C-levels.

O que é O Martelo e o Prego

O título vem de uma frase que uso muito no trabalho: "para quem só tem martelo, todo problema é prego." O livro inverte isso: dado um problema real de negócio, como você escolhe a abordagem certa?

É uma obra prescritiva, não acadêmica, não motivacional. Ela entrega frameworks de decisão para gestores e times que precisam sair da fase "vamos fazer um projeto de IA" e entrar na fase "vamos resolver este problema específico com a abordagem certa, no prazo certo, com o time que temos".

O que aprendi tecnicamente; e está no livro

Esta é a parte que mais quero compartilhar com vocês, porque veio de projetos reais que ainda estão em produção.

RAG não é bala de prata, e quando ele falha, falha de um jeito específico

Mantenho um sistema de RAG chamado Calibra, que usa ChromaDB + Ollama localmente para simular um corretor de seguros sintético. O que aprendi:

Chunking é a etapa mais negligenciada. O tamanho do chunk afeta diretamente a qualidade do contexto recuperado. Chunks grandes preservam mais contexto semântico, mas poluem o prompt. Chunks pequenos são mais precisos na recuperação, mas perdem coerência. Não existe valor certo — existe o valor certo para o seu caso.
O embedding model importa mais do que o LLM em RAG. Fiz experimentos A/B comparando all-MiniLM-L6-v2 contra Serafim (modelo treinado em português do Comrade.ai). Para domínio específico em português, o Serafim ganhou em recall semântico em ~60% dos casos de teste. Mas tem trade-off: é mais pesado e mais lento.
LLM-as-judge é a melhor forma de avaliar RAG sem dataset rotulado. Em vez de métricas tradicionais, usei o próprio Claude como juiz para avaliar se a resposta gerada era fiel ao contexto recuperado. Funciona, mas precisa de prompt de avaliação muito bem calibrado para evitar viés de posição.

Fine-tuning é quase sempre a resposta errada para a pergunta certa

Quando um gestor diz "precisamos treinar o modelo com nossos dados", quase sempre o que ele quer na verdade é RAG com boa curadoria de base. Fine-tuning faz sentido em cenários específicos:

Quando você precisa alterar o comportamento do modelo, não apenas o conhecimento
Quando o domínio é tão específico que o modelo base alucina de forma sistemática mesmo com contexto
Quando latência é crítica e você não pode se dar ao luxo de prompts longos

O livro tem um capítulo inteiro sobre essa decisão com um fluxograma de critérios.

Agentes são promessas com custo operacional real

Trabalhei com agentes baseados em LLM em dois contextos: análise de portfólio estratégico (TURING, rodando Ollama local com streaming) e detecção de fraude forense (com módulos de análise ELA, EXIF e FFT). O que ficou claro:

Agentes falham em cascata. Diferente de uma API determinística, um agente com múltiplas ferramentas pode errar em qualquer etapa da cadeia e propagar o erro silenciosamente. Monitoramento de etapas intermediárias não é opcional.
O custo de inferência de um agente é N vezes o custo de uma chamada simples, onde n é o número de passos. Isso muda o cálculo de viabilidade para empresas que saem do modo "PoC com API gratuita" para produção.
Sistemas locais com Ollama são viáveis para uso corporativo restrito, mas exigem GPU adequada.

O ciclo de morte dos PoCs

Esta foi a observação mais dolorosa e mais útil que coloquei no livro. A maioria dos projetos de IA em empresas morre não na fase técnica, mas na transição entre PoC e produto. Os motivos mais comuns:

O PoC foi construído com dados limpos que não existem em produção. Ninguém mapeou o pipeline de dados real antes de começar.
Não havia dono de produto definido. A área de TI entregou o modelo, a área de negócio não sabia como incorporar ao fluxo operacional.
A métrica de sucesso do PoC era técnica, mas o critério de aprovação era de negócio. Acurácia de 87% num modelo de churn impressionou o time de dados e não disse nada ao diretor comercial.

O livro propõe um contrato de PoC. Um documento de uma página que alinha expectativas antes de escrever a primeira linha de código.

Para quem é este livro

Gestores de tecnologia e dados que precisam decidir entre construir, comprar ou descartar uma iniciativa de IA
Tech Leads e Engenheiros que estão cansados de PoCs que morrem e querem entender o lado de produto e negócio
Profissionais de negócio que trabalham com times de dados e querem entender o suficiente para fazer as perguntas certas
Fundadores e empreendedores que estão avaliando onde IA faz sentido no seu produto

Não é para quem quer aprender a programar IA. É para quem precisa decidir sobre IA.

Contexto técnico do autor

Escrevo como praticante, não como consultor distante da operação. Atualmente:

Gerencio portfólio de IA/dados
Mantenho stack local: Ollama, ChromaDB, FastAPI, Flask, sentence-transformers, Netlify/Render/GitHub CI-CD

Onde encontrar

O livro está disponível na Uiclap e na Amazon Brasil.

Estou aberto a qualquer pergunta aqui nos comentários sobre os frameworks, sobre os experimentos técnicos, sobre o que não funcionou, sobre o que eu reformularia. Pode questionar à vontade.

Publicação feita seguindo as diretrizes de divulgação de projetos e os critérios de qualidade do TabNews.