Pitch: O Martelo e o Prego .:. Um livro prescritivo sobre adoção de IA para empresas brasileiras
Fala ae, Turma! Quero compartilhar aqui o lançamento de um projeto que tomou conta dos últimos meses da minha vida: escrevi um livro.
O primeiro lugar em que escolhi fazer um pitch oficial é aqui no TabNews, pela qualidade da audiência e porque sei que aqui ninguém tem paciência para hype sem substância. Então vou direto ao ponto, inclusive com as partes técnicas que aprendi escrevendo e vivendo tudo isso.
O problema que motivou o livro
Depois de quase 30 anos em transformação digital em grandes cias, acumulei uma frustração específica:
A maioria das iniciativas de IA nas empresas brasileiras não falha por falta de tecnologia. Falha por falta de método.
E o mercado editorial está cheio de livros que explicam o que é IA. Faltava um que escancarasse como decidir quando e onde aplicá-la, considerando o contexto real: cultura organizacional brasileira, maturidade digital das equipes, regulação local e pressão de curto prazo dos C-levels.
O que é O Martelo e o Prego
O título vem de uma frase que uso muito no trabalho: "para quem só tem martelo, todo problema é prego." O livro inverte isso: dado um problema real de negócio, como você escolhe a abordagem certa?
É uma obra prescritiva, não acadêmica, não motivacional. Ela entrega frameworks de decisão para gestores e times que precisam sair da fase "vamos fazer um projeto de IA" e entrar na fase "vamos resolver este problema específico com a abordagem certa, no prazo certo, com o time que temos".
O que aprendi tecnicamente; e está no livro
Esta é a parte que mais quero compartilhar com vocês, porque veio de projetos reais que ainda estão em produção.
RAG não é bala de prata, e quando ele falha, falha de um jeito específico
Mantenho um sistema de RAG chamado Calibra, que usa ChromaDB + Ollama localmente para simular um corretor de seguros sintético. O que aprendi:
- Chunking é a etapa mais negligenciada. O tamanho do chunk afeta diretamente a qualidade do contexto recuperado. Chunks grandes preservam mais contexto semântico, mas poluem o prompt. Chunks pequenos são mais precisos na recuperação, mas perdem coerência. Não existe valor certo — existe o valor certo para o seu caso.
- O embedding model importa mais do que o LLM em RAG. Fiz experimentos A/B comparando
all-MiniLM-L6-v2contraSerafim(modelo treinado em português do Comrade.ai). Para domínio específico em português, o Serafim ganhou em recall semântico em ~60% dos casos de teste. Mas tem trade-off: é mais pesado e mais lento. - LLM-as-judge é a melhor forma de avaliar RAG sem dataset rotulado. Em vez de métricas tradicionais, usei o próprio Claude como juiz para avaliar se a resposta gerada era fiel ao contexto recuperado. Funciona, mas precisa de prompt de avaliação muito bem calibrado para evitar viés de posição.
Fine-tuning é quase sempre a resposta errada para a pergunta certa
Quando um gestor diz "precisamos treinar o modelo com nossos dados", quase sempre o que ele quer na verdade é RAG com boa curadoria de base. Fine-tuning faz sentido em cenários específicos:
- Quando você precisa alterar o comportamento do modelo, não apenas o conhecimento
- Quando o domínio é tão específico que o modelo base alucina de forma sistemática mesmo com contexto
- Quando latência é crítica e você não pode se dar ao luxo de prompts longos
O livro tem um capítulo inteiro sobre essa decisão com um fluxograma de critérios.
Agentes são promessas com custo operacional real
Trabalhei com agentes baseados em LLM em dois contextos: análise de portfólio estratégico (TURING, rodando Ollama local com streaming) e detecção de fraude forense (com módulos de análise ELA, EXIF e FFT). O que ficou claro:
- Agentes falham em cascata. Diferente de uma API determinística, um agente com múltiplas ferramentas pode errar em qualquer etapa da cadeia e propagar o erro silenciosamente. Monitoramento de etapas intermediárias não é opcional.
- O custo de inferência de um agente é N vezes o custo de uma chamada simples, onde n é o número de passos. Isso muda o cálculo de viabilidade para empresas que saem do modo "PoC com API gratuita" para produção.
- Sistemas locais com Ollama são viáveis para uso corporativo restrito, mas exigem GPU adequada.
O ciclo de morte dos PoCs
Esta foi a observação mais dolorosa e mais útil que coloquei no livro. A maioria dos projetos de IA em empresas morre não na fase técnica, mas na transição entre PoC e produto. Os motivos mais comuns:
- O PoC foi construído com dados limpos que não existem em produção. Ninguém mapeou o pipeline de dados real antes de começar.
- Não havia dono de produto definido. A área de TI entregou o modelo, a área de negócio não sabia como incorporar ao fluxo operacional.
- A métrica de sucesso do PoC era técnica, mas o critério de aprovação era de negócio. Acurácia de 87% num modelo de churn impressionou o time de dados e não disse nada ao diretor comercial.
O livro propõe um contrato de PoC. Um documento de uma página que alinha expectativas antes de escrever a primeira linha de código.
Para quem é este livro
- Gestores de tecnologia e dados que precisam decidir entre construir, comprar ou descartar uma iniciativa de IA
- Tech Leads e Engenheiros que estão cansados de PoCs que morrem e querem entender o lado de produto e negócio
- Profissionais de negócio que trabalham com times de dados e querem entender o suficiente para fazer as perguntas certas
- Fundadores e empreendedores que estão avaliando onde IA faz sentido no seu produto
Não é para quem quer aprender a programar IA. É para quem precisa decidir sobre IA.
Contexto técnico do autor
Escrevo como praticante, não como consultor distante da operação. Atualmente:
- Gerencio portfólio de IA/dados
- Mantenho stack local: Ollama, ChromaDB, FastAPI, Flask, sentence-transformers, Netlify/Render/GitHub CI-CD
Onde encontrar
O livro está disponível na Uiclap e na Amazon Brasil.
Estou aberto a qualquer pergunta aqui nos comentários sobre os frameworks, sobre os experimentos técnicos, sobre o que não funcionou, sobre o que eu reformularia. Pode questionar à vontade.
Publicação feita seguindo as diretrizes de divulgação de projetos e os critérios de qualidade do TabNews.