[E-BOOK]: AI Native Developer - Desvendando as Camadas de AI
Desvendando as Camadas de AI
Um e-book para desenvolvedores que querem se tornar AI-native — não só usar o chat, mas entender e construir os sistemas agênticos por baixo dele.
E-book completo e gratuito aqui
Você já programa. Sabe ler um stack trace, desenhar um schema, discutir um trade-off de arquitetura. Mas o vocabulário novo chega rápido demais: LLM, harness, agent, subagent, context, skill, plugin, MCP, CLI. Todo mundo usa esses termos como se fossem óbvios, e raramente alguém mostra onde cada um encaixa e como se conectam.
Este e-book resolve isso de um jeito específico: em vez de definir cada palavra isolada, ele constrói uma camada de cada vez em cima de um exemplo único e concreto, e a cada capítulo amarra de volta à camada central — o agent.
Para quem é
- Desenvolvedores que já programam e querem dominar a arquitetura de sistemas agênticos.
- Quem usa Claude Code (ou ferramentas similares) no dia a dia mas trata tudo como caixa-preta.
- Times que querem padronizar como constroem, empacotam e compartilham agentes.
Não é um tutorial de "como usar o chat". É sobre como o stack funciona por dentro e como você projeta em cima dele.
O fio condutor
Todo capítulo usa a mesma tarefa concreta:
Construir um sistema universal de CRUD de Pedidos (Orders).
Uma tarefa real de engenharia de software, que qualquer desenvolvedor reconhece e que possui a complexidade ideal para demonstrar quase todas as camadas agênticas. Vamos ver:
- por que o LLM sozinho sabe descrever uma API de pedidos, mas não consegue escrever os arquivos ou rodar o banco;
- como o harness dá olhos e mãos ao modelo para criar e alterar arquivos;
- como um agent (
agent-order-orchestrator) transforma o modelo genérico em um especialista de domínio; - como uma squad de subagents divide a tarefa em frentes de produto, arquitetura, backend, frontend, QA e infra;
- e como context, skill, plugin, MCP e CLI entram para tornar essa operação robusta, reaproveitável, segura e eficiente.
O modelo mental
As camadas não são uma pilha rígida de cima para baixo — elas se compõem. Mas há uma ordem de dependência que ajuda a pensar:
graph TD
LLM["LLM — o cérebro: prevê o próximo token"]
HARNESS["Harness — o corpo: loop, ferramentas, permissões"]
AGENT["Agent — o especialista: prompt + modelo + ferramentas"]
SUB["Subagent — a squad: delegação em contexto próprio"]
CTX["Context — o que o agente enxerga"]
SKILL["Skill — conhecimento sob demanda"]
MCP["MCP — conexão com o mundo externo"]
PLUGIN["Plugin — empacotamento distribuível"]
CLI["CLI — onde você opera tudo"]
LLM --> HARNESS
HARNESS --> AGENT
AGENT --> SUB
CTX -.alimenta.-> AGENT
SKILL -.estende.-> AGENT
MCP -.conecta.-> AGENT
PLUGIN -.empacota.-> AGENT
CLI -.opera.-> HARNESS
Leia assim: o LLM é o cérebro. O harness é o corpo que dá a ele olhos, mãos e um loop de ação. O agent é uma configuração desse conjunto para um trabalho específico. Tudo o mais — subagent, context, skill, plugin, MCP, CLI — existe para tornar o agent mais capaz, mais confiável ou mais fácil de operar.
Como ler
Linear, do 01 ao 10, é a forma recomendada na primeira vez — cada capítulo assume o anterior. Mas o capítulo 03 (agent) é o centro de gravidade: se você só tem 20 minutos, leia o 01, o 02 e o 03 nessa ordem e já terá o modelo mental que sustenta o resto.
Cada capítulo segue a mesma disciplina pedagógica:
- Exemplo primeiro. Você vê o conceito em uso antes de qualquer definição.
- Definição depois. Só então formalizamos o termo.
- Amarração com o
agent. Toda camada fecha mostrando como se conecta ao capítulo-âncora. - Trade-offs reais. O que custa, onde falha, quando não usar.
- Fontes primárias. Docs oficiais e papers, não blogs de terceiros.