Pitch: Eu criei um MCP para dar um "sistema operacional" ao Codex CLI Harness
A maioria das pessoas ainda está tentando melhorar agente com prompt maior.
Só que o jogo mudou.
O problema não é só o modelo.
O problema é o harness em volta do modelo.
Quando o Codex começa uma tarefa longa, algumas coisas quebram silenciosamente:
- ele esquece pesquisa feita antes
- perde o motivo de uma decisão
- resume erro cedo demais
- repete tentativa que já falhou
- diz "feito" sem prova
- muda o próprio fluxo sem medir se melhorou
Então eu criei o Codex Harness MCP.
É um MCP local, sem dependências externas, que dá ao Codex CLI uma camada de engenharia de harness:
- contratos de execução antes de implementar
- memória local/RAG por projeto
- traces brutos de tentativa, erro, decisão e sucesso
- registro de verificação sem o MCP executar shell
- eval cases e eval runs para medir mudanças no harness
- perfis de harness
- proposal + promotion decision estilo Meta-Harness-lite
- export do harness em linguagem natural
- completion gate antes de declarar pronto
A ideia é simples:
Prompt faz o agente começar.
Harness faz o agente trabalhar como engenharia.
Instalação:
npx skills add chapzin/codex-harness-mcp -g -a codex -y --copy
Repo:
https://github.com/chapzin/codex-harness-mcp
Skill:
https://skills.sh/chapzin/codex-harness-mcp/codex-harness-mcp
Se você usa Codex CLI para trabalho real, teste isso em uma tarefa longa e veja a diferença: o agente começa a deixar rastro, memória e prova.