Executando verificação de segurança...
1

Pitch: Eu criei um MCP para dar um "sistema operacional" ao Codex CLI Harness

A maioria das pessoas ainda está tentando melhorar agente com prompt maior.

Só que o jogo mudou.

O problema não é só o modelo.
O problema é o harness em volta do modelo.

Quando o Codex começa uma tarefa longa, algumas coisas quebram silenciosamente:

  • ele esquece pesquisa feita antes
  • perde o motivo de uma decisão
  • resume erro cedo demais
  • repete tentativa que já falhou
  • diz "feito" sem prova
  • muda o próprio fluxo sem medir se melhorou

Então eu criei o Codex Harness MCP.

É um MCP local, sem dependências externas, que dá ao Codex CLI uma camada de engenharia de harness:

  • contratos de execução antes de implementar
  • memória local/RAG por projeto
  • traces brutos de tentativa, erro, decisão e sucesso
  • registro de verificação sem o MCP executar shell
  • eval cases e eval runs para medir mudanças no harness
  • perfis de harness
  • proposal + promotion decision estilo Meta-Harness-lite
  • export do harness em linguagem natural
  • completion gate antes de declarar pronto

A ideia é simples:

Prompt faz o agente começar.
Harness faz o agente trabalhar como engenharia.

Instalação:

npx skills add chapzin/codex-harness-mcp -g -a codex -y --copy

Repo:
https://github.com/chapzin/codex-harness-mcp

Skill:
https://skills.sh/chapzin/codex-harness-mcp/codex-harness-mcp

Se você usa Codex CLI para trabalho real, teste isso em uma tarefa longa e veja a diferença: o agente começa a deixar rastro, memória e prova.

Carregando publicação patrocinada...