Valeu pelo feedback!
Sobre docker logs, tail e ls: docker logs tá coberto (92%). tail e ls me interessam por um motivo específico, eles caem numa zona onde L1+L2 ainda compensa mas L3 seria overhead puro, output pequeno demais. Vou adicionar como fixtures na próxima leva pra garantir que o fast-path tá otimizado pra esses casos.
Sobre o medo de quebrar pipeline funcional, essa é a objeção #1 que eu precisava ouvir. Tem algumas coisas já na cabeça pra atacar isso
modo observe-only (NTK_OBSERVE_ONLY=1), roda, mede economia, mas devolve o output original. Dá pra avaliar impacto com risco zero.
kill switch via env var, desliga sem desinstalar, sem reiniciar shell.
passthrough garantido abaixo de N tokens (hoje N=300), output pequeno não é tocado.
Vou implementar o observe-only no próximo release e documentar como uma feature "teste" para o usuário validar se gerou impacto suficiente e se foi positivo ou negativo. Acho que isso resolve a maior parte que você mencionou.
valeu pelo tempo, feedback dessa qualidade é o que faz o projeto não ser brinquedo de um dev só :D