Opa, essa duvida é frequente quando apresento o sistema para alguém. Tem pelo menos duas razões:
A primeira é a latência determinística no hot path. NTK roda em todo PostToolUse do Claude Code. Se o hook adiciona 200ms de jitter, o dev sente. Rust me dá latência previsível sem pausa de GC para gerenciamento de memória em que linguagens como python, c# ou java possuem, também não me daria problema relacionados a malloc fragmentado em running longos via daemon no C++. L1+L2 rodam em < 5ms p99 num notebook de "antigo", em Python isso seria 30-80ms só do overhead de regex+tokenização, a ideia é reduzir ao máximo essa latencia.
O segundo motivo é o binário único. curl ou sh instala um executável de 15MB e pronto, sem pip install, sem venv, sem "qual Python tá no PATH", isso já me deu muita dor de cabeça kkkk. Pra uma ferramenta que precisa estar rodando o tempo todo em máquinas de devs heterogêneas , Win/Mac/Linux, com e sem GPU, isso remove uma categoria inteira de excesso de suporte para cada prataforma.
O python seria ótimo pra protótipo mas o projeto já era uma ideia pré-avaliada e não era algo "incerto", logo usei Rust como linguagem mais segura e performática. C++ daria a mesma performance com 3× mais bugs de memória, gerenciar memória usando C++ exige muita atenção, testes rigososos, para um projeto de médio porte como este e que só tem eu e o Claudinho Code como desenvolvedor, é difícil manter tudo na linha.