Concordo com a crítica. Não-determinismo real não é algo que se resolve no nível de prompting ou orchestration, especialmente quando entra batching, paralelismo e limitações numéricas do stack de inferência.
A proposta do Akita não é “tornar o LLM determinístico”, mas reduzir o espaço de comportamento implícito e tornar divergências observáveis, auditáveis e reversíveis no nível do sistema.
Em vez de tentar eliminar a instabilidade do modelo (o que é irrealista), o foco é:
estruturar explicitamente o processo de decisão,
registrar diffs e efeitos colaterais,
permitir rollback,
e identificar onde e quando o modelo saiu do esperado
Realmente acabei colocando ele como uma solução para isso, por que infelizmente esse é o melhor que podemos fazer por enquanto
Ou seja, o ganho está mais em engenharia e controle de falhas do que em prometer correções das limitações fundamentais do modelo. Se a comunicação sugeriu o contrário, vale mesmo ajustar.