Feedback sobre este benchmark de revisão de código por IA.
Opa pessoal, estamos criando um bench aqui na Kodus e queria a opinião de vocês
Ainda está em fase inicial, mas estou tentando torná-lo útil para comparar modelos.
Até agora, parece claro/útil? Acha que falta alguma informação?