Executando verificação de segurança...
1

Feedback sobre este benchmark de revisão de código por IA.

Opa pessoal, estamos criando um bench aqui na Kodus e queria a opinião de vocês

Ainda está em fase inicial, mas estou tentando torná-lo útil para comparar modelos.

https://codereviewbench.com/

Até agora, parece claro/útil? Acha que falta alguma informação?

Carregando publicação patrocinada...
2

Me parece interessante!
gostei de como está mostrado, mas nos cards do final faltam algumas linguagens. e seria bom na tabela dos modelos ter mais informações pensando no caso de usar LLM's locais, como tamanho ou tempo da revisão.

0