Opa pessoal, recentemente montamos um benchmark prático de ferramentas de code review com IA usando pull requests reais de 5 projetos open-source (Sentry, Cal.com, Grafana, Discourse e Keycloak). 

O que fizemos:

Rodamos exatamente os mesmos PRs em 4 ferramentas de revisão com IA

• Kodus 
• GitHub Copilot
• CodeRabbit
• Cursor BugBot

- Sem configurações extras ou ajustes enviesados.

- Foco em bugs de severidade Critical, High e Medium

Seria muito massa ter o feedback de vocês. 

Aqui está o link: https://kodus.io/benchmark-code-review-ia/

Fiz um benchmark de algumas ferramentas de Code Review com IA, aqui está o resultado

Opa pessoal, recentemente montamos um benchmark prático de ferramentas de code review com IA usando pull requests reais de 5 projetos open-source (Sentry, Cal.com, Grafana, Discourse e Ke...