Fiz um benchmark de algumas ferramentas de Code Review com IA, aqui está o resultado
Opa pessoal, recentemente montamos um benchmark prático de ferramentas de code review com IA usando pull requests reais de 5 projetos open-source (Sentry, Cal.com, Grafana, Discourse e Keycloak).
O que fizemos:
Rodamos exatamente os mesmos PRs em 4 ferramentas de revisão com IA
• Kodus
• GitHub Copilot
• CodeRabbit
• Cursor BugBot
-
Sem configurações extras ou ajustes enviesados.
-
Foco em bugs de severidade Critical, High e Medium
Seria muito massa ter o feedback de vocês.
Aqui está o link: https://kodus.io/benchmark-code-review-ia/