1

opa @kenimo49, valeu! e que massa esse teu post, é exatamente a mesma filosofia mesmo. a gente chegou no mesmo lugar por caminhos diferentes (vc na revisão, eu na duplicação) e no fundo é a mesma ideia: tem etapa que não precisa de IA nenhuma, e fica até melhor sem.

Sobre a comparação: é isso que vc imaginou. Normaliza com tree-sitter (joga fora nome de variável, literal, formatação... só sobra a estrutura) e em cima dos tokens roda winnowing. Por isso ele pega a cópia mesmo se a pessoa renomeou tudo, que é o caso clássico de código gerado por AI.

A sua ideia é ótimo. Vou tentar implementar esse fds e quando subir eu credito a vc no changelog. Muito obrigado pelo apoio, vale muito.

Carregando publicação patrocinada...