Dependendo de gente com esse teu pensamento a gente ia continuar na era das cavernas mesmo.
Tem 999.999 empresas gringas (com ligação direta com governo dos EUA, China, o caralho a 4) raspando TUDO que é site público do planeta, incluindo o TabNews, sem pedir porra nenhuma, sem dar crédito, sem opt-out, sem nada. Elas baixam livros piratas aos montes no Anna’s Archive, treinam modelo em cima de tudo que é repositório do GitHub, Stack Overflow, Reddit, Twitter... e tu vem com essa de “não gostaria que um projeto como esse seguisse a mesma prática”?
Pelo amor de Deus, cara.
Aqui o cara tá sendo mais correto que as big techs:
- tá dando crédito (ODC-By)
- tá oferecendo opt-out com blacklist permanente
- tá avisando com antecedência
- é pesquisa aberta, sem fins comerciais
E tu ainda acha ruim?
Então me explica: tu quer que ele treine o modelo com o quê? Com vento?? Com dados sintéticos em PT-BR que não existem em quantidade suficiente? Com o que exatamente?
Se fosse opt-in voluntário, como tu quer, ia ter 12 pessoas participando e o modelo ia sair uma merda. Todo mundo sabe disso, inclusive tu.
Quem não quiser que o texto dele sirva pra soberania digital brasileira é só preencher o formulário e pronto. Não é difícil.
Para de viagem e para de querer que projeto pequeno siga regra de santo enquanto as grandes fazem o que querem, e outra.. por esse pensamento minusculo que a gente não tem porcaria nenhuma boa.. não tem um sistema de geolocalização, não tem buscador, não tem app de comunicação próprio.. SOMOS 200% DEPENDENTES DE GRINGO e tu me vem com essa.. pqp..