Pitch: Como a programação pode acelerar a ciência (e uma API para os dados do EBBC de 2012 a 2026)

Recentemente, entrei no universo da bibliometria e cientometria e me deparei com um problema crônico na comunidade científica: a falta de infraestrutura de dados.
Muito do conhecimento científico e histórico de grandes eventos ainda está trancado em sites antigos, PDFs mal formatados e sistemas sem qualquer tipo de acesso programático.
Na prática, pesquisadores (muitos sem background técnico) gastam dias coletando, copiando e organizando dados manualmente antes de sequer começar a analisar o que importa. Esse processo, além de maçante, mata a reprodutibilidade da ciência e abre margem para erros humanos.
O Caso Real: Raspando o EBBC (2012-2026)
Para ilustrar como a programação é uma habilidade vital para a pesquisa, decidi analisar a evolução temática e as redes de colaboração do EBBC (Encontro Brasileiro de Bibliometria e Cientometria).
O cenário que encontrei foi o clássico "pesadelo do desenvolvedor":
- Páginas antigas e sem padronização.
- Artigos com metadados e registros incompletos.
- Ausência total de uma API.
Fazer isso manualmente seria inviável ou extremamente exaustivo. Usando Python, automatizei o processo de extração e consolidação dos anais de 2012 até 2026. Onde a automação pura falhava por conta de dados corrompidos ou ausentes, integrei IA via API para analisar o contexto dos artigos e complementar as informações que faltavam.
A programação como habilidade essencial (e mais acessível com IA)
Dominar o básico de programação está deixando de ser um diferencial e se tornando uma habilidade vital para a pesquisa científica. Se cada pesquisador soubesse o suficiente para elaborar pequenas soluções automatizadas, o ritmo da ciência seria outro. Em vez de perder semanas em tarefas braçais de coleta, o cientista ganharia autonomia para fazer a pesquisa avançar muito mais rápido.
A boa notícia é que aprender a programar e construir essas soluções nunca foi tão acessível. Com o avanço das ferramentas de Inteligência Artificial, a barreira técnica diminuiu drasticamente. Hoje, um pesquisador não precisa ser um engenheiro de software sênior para estruturar um script; ele pode usar a IA como copiloto para ajudar a gerar códigos de coleta, entender erros e acelerar o aprendizado.
Ainda assim, sei que começar a aplicar isso na prática leva tempo. Por isso, enquanto essa realidade avança e para facilitar a vida do próximo pesquisador que decidir estudar esse evento, resolvi poupar o trabalho manual de terceiros e centralizar tudo o que extraí.
A Solução: EBBC OpenData (API Pública)
Para resolver o meu problema e, principalmente, garantir que ninguém mais precise repetir esse trabalho de coleta, transformei essa base de dados dispersa em uma infraestrutura aberta.
Criei o EBBC OpenData, um ecossistema com uma API pública que entrega todos os dados tratados e prontos para estudos bibliométricos, análise de redes de coautoria ou mineração de texto.
- Plataforma Web / API: ebbcopendata.vercel.app
- Repositório do Projeto: GitHub - EBBC-OpenData (⭐)
Conclusão: Código como Infraestrutura Científica
Quando desenvolvedores criam ferramentas, APIs e bases abertas para a ciência, não estamos apenas escrevendo código; estamos construindo a infraestrutura que permite a outros profissionais gerarem conhecimento mais rápido.
Existe um oceano de oportunidades para quem programa contribuir com a comunidade científica.
Se você trabalha com dados, curte automação ou se interessa por cientometria, o projeto está aberto para contribuições, críticas e sugestões. O que acharam da abordagem?