Criei uma plataforma para normalização de CSVs que é 30x mais rápida do que o Excel
Estava conversando com um amigo CTO que é a única pessoa técnica da empresa dele e ele me contou que a empresa estava usando o equivalente de um dia de trabalho por semana convertendo CSVs de clientes para o formato interno de dados deles.
Os clientes deles mandam dumps de CSVs que eles precisam importar, e esses dumps muitas vezes são tão diferentes do formato esperado por eles que alguém do time de Sales passava um dia fazendo operações complexas no Excel e aí ainda precisava com frequência que ele como CTO terminasse o trabalho em Python.
Perguntei o porquê deles não só usarem ferramentas de IA como GPT ou Claude pra fazer isso e eles me falaram que com essas ferramentas o ciclo é muito demorado, e é difícil validar que foi feita a coisa certa.
A IA gera código que as pessoas não-técnicas não conseguem validar, e aí depois de alguns minutos vem um arquivo CSV que eles tem que abrir no Excel que muitas vezes demora muito tempo também (arquivos com milhões de linhas), só pra abrir uma aba com os dados originais e uma com os normalizados e tentar ver se a transformação foi feita corretamente.
Então criei uma ferramenta que cortou esse tempo pra eles de uma média de 8h para a primeira CSV de um cliente para ~15min. O que ela faz é usar de um agente de IA para analisar os dados e o modelo alvo para a normalização e ir fazendo perguntas pro usuário sobre dúvidas que ela tem. Aí quando o agente entende melhor a transformação, ele gera um código Python por trás dos panos que roda numa sandbox, transforma os dados, e exibe para o usuário. Aí vem a feature que eles mais precisavam: poder auditar a transformação. Você clica em uma célula na tabela transformada e a plataforma te mostra exatamente de onde ela puxou os dados que compuseram essa célula e a transformação que foi feita.
Além disso, trabalhei muito em cima da eficiência, e a plataforma funciona mesmo com milhões de linhas na tabela.
Eles gostaram tanto que estou agora pensando em lançar publicamente e adoraria ter mais Alpha testers para dar feedback.
Tem uma landing page aqui: https://spreadsheets.skaldlabs.io/ e se alguém tiver interesse só me falar!