Pitch: O problema não era o modelo: um projeto de visão computacional para salvar vidas
Nos últimos meses venho trabalhando em um projeto de visão computacional para monitoramento de desastres urbanos usando Python e YOLO.
A ideia parecia relativamente simples:
Treinar um modelo capaz de identificar pessoas em cenários de enchente, alagamento e colapso urbano.
O problema começou quando os modelos “prontos” encontraram o mundo real.
Datasets populares funcionam muito bem em benchmarks, mas começam a falhar em situações pouco representadas:
- pessoas parcialmente submersas;
- equipes de resgate confundidas com civis;
- baixa visibilidade;
- cenários caóticos;
- imagens degradadas;
- contextos urbanos específicos.
Em muitos casos, o modelo detectava “person”.
Mas “person” não era suficiente.
Foi aí que percebi que o maior desafio não era trocar de arquitetura, aumentar parâmetros ou buscar um modelo mais recente.
O problema estava nos dados.
O projeto acabou se transformando em um estudo muito maior sobre:
- construção de datasets específicos de domínio;
- geração de dados sintéticos;
- balanceamento de classes;
- falsos positivos;
- limitações de benchmarks tradicionais;
- e os desafios de construir IA fora de ambientes controlados.
O resultado foi o Urban Disaster Monitor:
um sistema desenvolvido em Python para monitoramento de cenários de desastre usando visão computacional em tempo real.
Mais do que um projeto de IA, ele acabou virando um aprendizado sobre como modelos mudam completamente de comportamento quando saem do benchmark e encontram problemas reais.
Uma das coisas mais interessantes desse processo foi perceber que:
às vezes o gargalo não está no modelo, mas no contexto que ele nunca aprendeu a enxergar.
Se você já trabalhou com:
- visão computacional;
- datasets;
- IA aplicada;
- synthetic data;
- ou problemas reais de inferência;
eu adoraria trocar ideias.