Sem dúvidas dados para dataset são uma mina de ouro, quem simplificar esse pr... · jpierreribeiro

Respondendo a "Isso sim é um excelente post, parabéns! Dados p..." dentro da publicação Construção de datasets para Visão Computacional

jpierreribeiro

8 meses atrás

Sem dúvidas dados para dataset são uma mina de ouro, quem simplificar esse processo, principalmente em Visão Computacional onde carece de soluções do gênero vai ganhar muito dinheiro.

Por conta disso os modelos multimodais (como CLIP, OpenCLIP) vem ganhando destaque. Eles resolvem desafios de visão computacional sem treinamento prévio por meio de uma abordagem chamada zero-shot. Eles já são treinados com MILHÕES de dados.

São baseados em Vision Transformers, através da inferência você insere um prompt textual e um visual e recebe o output da probabilidade do seu prompt textual ser semelhante ao prompt visual.

Inclusive estou desenvolvendo um projeto de pesquisa envolvendo agricultura sobre isso.

texto

Inclusive, já existem diversas abordagens como (Autodistill, Label Studio, CVAT) utilizando modelos multimodais para fazer a parte difícil e repetitiva de anotação dos datasets. Apesar disso, acredito que não sejam muito utilizados no mercado brasileiro de IA, não são tão conhecidos aqui.

macnator

8 meses atrás

Nem me fale, trabalhar com IA no Brasil é um verdadeiro parto. o conteúdo mais técnico sobre IA não é solicitado, voce pode escrever o que for sobre ia, se tiver 2 ou 3 interessados por rede social voce já é um vencedor no Brasil, a maioria esta concentrado no GITHUB que eu nem uso e acho que só faz sentido para projetos de código aberto, ainda assim, quando se trata de brasileiros voce vê mil forks em um projeto sobre uso de ia, e pouquíssimos em projetos construídos para IA, eu não uso porque cá entre nós eu não quero meus projetos treinando IA da Microsoft. Acho impressionante e preocupante o avanço que vejo no mundo da IA no exterior comparado com aqui, o pessoal está engatinhando nisso, aprendendo: o que é um tensor, como funciona a IA, vejo cara apanhando pra integrar cuda e apenas entender o inicio de um treinamento de modelo, são poucos que podem abordar os assuntos com propriedade e já estão trabalhando dentro da blackbox do sistema financeiro e governamental, escondidos praticamente. Aqui parece que somente governo e grandes instituições estão indo atrás disso. Poucos desenvolvedores realmente estão desenvolvendo "para a área de IA", mas tem muitos desenvolvendo "com ia". Absurdo. Quer um exemplo kkk, olha o que eu comecei a postar e teve zero interesse, e acredite não foi só no tabnews eu usei isso como laboratório mesmo, publiquei em algumas redes, e interesse zero.
https://www.tabnews.com.br/macnator/serie-infra-multiagente-para-programacao-cliente-servidor-multi-api-de-ia-modelos-offline-historico-seguro-de-arquivos-e-recuperacao-total-de-servidores

Nesse caso ai é um sistema de memória estendida e ao mesmo tempo execução segura de agentes.
É ou não é para se preocupar essa falta de interesse? Não é a falta de interesse que me preocupa na verdade é o fato das pessoas não entenderem a relevância e o avanço que é assuntos como o seu e o meu entendeu? Não é que não exista interesse, é que os desenvolvedores não entendem a relevância, isso é o preocupante. Agora sobre o seu assunto:

Acho que visão computacional é e será o cerne da construção de robôs em geral pelos próximos anos, e estamos falando inclusive do setor de saúde, já é importante claro, mas será ainda mais, diaguinosticos por imagem geral, desde um ressonância ao seu exemplo na agricultura, e o que vai mandar no desenvolvimento disso são os dados, é só o que impede de ja termos quase 100% dos empregos substituídos, "apenas" os dados, e como tudo que a humanidade não consegue suprir por muito tempo acabam criando uma solução artificial. Eu mesmo estou criando um dataset de plantas baixas de construção, consegui fazer parceria com uma empresa de estudantes de engenharia e arquitetura para conseguir os dados, e agora estou aqui catalogando tudo em json kkkk, eu consigo vislumbrar uma centena de usos, desde a extração de lista de materiais para obras, pesquisa de compra, verificação de metragens. cálculos de orçamentos de execução é realmente assombroso o que pode ser feito, como eu gosto muito de IOT, estou pensando em uni o LIDAR a laser para criar um protótipo de escaneamento de interiores para retirada de medidas de forma rápida e confiável para softwares cad, assim arquitetos por exemplo podem desenvolver o projeto muito mais alinhado ao ambiente real, isso é um problema para eles hoje, eu tenho usado o Vision da Microsoft para isso, se ainda não conhece acredito que deva conhecer, acho que ele pode acelerar muito a sua ideia, a não ser que prefira fazer tudo na unha, o que seria bem mais interessante, eu mesmo estou usando por pura comodidade mesmo porque ja estou tocando outros projetos e o tempo não dá.

jpierreribeiro

Autor

8 meses atrás

Cara, sua visão é extremamente lúcida, é exatamente isso tem mais pessoas desenvolvendo projetos com IA do que desenvolvedores de IA em si. O mercado brasileiro e o setor acadêmico está muito atrasado.

Agora sobre o seu post, acredito que as pessoas não deem a devida importância por realmente não entenderem do que se trata. Inclusive, muito interessante ele, não tinha visto antes.

Essa sua ideia é de unir LIDAR com o intuito de reconstruir plantas baixas é um mercado validado fora do Brasil, você poderia trazer sua solução para cá, é um mercado gigantesco. Já tinha pensado em algo do gênero visando as recentes evoluções em gaussian splating, mas infelizmente a tecnologia para trabalhar com LIDAR não sai barato, mesmo IoT, a não ser que seja algo super limitado para projetos pequenos com microcontroladores, como um VL53L8CX da vida.

macnator

8 meses atrás

To pensando em investir um pouco no LIDAR de mais tecnologia, e não vender o produto em si, mas alugar para obras e projetos. Assim fica recorrente.