"Ia capaz de analisar imagens" é bem amplo, precisa pensar nisso de forma específica, porque é assim que os modelos atuais são, não existe um modelo generalista decente infelizmente, e acho que esse é o maior problema que vai enfrentar.
Atualmente você não consegue por exemplo pegar uma ia seja a melhor que for e pedir para ela identificar todos os itens de uma imagem seja ela qual for, o modelo será bom para alguns itens e péssimo para outros entende? E todos vão custar caro. Implementar IA local só se tiver bastante investimento, e estamos falando na faixa ai tranquilamente de no minimo meio milhão de reais para uma IA decente que você possa treinar em algo específico que deseja e depois manter offline para inferência de resultados.
Você pode ler por ai que uma placa da Nvidia de 20 mil reais da conta de testes, mas não é verdade, a questão toda é memoria, e os melhores modelos tem muitos gigas de tamanho, você ate pode fazer umas gambiarras pra fracionar o modelo, despejar em disco usar swap (tudo isso eu já fiz kkk), mas no fim o desempenho será tão pobre e o treinamento tão lento que você vai acabar desistindo dessa abordagem.
Um exemplo claro do que eu estou falando, digamos que você deseja criar um sistema que analise plantas baixas de construção para extrair medidas do ambiente, ou criar uma lista de materiais para fazer orçamento.
Você não vai encontrar nenhum modelo que consegue capturar tudo entendeu, alguns te passam as metragens mas sempre vem algo errado, outros te passam listas de materiais mas sempre com algo incorreto ou incompleto, isso porque os modelos não foram treinados para isso. Neste caso especifico você teria que treinar o modelo exatamente para o que deseja fazer e iria funcionar, o problema é que teria que ter milhares de exemplos de dados ou seja plantas com descrições exatas dos materiais ou medidas etc, para o modelo aprender a fazer isso. A questão toda é onde conseguir esses dados e quem vai montar a base de dados item a item planta a planta sacou? É ai que está o ouro da IA, não é bem os modelos, são as bases de dados especializadas para treinamento que somente empresas grandes tem e são dados proprietários que não estão na internet, e elas mesmas não usam porque não tem gente para converter esses dados em dados utilizáveis pela IA, porque como disse teria que colocar planta a planta item a item de cada planta em um json por exemplo o que é extenuante, complexo e um trabalho gigantesco. Entendeu o problema todo? É isso que está faltando no mercado, profissionais interessados em fazer isso, por isso os salários gigantescos na área.
Você pode fazer esses treinamentos na nuvem um exemplo é usando o Azure Computer Vision da Microsoft por exemplo que já tem uma estrutura pronta para você treinar modelos para reconhecer imagens com seus parâmetros, google, amazon etc também tem isso, mas vamos falar sério? Eles vão usar o seu trabalho extenuante para treinar os modelos deles, ou seja você paga para usar e eles ainda roubam seu trabalho e treinam os modelos deles com isso. E depois quando tu acha que lançou o aplicativo top das galáxias, a Microsoft lança um penduricalho no office ou outro aplicativo qualquer com a mesma função e milhões de dólares em marketing que você ajudou a treinar e você se lasca. Aconteceu comigo isso, eu fui a primeira pessoa a lançar uma Macro em VBA que integrava o Microsof Word ao GPT, para gerar texto dentro do Word, e menos de um ano depois advinha o que aconteceu, você tem que ponderar muito bem aonde vai investir seu tempo e esforço com IA ou te derrubam muito rapido. E acredito que isso vai ocorrer com qualquer empresa de nuvem que usar, pra ti ter uma ideia até a nuvem da magazine Luiza no brasil tem um termo no seu contrato de serviço que diz que todo o conteúdo que estiver nos servidores deles pertence a eles, só no brasil que não leem contrato que alguem aceitaria isso, mas todas as empresas de cloud tem algo nesse sentido, autorizando eles a usarem os dados para "melhorar" serviços.
O que eu realmente acho? Consiga investimento, venda a casa, sei lá, mas crie seu mecanismo todo local, off-line e depois coloque seu aplicativo no ar, ou a copia será impossível de evitar, a algum tempo atrás escrevendo artigos sobre ia, eu afirmei e continuo afirmando, que somente empresas que tiverem seus próprios modelos de IA irão conseguir gerar valor no mercado, isso a mais de dois anos e você pode procurar no mercado de dois anos para cá que empresa sem um modelo próprio avançou no mercado de verdade.
Recomendo a leitura:
1 - https://www.tabnews.com.br/macnator/a-revolucao-da-inteligencia-artificial-so-que-nao-artigo
2 - https://www.tabnews.com.br/macnator/a-revolucao-da-inteligencia-artificial-so-que-nao-parte-2-artigo
3- https://www.tabnews.com.br/macnator/a-revolucao-da-inteligencia-artificial-so-que-nao-parte-3
4 - https://www.tabnews.com.br/macnator/testei-o-gpt-pro-a-versao-mais-cara-do-gpt-inteligencia-a-nivel-de-pesquisa-so-que-nao