Seria uma consultoria que configura um ecossistema de LLM self-hosted um bom... · Pilati

Em resposta a Seria uma consultoria que configura um ecossistema de LLM self-hosted um bom modelo de negócio?

Seria uma consultoria que configura um ecossistema de LLM self-hosted um bom modelo de negócio?

Somente se surgirem bons modelos open source

O quer sinceramente eu acho muito difícil.

Existe uma barreira muito grande hoje entre modelos open e privados, e lembro que ouvi recentemente uma publicaćão no Medium:

"Se você não paga o melhor plano você está 2 anos atrasado"

Depois disso fui fazer meu próprio teste: Paguei GPT plus e realmente a diferenća foi gritante, Pago copilot pro (agora pro +) desde o lançamento e temos que concordar que opus 4.6 e GPT 5.4 estão em outro nível.

A maior pergunta é: Os modelos open source vão chegar perto desses grandes modelos? e o custo para manter uma infra local vai compensar?

Estamos falando em milhões de investimento para uma equipe média.

Para manter LLM rodando em um desempenho aceitável não é só comprar uma 5090 e tá tudo certo, são múltiplas H100.

Só existia uma loja que vendia isso no brasil, é uma placa de 300k e está esgotada nesse momento

Montar um servidor com 8 a 12 dessas?

Só vejo um cenário onde isso compensaria: Toda a bolha da IA estourasse, investimento em IA travado, assinatura de GPT sobe de 100/mes para alguns milhares, é um cenário quase apocalíptico

E lembre, servidores tem uma vida útil de 5 a 8 anos.

só vou ficar confortável quando o cenário open source de LLMs tiver uma ferramenta suficiente pra que qualquer empresa possa utilizar seu próprio setup de LLMs, sem PRECISAR depender de terceiros.

Então eu sinceramente acredito que esse cenário seja inviável, pelo menos em curto a médio prazo.

Notícia boa no fim do túnel

Em vez de tentar ajudar as empresas a trazerem a IA na sua infraestrutura já pensou em se especializar em ajudar essas empresas a utilizarem a IA? 90% das empresas ainda não sabe que bixo é esse, acham que é só um google caro.

clacerda

3 meses atrás

qwen 3.5 e gemma 4 mandaram um abraço!

Não é o estado da arte, mas dizer que esses modelos não são bons é loucura. Eu posso afirmar categoricamente que a variente 26/27b de ambos rodando em uma 4090 programam melhor que eu. E fazem isso a mais de 100 tokens por segundo!!!

E o kimi, glm e deepseek grandões estão hoje MUITO próximos dos modelos comerciais...E o gap só diminui a cada release. Boatos que o deepseek 4 que deve chegar até o fim do més é superior ao gpt 5.4 e opus 4.6...A ver..

Pilati

Autor

3 meses atrás

Não tive essa mesma experiência, mas não testei tão a fundo.

Sou hard user de programação, levo os modelos aos limites de cada uma. Testarei melhor para dar um feedback mais preciso

MayconDev

3 meses atrás

Concordo tenho usado os modelos abertos glm em meus agentes em conjunto com Hermes e se souber configurar e deixar tudo fluido o poder de entrega de qualquer llm opensource e multiplicado consideravelmente, tenho tido otimos resultados para gerenciar toda uma startup com os agentes no controle ..

TheDataScientist

3 meses atrás

A maioria das aplicações das empresas não precisam de modelos ultra complexos. Vou ser ainda mais ousado: a maioria das aplicações nas empresas não precisam de IA at all. Um ERP bem feito adaptado, talvez com a IA preenchendo/fazendo interface resolveria 99% de todos os problemas das empresas atualmente e tornaria 99% dos 1% restantes triviais de resolver com código (gerado por IA) ou não.

VictorMachado

3 meses atrás

Pra que um modelo pago que faz tudo?! Modelos menores especializados resolvem tão bem a necessidades trivial do dia-a-dia de 90% das tarefas de uma empresa. O problema é hardware para isso, mas se ja tiver, otimo.