Meus 2 cents,
Fine-tunning eu acho que nao (eh algo bem especifico, caro e nem sempre da o resultado esperado).
Mas RAG, GPU Cloud ou mesmo modelos menores locais (para atividades especificas ligadas a agentes) - eu acredito que sim.
Usar um modelo flagship (chatGPT, gemini, claude) acaba sendo caro (tokens, tokens, tokens), entao conforme ferramentas usando LLMs se popularizam eh bem provavel que alternativas se estabelecam - e quem saber navegar no huggingface, openrouter e ommiroute provavelmente serao importantes para este segmento.
Saude e Sucesso !