Meus 2 cents,
Parabens pelo post !
Hoje em dia a orquestracao ainda foca somente em LLMs - e me parece que ai esta um erro: LLMs sao otimos para fluencia linguistica, mas sao pessimos para atividades deterministicas.
Quem ja trabalhou com LLMs Open weight sabe que tool calling eh apenas um ponto no fluxo de geracao de tokens (como <tool_call> ou Pal) - entao, na pratica nao existe limite aqui para o que pode ser implementado.
A propria capacidade de calculo de muitos LLMs modernos de ponta eh implementada assim: o modelo nao "pensa" no resultado de 234.512 \times 891; ele simplesmente detecta a necessidade matematica, gera a sintaxe para chamar um interpretador Python invisivel por baixo dos panos, o codigo roda em um ambiente isolado e o resultado eh injetado de volta no fluxo de tokens.
Ora, por que nos limitar a Python ou a respostas puras do LLM ?
Um orquestracao onde o LLM atua como a camada de traducao de interface entre o humano e a maquina.
Para executar um atividade o LLM orquestrador poderia interagir com:
-
Máquinas de Estados Finitos Determinísticas (FSMs), onde o fluxo de negocio eh garantido por codigo rigido, e o LLM apenas preenche as lacunas de decisao.
-
Outros tipos de IA (indo alem dos multimodais atuais)
Enfim, o ceu eh o limite.
O problema: modelos flagship/frontier (gemini, claude, chatGPT) nao permitem muita interacao aqui (exceto pelo MCP e skills) - e criar uma infra para modelos open eh cara (ainda). Agentes/frameworks atuais resolvem apenas parcialmente o problema.
Obrigado por compartilhar !
Saude e Sucesso !
Este post foi favoritado via extensão TABNEWS FAVORITOS
Tem curiosidade sobre IA ? Da uma olhada no meu LIVRO: IA PARA ENGENHEIROS