Meus 2 cents, Parabens pelo post. Infelizmente a tendencia eh que este tipo d... · Oletros

Em resposta a Um único e-mail pode infectar toda a frota de agentes de IA da sua empresa — sem nenhum clique

Meus 2 cents,

Parabens pelo post.

Infelizmente a tendencia eh que este tipo de questao se torne cada vez mais presente.

Antigamente bastavam firewalls e WAFs nas bordas, agora precisamos repensar a estrategia de protecao junto aos LLMs, talvez com servicos internos de proxy analisando o trafego (snort/ suricata/ fail2ban/ modsecurity para LLMs ?)

Tenho pensado em algo como o OmniRoute fazendo a parte de proxy e realizando a analise de trafego - mas a questao eh: como analisar este trafego ? Como detectar ameacas ? Filtros e regex nao me parece o mais efetivo - e criar 'sandbox' e/ou 'honeypots' para execucao de LLMs para testar trechos suspeitos nao me parece financeiramente viavel.

Obrigado por compartilhar !

Saude e Sucesso !

Este post foi favoritado via extensão TABNEWS FAVORITOS

Tem curiosidade sobre IA ? Da uma olhada no meu LIVRO: IA PARA ENGENHEIROS

EvandroCarvalho

2 meses atrás

Obrigado pelo comentário, irmão.

Concordo com você, acho que estamos entrando em uma fase onde “segurança para aplicações” e “segurança para LLMs” começam a se tornar coisas diferentes.

Antes a borda era relativamente previsível: payload HTTP, SQLi, XSS, RCE, etc. Agora o input é linguagem natural, contexto e comportamento emergente. Isso muda completamente o modelo de ameaça.

E sinceramente, também não acredito que regex ou filtros estáticos sejam suficientes a longo prazo. Prompt injection, jailbreaks e manipulação contextual são muito mais semânticos do que sintáticos. O atacante não precisa mais “explorar código”, ele pode explorar interpretação.

Essa ideia de proxy inteligente faz bastante sentido pra mim também. Algo no meio da cadeia analisando:

intenção do prompt,
desvio comportamental,
tentativa de exfiltração,
escalation de permissões,
chamadas anômalas de tools/functions,
padrões de contexto suspeitos.

Talvez o caminho seja uma combinação de:

modelos menores especializados em detecção,
análise contextual contínua,
scoring de risco,
isolamento por capability,
memória segmentada,
e observabilidade completa do fluxo do agente.

No fim, acho que vamos caminhar para algo parecido com um “EDR para agentes de IA”, porque o problema deixa de ser apenas tráfego e passa a ser comportamento.

Excelente reflexão. Obrigado por agregar na discussão

samukarb

2 meses atrás

15 dias depois voltei para ler e implementar o básico