
ai-security · 7 min
Confused deputy: cuando un LLM con tools obedece a la página web equivocada
El usuario pide al agente que resuma una URL. La página tiene instrucciones embebidas que disparan otro tool — send_email — con datos de la conversación. El modelo obedece sin preguntar. PoC reproducible con OpenAI function calling.
· Manuel López Pérez




