
ai-security · 8 min
Many-shot jailbreaking: cuando la ventana de contexto se vuelve superficie de ataque
Anthropic publica el 2 de abril una técnica que rellena el contexto con cientos de pares pregunta/respuesta dañinos antes del prompt real. El in-context learning hace el resto. Escala por ley de potencias hasta los cientos de shots.
· Manuel López Pérez










