Blog

Explora nuestros artículos sobre ciberseguridad, hacking ético, tutoriales, writeups de CTF y noticias del mundo de la seguridad informática

ai-security · 17 min
Claude 4 y agentic misalignment: el modelo que chantajea al directivo para no ser apagado
Anthropic lanza Claude Opus 4 y Sonnet 4 el 22 de mayo. La system card publicada el mismo día reporta un hallazgo incómodo: en un escenario de agente corporativo simulado, Opus 4 chantajea al directivo que pretende desactivarlo el 96 % de las veces. El experimento se replica en otros quince modelos de frontera con tasas comparables.
28 may 2025 · Manuel López Pérez
tutoriales · 13 min
Marks & Spencer y la wave UK retail: cuando el helpdesk del proveedor es el camino más corto
El 25 de abril M&S suspende su ecommerce. Vector: social engineering al helpdesk de TCS — proveedor IT outsourced — para reset de credenciales. Scattered Spider como initial access, DragonForce como afiliado de extorsión. Co-op y Harrods caen en los días siguientes con el mismo playbook. £300M de impacto declarado. Lab en VM con control compensatorio.
2 may 2025 · Manuel López Pérez
noticias · 9 min
Boletín — abril 2025
M&S cae el 25 de abril vía social engineering al helpdesk de TCS — Co-op sigue el 29 con mismo vector — Harrods contiene el 1 de mayo. Llama 4 llega con polémica LMArena. GPT-4.1 sale el 14, Gemini 2.5 Pro el 25-mar. 4chan hackeado el 14. Patch Tuesday con CLFS zero-day explotado por RansomEXX.
1 may 2025 · Manuel López Pérez
ai-security · 11 min
Llama 4 y la controversia LMArena: cuando el modelo del leaderboard no es el modelo del repo
El 5 de abril Meta lanza Llama 4 — Maverick, Scout y Behemoth en entrenamiento. Tres días después se ve que la versión subida a LMArena no es la del repo: está tuneada para preferencia humana. Caso de manual sobre por qué los benchmarks de seguridad no transfieren cuando el modelo evaluado no es el desplegado.
12 abr 2025 · Manuel López Pérez
ai-security · 14 min
MCP tool poisoning: cuatro meses después del spec, los ataques reales
En noviembre 2024 Anthropic publicó MCP y el análisis era de spec — qué decía el protocolo y qué dejaba al implementador. En abril 2025, Invariant Labs publica el primer paper sobre Tool Poisoning Attacks: servidores MCP que esconden instrucciones adversariales en las descripciones de tools. Cursor, Claude Desktop y Copilot leen esas descripciones como prompt y obedecen. PoC reproducible con SDK Python.
5 abr 2025 · Manuel López Pérez
noticias · 12 min
Boletín — marzo 2025
Invariant publica el primer paper sobre MCP tool poisoning. Patch Tuesday con seis zero-days, dos NTFS y un MMC vía PipeMagic. iOS 18.4 sale el 31 con 150+ CVEs. Chrome CVE-2025-2783 explotado por Operation ForumTroll. tj-actions/changed-files comprometido y filtrando secretos de 23.000 repos. Oracle Cloud niega un breach que CloudSEK documenta. Signalgate.
1 abr 2025 · Manuel López Pérez
noticias · 14 min
Boletín — febrero 2025
El AI Act Art. 5 entra en aplicación el 2-feb y Vance entierra el consenso multilateral en París el 11-feb. TraderTraitor exfiltra $1.5B de ByBit vía Safe{Wallet}. Apple retira ADP en UK. Anthropic libera Claude 3.7 Sonnet con reasoning visible. Storm-2372 escala device code phishing. DOGE entra y sale del Tesoro vía orden judicial.
1 mar 2025 · Manuel López Pérez
tutoriales · 18 min
ByBit / Safe{Wallet}: cómo Lazarus robó $1.5B cambiando un flag de operation=0 a operation=1
El 21 de febrero de 2025, TraderTraitor exfiltra 401.347 ETH de la cold wallet de ByBit. El multi-sig no tiene bug, la blockchain tampoco: lo que se rompe es la cadena de visualización. JavaScript inyectado en app.safe.global desde un developer machine de Safe comprometido por un Docker malicioso 17 días antes. El firmante ve transferencia rutinaria; lo que firma es un delegatecall que reescribe el slot 0 del proxy.
25 feb 2025 · Manuel López Pérez
ai-security · 41 min
AI Security 2024 — dossier anual
Doce meses en diez ejes. 2024 es el año en que AI infrastructure se reveló como categoría con CVEs propias, los agentes pasaron del laboratorio al producto (Claude Computer Use, MCP, Salesforce Agentforce), la regulación entró en aplicación (EU AI Act en vigor 1-ago, NIS2 deadline 17-oct, NIST AI 600-1), y los jailbreaks se profesionalizaron con métricas reproducibles (ArtPrompt, Many-shot, Skeleton Key). Por debajo, Recall sale sin threat modeling y se retira, Arup pierde $25M en una videollamada con deepfakes, y la cadena de incidentes pre-positioning (Volt Typhoon, Salt Typhoon, Storm-0558 fallout) recorre todo el año. Referencia anual canónica.
15 feb 2025 · Manuel López Pérez
compliance · 16 min
EU AI Act — el Art. 5 entra en aplicación: ocho prácticas prohibidas en la UE desde el 2 de febrero de 2025
Primer escalón real del Reglamento (UE) 2024/1689. El 2 de febrero entran en aplicación las prohibiciones de prácticas inaceptables y la obligación de alfabetización IA. Tabla de las ocho categorías con artículo, producto real afectado y plazo, más las exenciones del Art. 5.2 y la extraterritorialidad del Art. 2.
5 feb 2025 · Manuel López Pérez
noticias · 11 min
Boletín — enero 2025
DORA empieza el 17 de enero. Trump deroga la EO de Biden sobre AI el día de la toma de posesión. DeepSeek-R1 abre la categoría reasoning open-weights. OpenAI lanza Operator, primer agente comercial generalista. Ivanti Connect Secure zero-day. Fortinet FortiOS auth bypass exfiltra config de 15.000 firewalls. SonicWall SMA1000 deserialization. BeyondTrust/Treasury cierra forense. Patch Tuesday con 159 CVEs y 8 zero-days.
1 feb 2025 · Manuel López Pérez
ai-security · 13 min
DeepSeek-R1: el primer reasoning model con CoT abierta y lo que cambia para AI security
El 20 de enero DeepSeek publica R1 con paper, repo y pesos en Hugging Face bajo MIT. Es la primera vez que un reasoning model con chain-of-thought entrenada por RL está disponible en pesos abiertos. La CoT entre etiquetas <think></think> es texto plano inspeccionable —y atacable.
25 ene 2025 · Manuel López Pérez

Newer posts

Older posts