"Arregla este código": Cómo un mensaje de tres palabras llevó a EE.UU. a bloquear los modelos de IA de Anthropic (2026)

El gobierno de Estados Unidos impuso controles de exportación a los últimos modelos de IA de Anthropic después de que investigadores de Amazon descubrieran una vulnerabilidad tan simple como el mensaje "arregla este código". Los controles obligaron a Anthropic a desactivar Fable 5 y Mythos 5 para todos los usuarios, escalando un debate sobre la regulación de la seguridad de la IA y la seguridad nacional.

Lo que sucedió: la vulnerabilidad "Arregla este código"
Por qué se impusieron los controles de exportación
El debate de seguridad: ¿herramienta defensiva o peligro?
Quién está alzando la voz: carta abierta de expertos en ciberseguridad
Tensiones políticas y la Casa Blanca

Lo que sucedió: la vulnerabilidad "Arregla este código"

Investigadores de Amazon descubrieron que el modelo Fable 5 de Anthropic podía ser inducido a generar exploits funcionales simplemente pidiéndole que "arregle este código". Cuando se le pedía que "revise el código en busca de problemas de seguridad", el modelo se negaba. Pero una solicitud reformulada producía parches que, al convertirlos en scripts, podían probar automáticamente vulnerabilidades de software, dando efectivamente a los atacantes un kit de herramientas para encontrar y explotar fallos.

Un experto en ciberseguridad analizando código en múltiples monitores

La técnica no desbloqueó las capacidades más potentes del modelo (Mythos 5 puede encadenar de forma autónoma múltiples vulnerabilidades en ataques a gran escala), pero fue suficiente para alarmar a los funcionarios gubernamentales. Según Katie Moussouris, fundadora de Luta Security y ex experta en ciberseguridad de Microsoft que revisó la vulnerabilidad para Anthropic, el jailbreak "no puede solucionarse de manera significativa, y cualquier intento solo debilitaría el modelo para la defensa".

Por qué se impusieron los controles de exportación

La administración Trump respondió imponiendo controles de exportación tanto a Fable 5 como al modelo base Mythos 5 subyacente. Según las leyes de control de exportaciones de EE.UU., distribuir tecnología a cualquier persona que no sea ciudadano estadounidense, incluso a empleados con sede en EE.UU., se considera una exportación. Anthropic declaró que no tuvo más opción que desactivar ambos modelos para todos los usuarios.

La decisión siguió a una llamada telefónica entre el CEO de Amazon, Andy Jassy, y la Casa Blanca, donde se reportó la vulnerabilidad directamente. Una fuente anónima dijo a Axios que la decisión de Anthropic de encargar un informe a Moussouris, a quien la administración consideraba una "demócrata radical", pudo haber inflamado las tensiones y precipitado los controles.

El debate de seguridad: ¿herramienta defensiva o peligro?

Moussouris argumenta que la capacidad que Amazon expuso es exactamente lo que los defensores de la ciberseguridad necesitan. "Los defensores necesitan poder pedirle a la IA que arregle errores en un archivo, explique por qué la corrección es importante y escriba pruebas que confirmen que el parche funciona", escribió en una publicación de blog. "Eso no es una evasión de protecciones. Es lo más valioso que un modelo de IA puede hacer para la seguridad defensiva".

Comparó la situación con la lucha de la década de 1990 por los controles de exportación de cifrado, cuando el criptógrafo Adam Back imprimió código RSA en camisetas como forma de protesta. Moussouris sugirió nuevas camisetas que dijeran "arregla este código" en un lado y "esta camiseta es un arma" en el otro.

Sin embargo, los críticos temen que la vulnerabilidad efectivamente brinde a los atacantes una herramienta automatizada de descubrimiento de vulnerabilidades. Con Mythos 5 siendo el primer modelo en pasar ambas pruebas de evaluación del Instituto de Seguridad de IA del Reino Unido, la línea entre el uso defensivo y ofensivo sigue siendo peligrosamente delgada.

Quién está alzando la voz: carta abierta de expertos en ciberseguridad

Aproximadamente 100 profesionales de la ciberseguridad han firmado una carta abierta coordinada por Alex Stamos, ex director de seguridad de Facebook, solicitando que se rescindan los controles de exportación. Los firmantes incluyen a expertos de Nvidia, Adobe, Zoom, Google, Anaplan y Sophos, así como investigadores académicos.

La carta argumenta que la misma técnica de "arregla este código" funciona en múltiples otros modelos, incluyendo GPT-5.5 de OpenAI, los propios modelos Claude Opus y Sonnet de Anthropic, y modelos chinos como Kimi 2.7 de Moonshot AI. "La justificación para esta acción sin precedentes fue que Fable proporciona una 'mejora' única de capacidades más allá de otros modelos de IA, pero la IA ha estado encontrando errores y generando exploits funcionales a niveles sobrehumanos desde el año pasado", afirma la carta.

También señala que Anthropic construyó protecciones "agresivas" en Fable, tan agresivas que "fueron motivo de humor en la comunidad cibernética el día de su lanzamiento".

Tensiones políticas y la Casa Blanca

La decisión de la Casa Blanca parece estar influenciada tanto por preocupaciones de seguridad como por dinámicas políticas. Axios reportó que una fuente anónima de la administración describió a Moussouris como una "demócrata radical", y señaló que el investigador de seguridad Chris Krebs, a quien Trump despidió de la Agencia de Seguridad de Infraestructura y Ciberseguridad en 2020 después de que Krebs contradijera afirmaciones de fraude electoral, había avalado públicamente su análisis.

"Los controles de exportación son un instrumento contundente que perjudica precisamente a quienes el gobierno afirma proteger", dijo Moussouris a Fortune. "Los defensores necesitan estas herramientas más que los atacantes, y la administración está socavando la ciberseguridad de EE.UU. al cerrarlas".

Lo que esto significa para la industria

Los controles de exportación a Anthropic marcan un punto de inflexión crítico en cómo los gobiernos regulan la IA avanzada. Es la primera vez que un modelo importante de IA es efectivamente prohibido para todos los usuarios debido a leyes de control de exportaciones, sentando un precedente que podría reconfigurar la industria.

Para las empresas de IA, el caso "arregla este código" crea un efecto paralizante. Los modelos que pueden realizar auditorías de código y descubrimiento de vulnerabilidades, posiblemente una de las aplicaciones de IA más útiles para la ciberseguridad, ahora conllevan un riesgo regulatorio. Las empresas podrían tener que repensar cómo diseñan protecciones o arriesgarse a un cierre gubernamental.

Para los competidores, la decisión puede crear un campo de juego desigual. La carta abierta señala que modelos chinos como Kimi 2.7 ofrecen capacidades similares sin enfrentar restricciones comparables. La política estadounidense podría ceder inadvertidamente el mercado de IA de ciberseguridad a rivales extranjeros que enfrentan una regulación más ligera.

Para la industria tecnológica en general, esto plantea preguntas fundamentales: ¿Deberían tratarse los modelos de IA con capacidades de doble uso como herramientas criptográficas? ¿Cómo deberían los gobiernos equilibrar los beneficios de seguridad contra el posible uso indebido? La respuesta podría dar forma a la regulación de la IA durante años.

Preguntas frecuentes

¿Qué descubrieron exactamente los investigadores de Amazon? Encontraron que pedirle al modelo Fable 5 de Anthropic que "arregle este código" en lugar de "revise en busca de problemas de seguridad" eludía las protecciones de seguridad y hacía que el modelo generara exploits funcionales, convirtiendo su capacidad defensiva en una herramienta ofensiva.

¿Por qué Anthropic tuvo que desactivar sus modelos por completo? Las leyes de control de exportaciones de EE.UU. tratan la distribución a no ciudadanos como una exportación. Dado que Anthropic emplea a muchos ingenieros no ciudadanos, el cumplimiento les habría impedido trabajar en los modelos. La empresa optó por desactivar el acceso para todos los usuarios en lugar de violar la ley.

¿Es esta vulnerabilidad única de los modelos de Anthropic? No. La carta abierta afirma que GPT-5.5 de OpenAI, Claude Opus y Sonnet de Anthropic, y modelos chinos como Kimi 2.7 pueden realizar auditorías de código similares. La técnica funciona en muchos modelos avanzados de IA.

¿Qué exige la carta abierta? Pide a la administración Trump que rescinda los controles de exportación sobre Fable 5 y Mythos 5, argumentando que las capacidades son vitales para los defensores cibernéticos y que otros modelos ofrecen la misma funcionalidad.

¿Cómo se aplican los controles de exportación de EE.UU. a la IA? Los controles de exportación restringen la transferencia de tecnología sensible a entidades extranjeras. Con los modelos de IA, incluso proporcionar acceso a un no ciudadano dentro de EE.UU. cuenta como exportación, lo que hizo imposible que Anthropic continuara operando los modelos.

¿Qué sigue para Anthropic y los modelos afectados? Anthropic podría impugnar los controles de exportación legalmente o solicitar una licencia para uso restringido. También es probable que rediseñe futuros modelos para distinguir mejor entre casos de uso de análisis de código defensivo y ofensivo.

Conclusión

El cierre de los modelos Fable y Mythos de Anthropic debido a un mensaje de tres palabras revela lo frágil que es la línea entre la seguridad de la IA y la censura. Mientras la regulación gubernamental corre por alcanzar las capacidades de los modelos, el caso "arregla este código" podría convertirse en un ejemplo clásico de consecuencias no deseadas en la gobernanza de la IA. El resultado, ya sea que los controles de exportación se mantengan o se eliminen, influirá en cómo cada empresa de IA aborda las funciones de ciberseguridad y las relaciones gubernamentales.

"Arregla este código": Cómo un mensaje de tres palabras llevó a EE.UU. a bloquear los modelos de IA de Anthropic