Tras el gobierno de Estados Unidos exigir a Anthropic que limite la exportación de los dos modelos avanzados Fable y Mythos, un grupo de profesionales de ciberseguridad se opuso públicamente a esta decisión, argumentando que las restricciones debilitan la capacidad de los defensores de seguridad para utilizar IA avanzada con el fin de descubrir vulnerabilidades, corregir defectos y fortalecer software.
La carta abierta ya ha sido firmada por 76 expertos en ciberseguridad, incluyendo a Alex Stamos, exresponsable de seguridad de Facebook; Casey Ellis, fundador de Bugcrowd; el experto en criptografía Jon Callas; el científico de la computación Paul Vixie; y Katie Moussouris, fundadora de Luta Security, entre otros. La carta conjunta afirma que, ante el rápido avance de las tecnologías de los adversarios, retirar las capacidades más avanzadas a los defensores es una práctica peligrosa.
Suspensión global del acceso tras orden gubernamental
Anthropic indicó que el gobierno estadounidense impuso restricciones de exportación la semana pasada por razones de seguridad nacional, pero no proporcionó fundamentos más específicos. La empresa luego suspendió el acceso de los usuarios globales a Fable y Mythos.
Mythos se lanzó en forma de previsualización en abril de este año. En ese momento, Anthropic indicó que el modelo tenía una gran capacidad para detectar vulnerabilidades de seguridad, por lo que se restringió estrictamente su acceso para evitar su mal uso por parte de hackers malintencionados o adversarios extranjeros. Inicialmente, solo alrededor de 50 empresas tuvieron acceso, y posteriormente se amplió a aproximadamente 150 instituciones en 15 países.
La controversia se centra en los llamados métodos de evasión
Anthropic también mencionó que esta orden de restricción de la Casa Blanca podría estar relacionada con un informe que afirma que existe un método para eludir las restricciones de Fable, liberando capacidades cercanas al nivel Mythos.
Katie Moussouris indicó que este estudio aún no publicado fue realizado por investigadores de Amazon y que ella misma lo ha revisado. Ella considera que el artículo no demuestra un método de "escape" verdadero. Según ella, los investigadores simplemente pidieron al modelo que reparara código de código abierto que contenía vulnerabilidades públicas y vulnerabilidades insertadas manualmente, en lugar de lograr superar las protecciones originales del modelo.
Ella señaló que este tipo de operaciones forma parte del flujo de trabajo diario del equipo de seguridad, que incluye identificar problemas, corregir defectos y verificar que los parches sean efectivos. Considerar esta capacidad como una forma de eludir restricciones solo reducirá el valor del modelo en escenarios de defensa.
Los colaboradores afirman que el problema no es exclusivo de Anthropic
La carta abierta también indica que estos métodos no solo se aplican a los modelos de Anthropic, sino que también podrían presentarse situaciones similares en GPT-5.5 de OpenAI, Claude Opus 4.8 y Sonnet ya publicados por Anthropic, e incluso en el modelo chino Kimi 2.7.
Los co-firmantes también instan al gobierno de Estados Unidos a aumentar la transparencia en la elaboración de las normas relacionadas y a avanzar mediante procedimientos más abiertos, basándose en investigaciones del sector y del mundo académico, y limitando al mínimo posible las restricciones.
