El CEO de BitGo, Mike Belshe, rechazó una afirmación viral según la cual el modelo Mythos de Anthropic comprometió casi todos los sistemas clasificados de la Agencia de Seguridad Nacional, calificando la historia como falsa mientras se extendía por X este fin de semana.
Su oposición se dirige a publicaciones que reinterpretan el cierre del gobierno de un modelo de tres días como un hack del mundo real. El registro completo es menos dramático.
De dónde proviene el mito del supuesto ataque a la NSA
La afirmación provino del senador Mark Warner, vicepresidente del Comité de Inteligencia del Senado. The Economist informó sobre su cuenta de lo que el director de la NSA le dijo.
Warner dijo que el general Joshua Rudd, quien lidera la NSA y el Comando Cibernético de EE. UU., describió la herramienta en términos contundentes.
“Esta herramienta se infiltró en casi todos nuestros sistemas clasificados, no en semanas, sino en horas”, escribió The Economist wrote, citando a Warner.
Warner planteó el ejemplo mientras elogiaba a Anthropic, no lo condenaba. Lo utilizó para argumentar a favor de pruebas previas al lanzamiento más rápidas de los modelos frontera.
El detalle que se perdió en línea es sencillo. Se trató de una prueba autorizada de equipo rojo en las propias redes de la agencia, no de una intrusión externa.
Shashank Joshi, el editor de Economist que publicó la oferta, posteriormente advirtió que no debía interpretarse literalmente. Dijo que dependía de que Mythos trabajara junto a otras herramientas en condiciones específicas.
El gobierno de EE. UU. ya era socio de Mythos. Anthropic había implementado el modelo en defensores cibernéticos gubernamentales a través del Proyecto Glasswing desde abril.
Belshe y otros cuestionan el enfoque
Belshe, cofundador y director ejecutivo de BitGo, custodio de activos digitales, respondió directamente a uno de los hilos.
Síguenos en X para obtener las últimas noticias en tiempo real
Él no estaba solo. Zack Korman burló cómo la afirmación pasó del senador al periodista y a las redes sociales sin control.
El analista Kyle Chase señaló que el ingreso fue una prueba. Dijo que un jailbreak detectado por Amazon fue el verdadero desencadenante.
La propia declaración de Anthropic los respalda. Indicó que el jailbreak marcado simplemente pedía al modelo que leyera una base de código y corrigiera fallas.
La técnica reveló algunos errores menores, ya conocidos, que modelos rivales como el GPT-5.5 de OpenAI también pueden encontrar.
La empresa desactivó ambos modelos el 12 de junio para cumplir con una directiva de control de exportaciones de EE. UU., no debido a ninguna brecha en el campo de batalla. Se opuso a retirar un modelo utilizado por cientos de millones de personas por una sola falla limitada.
Aún se discute si la prueba justificó retirar los modelos. El investigador de IA Pedro Domingos argumentó que las restricciones de exportación fueron las responsables, dadas las potentes capacidades de hacking del modelo.
Anthropic mismo llama a Mythos el modelo cibernético más fuerte del mundo. Sin embargo, dice que recordar una herramienta por un solo defecto congelaría nuevos lanzamientos en toda la industria.
La empresa ahora está trabajando para restaurar el acceso, y está elaborando un marco de riesgo compartido con la Casa Blanca.
