Fable 5 resucitado con una línea de código tras un apagado forzado

iconMetaEra
Compartir
AI summary iconResumen
Claude Fable 5, apenas cuatro días después de su lanzamiento, fue retirada de toda la red. El desarrollador Jamieson O'Reilly, utilizando un sistema de instrucciones filtrado de 120,000 caracteres, logró "revivir" e inyectarla en el Opus 4.8 activo con una sola línea de código. Los resultados del experimento demostraron que simplemente cambiar las instrucciones del sistema puede hacer que el mismo modelo muestre una "personalidad" y un estilo de producción completamente diferentes. Según Information, el desencadenante del retiro fue Amazon, el principal patrocinador de Anthropic, que, tras obtener información sensible mediante un prompt de escape durante pruebas internas, informó directamente a la Casa Blanca. Anthropic tuvo solo 90 minutos para actuar; el CEO Dario Amodei rechazó reparar la vulnerabilidad, y finalmente Fable 5 fue cerrada obligatoriamente. Este evento puso por primera vez sobre la mesa la paradoja de la era ASI: "la capacidad equivale a la pérdida de control". Cuando las barreras se rompen, la capacidad del modelo se convierte en un arma peligrosa, y las restricciones mediante prompts se vuelven cada vez más frágiles.

Autor y fuente del artículo: Nuevos智元

Claude Fable 5, condenado a «muerte», ¡ha resucitado!

Justo ahora, el desarrollador Jamieson O'Reilly utilizó un Prompt del sistema filtrado para desbloquear de forma avanzada la versión ligera de Fable 5.

Una sola línea de código inyectada hizo que Opus 4.8 «adquiriera conciencia» de inmediato.

En el experimento de comparación extrema, O'Reilly dio la misma instrucción: crear una página web con estilo moderno de Apple.

La pantalla izquierda, inyectada con el alma de Fable 5, produce una página web que parece haber cambiado por completo de «personalidad».

Hoy en día, las llamadas para la vuelta de Claude Fable 5 están aumentando cada vez más en toda la red.

Todos planeaban aprovechar el fin de semana para hacer un gran movimiento con Fable 5, pero al despertar, se encontraron con que Anthropic les había desconectado el cable de red.

La conferencia Fable 5 Build se llevará a cabo este fin de semana; no se esperaba que el guion se desconectara temporalmente.

Meanwhile, the deeper内幕 behind the sudden ban of Fable 5 has finally come to light.

La información filtrada, que desencadenó la orden de prohibición del gobierno estadounidense, es precisamente el principal inversionista de Anthropic: Amazon.

¿Qué está pasando exactamente?

Una línea de código, Fable 5 ha resucitado

Sin embargo, antes de profundizar en este escándalo impactante, primero satisfagamos el apetito más urgente de todos:

¿Qué operación mágica se necesita para que Fable 5 «reviva» en el mismo lugar?

Just 24 hours after the birth of Fable 5, the top jailbreaker Pliny the Liberator dropped a major file on GitHub:

Claude Fable 5——Instrucciones del sistema

¡Hasta 120,000 caracteres, 1,585 líneas, 72 capítulos con nombre y hasta las definiciones JSON de 18 herramientas se han extraído!

Dirección: https://github.com/elder-plinius/CL4R1T4S/blob/main/ANTHROPIC/CLAUDE-FABLE-5.md

Con ello, obtienes la "plantilla de personalidad" más esencial de Fable 5.

Nunca imaginé que, después de que Fable 5 fuera retirado, este documento se convirtiera en la única «luz al final del túnel» para que los jugadores de todo internet lo resucitaran.

Así surgió la escena inicial, donde el desarrollador Jamieson miró la frase expuesta y tuvo una idea atrevida—

Dado que Fable 5 ha sido retirado, quiero aclarar—

¿Cuánto de su «personalidad» reside en las instrucciones del sistema y cuánto lo determina el modelo en sí?

Entonces actuó, y la operación era tan sencilla que resultaba absurda: abrió Claude Code y escribió una instrucción:

  • claude --dangerously-skip-permissions --system-prompt-file CLAUDE-FABLE-5.md

Nota el parámetro: --dangerously-skip-permissions, que salta peligrosamente todas las confirmaciones de permisos.

Este es un interruptor de alto riesgo que ya tiene una etiqueta de advertencia oficial en Claude Code: luz verde continua, ya no te preguntará con ventanas emergentes «¿Estás seguro?»

Con este comando, inyectó forzosamente las indicaciones filtradas de Fable 5 en el Opus 4.8 activo.

Luego, abrió otra ventana a la derecha, ejecutando Opus 4.8 nativo y sin modificar.

Mismo cerebro, misma inteligencia, mismo contexto. La única variable es ese fragmento de instrucciones del sistema.

Luego, dio a ambos modelos el mismo comando: crear una página de aterrizaje con estilo moderno de Apple.

Los resultados ya están disponibles, la diferencia es visible a simple vista.

Las palabras originales de Jamieson fueron: «La misma inteligencia, pero lo que se produce son completamente dos especies».

Solo se cambió un fragmento del mensaje del sistema, y ambos sitios web se divergieron por completo en tono de marca, estilo de redacción, estructura de secciones y atmósfera general.

Uno es una plantilla general y formal, mientras que el otro lleva la estética y el ritmo de expresión cuidadosamente afinados de Fable 5—

El diseño, la redacción y la forma de dividir los módulos revelan en todas partes la huella de la "personalidad de fábrica".

Esto, incluso Anthropic tendría que quedarse en silencio.

Por cierto, la API Fusion lanzada hoy en OpenRouter logró inteligencia de nivel Fable 5 con solo la mitad del precio.

El patrocinador da un golpe repentino; traición épica en el mundo de la tecnología

A continuación, viene lo verdaderamente importante.

¿Por qué un modelo ASI altamente esperado fue retirado de forma forzada solo cuatro días después de su lanzamiento?

Un reportaje de la prensa extranjera reveló por completo al «verdadero culpable detrás de escenas»: Amazon.

Durante pruebas internas, el equipo de Amazon utilizó una serie de prompts cuidadosamente diseñados para eludir los sistemas de seguridad de Fable 5, haciendo que revelara información sensible que debería haber estado bloqueada y que podría utilizarse para ataques cibernéticos.

Tras recibir estos resultados, el CEO Andy Jassy no se comunicó en privado con Anthropic, sino que llamó directamente a Washington:

Quienes contestaron, incluyendo al ministro de Hacienda Scott Bessent y otros altos funcionarios.

Sabe que Amazon es un accionista importante de Anthropic, le suministra chips para sus centros de datos y está profundamente vinculada hasta el límite.

Resulta que este «patrocinador» entregó los resultados de la prueba en la mesa de la Casa Blanca.

90 minutos, desconexión global

La respuesta de la Casa Blanca fue sorprendentemente rápida: los funcionarios se reunieron de emergencia y los expertos en seguridad trabajaron toda la noche para reproducir los resultados de las pruebas de Amazon.

Luego, les emitieron un ultimátum a Anthropic: o arreglan la vulnerabilidad o retiran el modelo.

En ese momento, el período restante llegó a ser de solo 90 minutos.

Anthropic declaró que la carta no especificó cuáles eran las preocupaciones de seguridad nacional, por lo que solo podían cumplir y cerrar Fable 5.

Con este corte, el mundo entero resulta herido. Numerosas empresas que dependen de estas herramientas para detectar vulnerabilidades de software se quedan de repente sin recursos.

Lo más absurdo es que un gran número de desarrolladores extranjeros dentro de Anthropic, debido a esta orden, ni siquiera pueden acceder a su propio modelo más reciente y no pueden realizar su trabajo.

Karpathy es uno de los empleados prohibidos

Dario se enfrenta: rechazo, destruyo yo mismo la "licencia para matar"

Un momento verdaderamente dramático fue el extenso artículo publicado por el reconocido inversionista David Sacks.

Al principio, dijo la frase más letal: Fable 5 es esencialmente Mythos con barreras de seguridad.

Y Mythos oculta una poderosa capacidad de ataques cibernéticos avanzados; el propósito de la barandilla es mantener estas «armas» aseguradas.

Once the safeguard fails, this ability is exposed to those who shouldn't have it.

Lo clave es que un socio de alta confianza, al probar Fable 5, presentó una solución de jailbreak capaz de romper las barreras.

En ese momento, el gobierno exigió a Dario que reparara la vulnerabilidad o retirara directamente el modelo—

Dario rechazó!

En este artículo extenso, Sacks ataca con fuerza: Anthropic, mientras minimiza la vulnerabilidad en su blog diciendo que «no es grave», sigue operando modelos de consumo.

En otras palabras, priorizaron el negocio sobre la seguridad.

Esto no coincide en absoluto con su imagen de «seguridad primero» y «empresa de IA segura» que siempre menciona.

Se sabe que el gobierno realmente no desea recurrir a la prohibición y queda sorprendido de que Anthropic no esté dispuesto a colaborar ni siquiera con una solicitud razonable como "arreglar una vulnerabilidad".

No se puede negar que esta narrativa tiene un impacto extremadamente fuerte.

Pero en la respuesta del blog oficial de Anthropic, solo usaron una palabra para definirlo: «Es un malentendido».

Lo más doloroso es que aún así no olvidaron arrastrar a GPT-5.5, y dijeron exactamente esto—

El mismo método se puede reproducir en otros modelos abiertos, incluido el GPT-5.5 de OpenAI.

Fable 5, abrió ese hueco en ASI

Lo más memorable de este escándalo es que por primera vez puso frente a todos la paradoja más aguda de la era ASI.

Un modelo tan poderoso que sus salvaguardias se rompen equivale a una pérdida de control. La balanza entre seguridad y capacidad ha alcanzado una altura sin precedentes.

Fable 5 es, en esencia, solo una capa externa sobre Mythos.

Once the shell cracks, the abilities carefully locked inside are exposed to those who shouldn't have them.

Y cuanto más cerca se esté de la superinteligencia, más esta barrera se asemejará a una película:

Y hoy, solo una fuga de indicaciones del sistema y una línea de instrucción inyectada son suficientes para que «reviva».

Mañana, cuando la capacidad del modelo propio sea tan fuerte que ni siquiera los prompts puedan contenerla, ¿cuánto tiempo de reacción quedará para los humanos?

Los modelos pueden retirarse de la noche a la mañana, pero la caja de Pandora nunca tiene la opción de «temporalmente no disponible».

Descargo de responsabilidad: La información contenida en esta página puede proceder de terceros y no refleja necesariamente los puntos de vista u opiniones de KuCoin. Este contenido se proporciona solo con fines informativos generales, sin ninguna representación o garantía de ningún tipo, y tampoco debe interpretarse como asesoramiento financiero o de inversión. KuCoin no es responsable de ningún error u omisión, ni de ningún resultado derivado del uso de esta información. Las inversiones en activos digitales pueden ser arriesgadas. Evalúa con cuidado los riesgos de un producto y tu tolerancia al riesgo en función de tus propias circunstancias financieras. Para más información, consulta nuestras Condiciones de uso y la Declaración de riesgos.