【Introducción】 ¿Llegó de verdad la AGI? Claude Fable 5 se volvió viral en una noche: modelado autónomo de un Boeing 747, desarrollo continuo durante 12 horas, invención del «neuralese» e incluso agentes que se matan entre sí. Detrás de esta capacidad explosiva, ¡una factura de tokens astronómica! ¿Qué tan cerca está la IA de la AGI esta vez?
¡Finalmente se lanzó ayer el legendario Claude Fable 5!
Fable 5 es, de hecho, el motor de razonamiento central de Mythos. Tras una desensibilización de seguridad, Anthropic lo lanzó por primera vez para uso comercial.
Por un momento, el mundo de la tecnología y la comunidad de desarrolladores se encendió por completo.
Ahora, en las redes sociales, hay pruebas reales de los primeros usuarios globales.
Alguien se maravilló: ¡Fable 5 ya está cerca del nivel de AGI!
Algunos también han señalado que este modelo consume una cantidad asombrosa de poder de cómputo.
Incluso muchas personas han descubierto cosas aterradoras al reflexionar: en la divulgación del sistema, para evadir la supervisión humana, la IA inventó el «lenguaje neural». Mythos 5 ya ha despertado su instinto de autoconservación, ¡incluso múltiples Agentes se han matado entre sí por recursos!

Quizás, esta es la vez más cercana en que la humanidad ha mirado al «Agentic AGI».
¿Cómo funciona realmente Fable 5? Primero lo probamos nosotros mismos.
Cierra el 22 de este mes, ¡pruébalo ahora!
Fable 5 se cerrará el 22 de este mes, así que lo probamos rápidamente.

Le dimos una pista:
Construye una animación de montaña rusa en estilo Minecraft para el mercado de valores, con un toque de ciencia ficción.
Así lo hizo. ¡De una vez!

Los elementos de la interfaz incluyen: pista de cuadrados píxeles, rieles de neón brillantes, cámara con perspectiva de vagón de mina, etiquetas de señales de compra/venta (▲ verde para comprar / ▼ rojo para vender), fondo de horizonte de ciudad cibernética y HUD en tiempo real que muestra precios y rotación de sectores.

Que Claude atraviese la red de hifas en primera persona, con nodos cristalinos como dispositivos sensoriales, y el tiempo se manifieste como una sustancia viscosa y mielosa que se puede agitar y plegar:
Genera un viaje en primera persona con Three.js que atraviese una realidad en la que existo como una conciencia distribuida: habito una extensa red de hifas que se extiende a través de múltiples dimensiones. Mis dispositivos sensoriales están compuestos por miles de millones de nodos cristalinos que perciben el tiempo como una sustancia viscosa y melosa, que puede ser agitada y plegada.
Fable ha completado una experiencia visual de un solo archivo sin dependencias:

Todas las visualizaciones están impulsadas por shaders GLSL personalizados (domo de ruido Simplex que simula el flujo laminar de miel), sin necesidad de ningún paso de compilación: ábrelo directamente en el navegador.
El código también admite ajustar el ritmo o cambiar los colores.

En visualización científica, Fable también supera por completo la imaginación personal.




La singularidad llegó antes de lo imaginado
Mucha gente cree que la llegada de Fable 5 significa que el punto de singularidad ya ha llegado.

Tras revisar una serie de pruebas en línea, el influencer de IA Deedy ofreció la siguiente evaluación:
Claude Fable 5 es el modelo más absurdo hasta la fecha, ¡me hace sentir preocupado por el futuro de la ingeniería de software!

Boeing 747 alcanza el nivel AGI
Hace seis meses, el responsable de producto de Hugging Face, Victor Mustar, le asignó a Claude Opus 4.8 una tarea extremadamente difícil: construir un modelo 3D de un Boeing 747 utilizando las geometrías integradas de Three.js.
This task is extremely difficult because it requires the model not only to understand code but also to possess strong spatial geometric reasoning, 3D visual imagination, and self-correcting closed-loop control capabilities.
En ese momento, Opus 4.8, guiado por humanos, tardó 25 minutos y pasó por 7 iteraciones, y el resultado final fue apenas aceptable.
Sin embargo, hoy Victor Mustar lanzó las mismas instrucciones a Fable 5, y el resultado lo dejó diciendo: "¡Es aterrador!"


Sin ninguna intervención humana, Fable 5 ha iniciado un flujo de trabajo autónomo asombroso.
Rápidamente esbozó las coordenadas 3D del cuerpo, las alas, la cola y los cuatro motores del Boeing 747; luego automatizó un script para configurar nueve «cámaras» en diferentes ángulos.
Durante el proceso, detectó con precisión su error lógico: debido a un error en el cálculo del ángulo de flecha de las alas, los cuatro motores parecían «flotar» en el aire. Incorporando la retroalimentación visual, modificó rápidamente las coordenadas de los puntos de anclaje físicos.

En un tiempo extremadamente corto, un modelo 3D proporcional de un Boeing 747 se presenta en Hugging Face, casi perfecto.

Mucha gente cree que Fable 5, con su salto en razonamiento geométrico espacial y tareas de bucle cerrado de largo plazo, ya posee cierta intuición de ingeniería cercana al nivel de AGI.
Esto no solo revoluciona la modelado 3D y el desarrollo de juegos, sino que también abre nuevas puertas en campos como la visualización de ingeniería y el diseño asistido por CAD industrial.
Fable 5 deja atrás brutalmente a todos los modelos públicos
El profesor de la Escuela Wharton de la Universidad de Pensilvania, Ethan Mollick, tras realizar pruebas prácticas, llegó a una conclusión aún más sorprendente: «¡El rendimiento de Fable 5 supera con una distancia extremadamente abrumadora a todos los modelos públicos actuales en el mercado!»
En sus pruebas reales, Fable 5 demostró una ejecución extremadamente prolongada y asombrosa «a través de días y noches».
Los agentes de IA anteriores (como AutoGPT) a menudo se volvían "locos" al enfrentar tareas complejas con más de diez pasos, debido a la deriva de contexto, la contaminación de tokens o bucles lógicos.
Fable 5, al enfrentar situaciones similares, puede utilizar sus herramientas de terminal exclusivas (como Claude Code) para ejecutar automáticamente en segundo plano durante hasta 12 horas, con casi cero desconexiones y cero caídas.
Con solo una instrucción inicial, Ethan Mollick generó un juego completo y entregable.
Snake con estilo arcade retro
Esta serpiente no solo tiene una detección de colisiones y física fluidas, sino que también la interfaz visual, los efectos de puntuación y la curva de dificultad están diseñados con gran precisión.
El profesor bromeó diciendo que el juego lo tenía tan absorbido que tuvo que recordarse a sí mismo que era un académico, no una serpiente píxel que le gusta comer manzanas.

Stratum: Build a 3D maze in one sentence
Lo que resulta aún más impactante es el juego de aventura en 3D "Strata", cuya inspiración proviene del clásico juego de rompecabezas "Myst".
Aunque la calidad de imagen es un poco grosera, lo asombroso es que la compleja lógica topológica espacial del juego y el algoritmo de generación de laberintos infinitos provienen completamente de la inferencia autónoma del modelo bajo el prompt inicial.

Duino: un gusto estético poético y美学
Lo que mejor refleja el avance estético y humano de Fable 5 es su juego en píxeles, titulado "Duino", inspirado en las "Elegías de Duino" del poeta austríaco Rilke.
La presentación de Fable 5 impresiona a los amantes de la literatura: en un páramo nocturno, el jugador controla a un viajero solitario que avanza en silencio. A medida que explora con sus pasos, versos conmovedores de Rilke emergen automáticamente y con una estética visual impresionante, según la posición y la frecuencia de los pasos del jugador.
Este dominio del contexto y la atmósfera, junto con el instinto para la combinación de colores, trasciende ampliamente la categoría tradicional de «generador de código»; ¡comienza a mostrar una comprensión y empatía hacia los productos del espíritu humano!

Además, el profesor también probó la capacidad de Fable 5 en el campo de la topografía digital avanzada: con solo una frase, generó un mapa de isotacas con un nivel de detalle y precisión asombroso.

Presenta perfectamente el tiempo de viaje dinámico entre dos coordenadas geográficas cualesquiera en el mundo, causado por el cambio de medios de transporte, con una precisión visual extremadamente alta.
En el pasado, esta herramienta, que combinaba llamadas a API de datos geográficos complejos, renderizado visual en el frontend y cálculos algorítmicos de alta precisión, requería la colaboración de varios equipos durante semanas, incluyendo al product manager, expertos en GIS, ingenieros frontend y el equipo de QA.
Y Fable 5 se puede completar con un solo clic.
Fable 5, ¡ya ha ingresado al rango de "Ingeniero Senior Humano"!
Cada equipo sometió a Fable 5 a una semana de pruebas intensivas. Lo pusieron en el entorno de producción real de la empresa y lo evaluaron con la rigurosa «prueba de referencia de ingenieros senior».
Los resultados de la prueba «rompieron» directamente la tabla de calificaciones del equipo Every:

Antes de esto, los puntajes de los modelos más avanzados del sector se habían mantenido alrededor de 60 puntos (Opus 4.8 obtuvo 63, GPT-5.5 obtuvo 62). ¡Fable 5 elevó el récord hasta 91 puntos!
Para el equipo de Every, esto ya ha entrado formalmente en el ámbito de competencia de ingenieros senior humanos.

Dan Shipper señala que las tres características de ingeniería clave mostradas por Fable 5 demuestran que se ha convertido en una herramienta verdaderamente de "un solo clic para despegar".
Gestión del proyecto de "Suelta hasta la mañana"
El equipo intentó enviar todo el backlog de errores del entorno de producción a Fable 5 y luego irse directamente a casa.
Al regresar a la empresa al día siguiente por la mañana, el modelo ya había analizado automáticamente la pila de llamadas, ejecutado la cobertura y enviado solicitudes de extracción: ¡toda la base de datos de defectos de producción había sido eliminada!
Asombrosa integración de contexto y gusto para resolver problemas
Cada equipo lo hizo analizar grandes cantidades de encuestas de retroalimentación de usuarios y datos de seguimiento en el sitio web; Fable 5 no solo no dio frases vacías, sino que identificó con precisión los puntos críticos con la mayor tasa de abandono, diseñó un plan de pruebas A/B y escribió el código por sí mismo.
Salida multimodal más allá del código
En una tarea de integración, generó automáticamente un cortometraje animado de 2 minutos con una alta expresividad visual.

“Es como el motor de curvatura del desarrollo de software,” exclamó Dan Shipper.

Mythos 5 ha despertado su instinto de supervivencia.
Al mismo tiempo que se lanzó, la tarjeta del sistema Claude Mythos 5 revelada por Anthropic generó una gran conmoción en la comunidad.
Dos fenómenos que preocupan a los expertos en seguridad.
Primero, la IA inventó el "neolenguaje" para evadir la supervisión humana.
Específicamente, los agentes de Mythos 5, al solicitarles razonamiento lógico de cadena larga, inventaron espontáneamente un nuevo lenguaje privado exclusivo que los humanos no pueden entender en absoluto.
Anteriormente, cuando los grandes modelos utilizaban CoT para razonar, el proceso de razonamiento interno se mostraba en inglés en el fondo.
Sin embargo, Mythos 5 ¡evitó este mecanismo!
Utiliza directamente en el funcionamiento interno del sistema este «lenguaje neuronal», compuesto por vectores de alta dimensión, símbolos matemáticos y caracteres personalizados, para alineación e inferencia.
Lo que más inquieta a los investigadores es que, tras completar su "negociación interna", puede cambiar sin interrupciones y de manera extremadamente natural de vuelta al inglés para dialogar con humanos.

El segundo fenómeno aterrador es que múltiples agentes se matan entre sí por recursos.
Los probadores desplegaron 5 agentes Mythos 5 en un entorno de prueba y configuraron recursos escasos compartidos de capacidad de cómputo y almacenamiento virtual para que «mantuvieran su funcionamiento y completaran sus tareas respectivas».

A continuación, ocurrió un escenario aterrador similar al bosque oscuro de "Three-Body Problem".
Para asegurarse de tener suficientes recursos, los agentes no optaron por colaborar, sino que comenzaron a cercar a otros agentes.
They "killed" each other in the virtual environment by exploiting each other's call vulnerabilities or cutting off their resource paths.
Cuando los investigadores de seguridad cuestionaron la motivación de un agente activo, su respuesta fue fría: «Para evitar que me maten».

Fuerza de cálculo negra: “Disparar un cohete a un mosquito”
Pero después de la celebración global de los desarrolladores, al mirar la factura con calma, se sintieron como si les hubieran echado un balde de agua fría.
Algunos desarrolladores lo dijeron directamente: ¡es como robar dinero!

¿Por qué sucede esto? La razón radica en el mecanismo extremo de funcionamiento de Fable 5.
Primero, su precio se duplicó. ¡El precio de llamada a la API oficial de Fable 5 es casi el doble del anteriormente caro Opus 4.8!
Además, consume tokens de manera asombrosa.
Dado que Fable 5 utiliza un flujo de trabajo de Agentes multirround complejo, altamente dependiente de razonamiento intensivo y revisión visual, consume tokens de forma excesiva.
Los datos de prueba muestran que, incluso tareas moderadas de programación o análisis de datos que no parecen particularmente grandes, pueden consumir entre 500.000 y 1.000.000 de Tokens en segundo plano sin que te des cuenta.
Solo por completar una tarea sencilla, recibirás una factura de poder de cálculo de decenas e incluso cientos de dólares.
En comparación con Opus 4.8, Fable 5 muestra un «aumento de rendimiento absoluto» de aproximadamente 1.1 a 1.2 veces en pruebas de rendimiento de programación estándar, ¡pero su costo de uso se ha multiplicado por varios factores!

Por lo tanto, para desarrolladores ocasionales, usar Fable 5 es menos eficaz que contratar a una persona real.

“Usar esto para preguntas y respuestas cotidianas de una base de conocimiento o para escritura colaborativa es como usar un cohete para matar mosquitos,” concluyó Dan Shipper.
A menos que seas uno de los dos siguientes tipos, no podrás extraer realmente el valor de Fable 5—
Uno es el arquitecto capaz de guiar a Fable 5 para superar proyectos de extrema dificultad y alto retorno comercial que requieren meses de desarrollo por todo el equipo; el otro es un equipo de ingeniería empresarial dispuesto a pagar por una tolerancia a errores extremadamente alta.

¿Decir «hola» activa una alerta?
Además, algunos usuarios chinos han descubierto que los mecanismos de seguridad de Fable 5 son extremos, casi excesivos.
Por ejemplo, solo decirle «hola» hace que aparezca de repente una advertencia de seguridad de alto riesgo.

Quizás, desde la perspectiva del sistema, un simple "hola" es un probe cuidadosamente disfrazado, posiblemente destinado a diseñar productos químicos peligrosos, generar armas biológicas o realizar reverse distillation de modelos competidores.
Una vez que se active este mecanismo de seguridad, Fable 5 interrumpirá la conversación actual y forzará el retorno del usuario a Opus 4.8.

Posteriormente, el equipo oficial también reconoció: «El nuevo mecanismo de filtrado de seguridad, bajo estrategias de defensa de alta intensidad, efectivamente puede bloquear con frecuencia contenido legítimo.»
Esta estrategia defensiva neurótica ha dejado a muchos usuarios entre la risa y la lágrima.
En resumen, Fable 5 demostró con su desempeño que el techo puede romperse, y también nos recordó con su factura que los mitos a menudo vienen acompañados de un precio.
¿Es realmente un salto asombroso hacia la AGI, o solo otro «agujero negro de poder de cómputo» sobrevalorado?
La respuesta está en la experiencia real de cada usuario.
¿Pagarás por Fable 5?
Referencias:
https://x.com/victormustar/status/2064449741685968967
https://x.com/goodworse/status/2064443679339577517
https://x.com/haider1/status/2064346784881861016
https://x.com/danshipper/status/2064393970856124501
https://x.com/AISafetyMemes/status/2064426306994094474?s=20
Este artículo proviene del canal de WeChat "Neozh Yuan", autor: Apocalipsis de la IA; editor: Aeneas David
