Anthropic afirma que el camino de la auto-mejora de la IA se está volviendo claro, desencadenando el debate sobre la narrativa de una OPI

Artículo | LetraAI

Anthropic publicó ayer por la noche un artículo extenso titulado «When AI builds itself» (Cuando la IA se construye a sí misma), que suena como una novela de ciencia ficción de Asimov, y cuyo tema es efectivamente un concepto muy de ciencia ficción: recursive self-improvement (mejora automática recursiva).

Claude

En pocas palabras, antes los investigadores humanos escribían código, realizaban experimentos y entrenaban modelos para hacer a la IA más poderosa. Pero si la IA comienza a participar en el diseño, entrenamiento, prueba y optimización de sus propias versiones posteriores, la velocidad de progreso de la IA ya no dependerá únicamente de los humanos, sino que podría comenzar a ser impulsada por una “evolución automática” de la IA.

Para ello, Anthropic hace un llamado:

We believe that if the world could choose to slow down or temporarily halt the development of frontier AI, allowing social structures and alignment research to catch up with technological progress, it would be greatly beneficial to the world.

Esta frase suena como una advertencia de seguridad, pero en el contexto de Anthropic preparándose para su IPO, es difícil no verla como otra preparación narrativa: Claude es tan útil que incluso comienza a crear la próxima generación de Claude.

Ya ha aparecido una nueva tormenta

Para ilustrar que la IA está participando cada vez más en el desarrollo de la propia IA, Anthropic presentó una gran cantidad de datos internos.

Por ejemplo, hasta mayo de 2026, más del 80% del código integrado en el repositorio por Anthropic fue escrito por Claude. Antes del lanzamiento de Claude Code, este número era solo de un solo dígito.

Para el segundo trimestre de 2026, según Anthropic, la cantidad de código fusionado diariamente por los ingenieros ha aumentado aproximadamente ocho veces en comparación con 2024.

Claude

Lo que es más notable que la cantidad de código es que Claude está abordando problemas de ingeniería más abiertos.

Anthropic dice que, durante el último año, la frecuencia con la que los empleados corrigen a Claude, lo devuelven al camino correcto o asumen la tarea a mitad de camino ha seguido disminuyendo. Este cambio no solo ocurre en tareas sencillas, sino también en las tareas abiertas más complejas.

Los llamados problemas abiertos son aquellos sin instrucciones claras. Por ejemplo, cuando el sistema se cae o una tarea de entrenamiento se interrumpe, los ingenieros no saben inicialmente cuál es la solución y deben investigar y evaluar mientras avanzan.

Anteriormente, este tipo de tareas dependía en gran medida de la experiencia humana, y en las tareas más abiertas, la tasa de éxito de Claude alcanzó el 76% en mayo de 2026, un aumento de 50 puntos porcentuales en seis meses.

Claude

No solo escriben código; Anthropic también utiliza Claude para revisar código, detectando errores, vulnerabilidades de seguridad y otros defectos. Al realizar un análisis retrospectivo, descubrieron que si cada cambio de código en el pasado hubiera sido revisado automáticamente por Claude, aproximadamente un tercio de los errores que causaron incidentes en línea en claude.ai podrían haberse detectado antes del lanzamiento.

Además, Claude ya está participando en el proceso de investigación.

Anthropic tiene una prueba fija: proporcionar a Claude un código para entrenar un modelo pequeño y pedirle que lo ejecute más rápido sin alterar el resultado. En mayo de 2025, Claude Opus 4 logró aproximadamente una aceleración de 3 veces; para abril de 2026, Claude Mythos Preview había llevado este número a aproximadamente 52 veces.

Anthropic también mencionó un caso de investigación abierta sobre seguridad de IA. Le plantearon a un agente impulsado por Claude la siguiente pregunta: ¿puede un modelo más débil supervisar de manera confiable a un modelo más fuerte?

Este proceso requiere formular hipótesis, probarlas y compartir los hallazgos con agentes paralelos, iterando repetidamente.

Dos investigadores humanos pasaron una semana reduciendo aproximadamente el 23% de la brecha; mientras que Claude, con un consumo acumulado de aproximadamente 800 horas y unos 18.000 dólares en poder de cómputo, redujo el 97%.

Este resultado, por supuesto, tiene limitaciones: los problemas fueron seleccionados por humanos, los criterios de evaluación fueron establecidos por humanos, y los resultados no se han transferido completamente a modelos a escala de producción. Sin embargo, aún demuestra que Claude ya puede diseñar experimentos, ejecutarlos y iterarlos por sí mismo dentro de un marco de investigación cuya dirección ha sido definida por un humano.

Además, cuando los investigadores humanos se desvían del camino correcto, Claude puede ofrecer mejores juicios sobre el siguiente paso.

Anthropic seleccionó 129 sesiones de investigación internas de Claude Code en las que investigadores humanos resolvieron problemas de investigación abiertos junto con Claude. Anthropic identificó algunos puntos en los que, posteriormente, se demostró que los humanos habían tomado un camino innecesario, y proporcionó el contexto previo a esos puntos a diferentes versiones de Claude para ver qué sugerencias hacían sobre el siguiente paso. Luego, otro Claude juez, que conocía el resultado completo de la sesión, evaluó: ¿cuál fue mejor, la sugerencia del modelo o la elección realizada por el humano?

Los resultados muestran que, en los nodos donde los investigadores humanos ya han demostrado tener margen de mejora, Claude cada vez propone mejores pasos siguientes.

Claude

Anteriormente, el progreso de los modelos de IA lo impulsaban principalmente investigadores e ingenieros humanos. Los humanos decidían qué experimentos realizar, escribían código, entrenaban modelos y impulsaban la iteración de las funciones de la IA.

Ahora, cada vez más eslabones de esta cadena están siendo asumidos por Claude.

Anthropic proporcionó una tabla de fases muy intuitiva:

Claude

De 2021 a 2023, Anthropic no era diferente de las empresas tecnológicas comunes: los humanos escribían código y documentos en sus computadoras portátiles.

De 2023 a 2025, los chatbots comenzaron a integrarse en los flujos de trabajo. Los ingenieros hacían que los modelos generaran fragmentos de código, que luego copiaban en los editores.

En 2025 y 2026, aparecieron agentes de programación, y Claude comenzó a poder escribir y modificar código de forma autónoma, a veces incluso completando archivos enteros por sí solo.

Hoy en día, los agentes pueden ejecutar código por sí mismos y delegar tareas que duran varias horas a otros agentes.

Luego viene la fase que realmente preocupa a Anthropic: el bucle cerrado.

Si llega ese día, las versiones posteriores de Claude podrían ser mejoradas continuamente por Claude mismo: esto es lo que se denomina recursive self-improvement, o mejora recursiva automática.

Anthropic lo dice con cautela en el artículo: aún no hemos llegado a ese punto, y la auto-mejora recursiva no es inevitable. Sin embargo, sigue enfatizando que el camino hacia ese punto ya está volviéndose visible.

Por eso Anthropic menciona al final del artículo la necesidad de desacelerar, e incluso detenerse. No significa que todas las empresas de IA deban detener sus operaciones de inmediato, sino que, si el riesgo de mejora automática de la IA sigue aumentando en el futuro, los laboratorios líderes necesitan un mecanismo coordinado y verificable para desacelerar.

En otras palabras, el punto de singularidad está a punto de llegar, y la humanidad debe controlarlo.

Claude, imparable

Si se mira solo la superficie, este es un documento de seguridad muy proactivo. Anthropic habla sobre la auto-mejora recursiva, sobre cómo la IA podría mejorar su propio rendimiento cada vez más rápido, y sobre cómo la sociedad humana necesita prepararse con anticipación para mecanismos de desaceleración y pausa.

Pero en el contexto del momento en que Anthropic se prepara para su IPO, este artículo adquiere otro nivel de significado.

En cierto sentido, los últimos movimientos de la Fábrica A son como los de ese alumno sobresaliente que se porta de forma insolente en clase: realmente tiene capacidad, pero también hace show.

No solo quiere decir "tenemos un Claude muy fuerte", sino que va un paso más allá: "Claude nos está ayudando a crear un Claude aún más fuerte".

Si Anthropic solo vendiera un modelo o una herramienta, le sería difícil escapar por completo de la comparación horizontal: Anthropic tiene Claude, OpenAI tiene GPT; Anthropic tiene Claude Code, OpenAI tiene Codex; Anthropic compite por clientes empresariales, y OpenAI también compite por clientes empresariales. La competencia entre ambas empresas es muy intensa, y depende de quién pueda contar una historia más grande al mercado.

Tenga en cuenta que, justo hace 3 días, OpenAI escribió en un documento sobre la gobernanza de la IA avanzada:

También hemos observado signos tempranos de mejora recursiva automática en el sistema de hoy: el desarrollo de la IA está siendo acelerado por la propia IA.

Esto intensificará la presión competitiva entre desarrolladores y países, y generará desafíos de gobernanza que las instituciones actuales no pueden abordar.

Tres días después, Anthropic dijo: El camino de Claude hacia la auto-mejora recursiva ya comenzó a volverse visible.

Claude

Si Claude se desarrolla tal como lo espera, no será solo una narrativa de producto común, se convertirá en un motor de investigación y desarrollo.

Claude escribe código, ejecuta experimentos y optimiza los flujos de entrenamiento, y a su vez reduce los incidentes en los propios productos de Anthropic... Una vez que este sistema esté en funcionamiento, Claude ya no será solo un producto de Anthropic, sino también una herramienta de producción clave para Anthropic.

Los usuarios ven el producto Claude; los clientes empresariales compran la capacidad de Claude, pero lo que Anthropic realmente quiere que el mercado financiero note es que Claude ya está integrado en los procesos fundamentales de desarrollo de modelos de vanguardia, y se ha colocado dentro del motor de Anthropic.

Los mercados de capitales adoran escuchar historias de ruedas de inercia, como un cuenco de la fortuna que atrae riqueza sin cesar: un Claude más potente permite que los ingenieros de Anthropic fusionen más código; más código permite una iteración más rápida del producto y la infraestructura; una iteración más rápida permite a los investigadores ejecutar más experimentos, y estos experimentos, a su vez, ayudan a hacer más fuerte la próxima generación de Claude. Cuando la próxima generación de Claude se vuelve más fuerte, vuelve a acelerar la investigación y desarrollo de Anthropic.

La velocidad de iteración de Claude también impulsa este ciclo. Desde la fecha de lanzamiento público, entre 2023 y principios de 2025, las actualizaciones principales del modelo de Claude solían ser cada tres o cuatro meses, pero tras el ingreso a Claude 4, las actualizaciones del modelo de Anthropic se han vuelto significativamente más frecuentes.

Claude 4 se lanzó en mayo de 2025, Opus 4.1 en agosto, Sonnet 4.5 en septiembre, Haiku 4.5 en octubre y Opus 4.5 en noviembre.

Para 2026, Opus 4.6 se lanzó el 5 de febrero, Sonnet 4.6 el 17 de febrero, Opus 4.7 el 15 de abril y Opus 4.8 el 28 de mayo. Entre Opus 4.7 y Opus 4.8 transcurrieron solo 42 días.

Anthropic parece estar diciendo: "Esto podría ser peligroso, debemos preparar los frenos con anticipación", pero al mismo tiempo está insinuando: "Ya hemos visto lo que sucede cuando se pisa el acelerador".

Lo sutil de la narrativa de la IPO radica en que, por un lado, enfatiza mucho el riesgo, y por otro, eleva mucho su posición tecnológica.

No todas las empresas de IA tienen derecho a discutir la auto-mejora recursiva; primero debes hacer que el mundo exterior crea que tu IA ya ha ingresado al proceso de desarrollo de IA, antes de poder afirmar que esto podría requerir coordinación global.

OpenAI: ¿Cómo se puede hacer esto?

Como se mencionó anteriormente, justo antes de que Anthropic publicara este largo artículo, OpenAI acaba de poner sobre la mesa la auto-mejora recursiva.

Pero las afirmaciones de ambas empresas son muy diferentes.

El artículo de OpenAI, "Democratic Governance of Frontier AI", es un plan de políticas dirigido a Washington, que no se centra en "cómo hacer que los modelos sean más potentes", sino en cómo regularlos a medida que la IA de vanguardia continúa avanzando.

La mayoría de los contenidos mencionados en ese informe no son adecuados para ser detallados, excepto una frase clave: OpenAI dice que ya se pueden ver los primeros indicios de mejora recursiva auto-referencial en los sistemas actuales.

Esta frase y el largo artículo de Anthropic apuntan en realidad en la misma dirección.

Mientras que OpenAI habla de instituciones, Anthropic habla de sí misma.

OpenAI significa que el desarrollo de la IA es demasiado rápido y que las estructuras de gobernanza actuales podrían no dar abasto, por lo que se necesitan nuevas reglas.

Y Anthropic mostró directamente ese sistema, informando al mercado: "Claude ya ha ingresado en nuestro proceso de desarrollo, por lo que hemos visto la ruta de autoaceleración de la IA".

Jugaste muy bien, parece que dentro de OpenAI ya comenzaron a murmurar: ¡esto es literalmente un robo de ideas! ¡Nosotros fuimos los primeros!

Sólo bromeo, pero OpenAI realmente necesita esforzarse más; suban ya el GPT 5.6.