Mientras los usuarios comunes aún estudian los "hechizos de prompts más potentes", los laboratorios de élite de Silicon Valley ya han convertido la infraestructura de IA en una línea de producción.

Autor y fuente del artículo: Nuevos智元

¿Aún estás repitiendo prompts en el cuadro de chat de ChatGPT?

Recientemente, un usuario de X publicó un tweet que comenzaba con una exclamación: ¡Se filtró la plantilla del proyecto Claude Code que las grandes empresas están usando en secreto!

Esto ya no es escribir prompts. Es la infraestructura de ingeniería de IA.

Todo el enfoque gira en torno a un archivo llamado «CLAUDE.md», y sus principios fundamentales son solo tres:

Cada vez que Claude cometa un error → añades una regla; cada vez que te repitas → añades un flujo de trabajo; cada vez que surja un error → añades una barrera de protección.

Hacer esto permite consolidar la experiencia del proyecto en un contexto permanente y restricciones automatizadas que se leerán en cada inicio.

Toda la arquitectura es como la estructura de puestos de una empresa de IA: CLAUDE.md es el manual de incorporación, skills/ son los SOP de trabajo, hooks/ es el departamento de cumplimiento, docs/ son los estatutos sociales, tools/ es el equipo de logística, y src/ es el departamento de operaciones que realmente produce resultados.

Ya no estás chateando con una IA, sino construyendo una IA que conozca tu repositorio de código.

La parte más loca es que solo necesitas configurarlo una vez, y Claude revisará automáticamente el código, lo reestructurará según las instrucciones, aplicará reglas de arquitectura, redactará notas de lanzamiento, ejecutará flujos de trabajo desde habilidades y recordará errores pasados.

Y se volverá más inteligente con el uso.

La mayoría de las personas abren ChatGPT, escriben prompts, copian y pegan, y repiten; pero con este enfoque, solo necesitas abrir la terminal y ejecutar un código de skill ya entregado.

Es como tener un equipo de colegas de IA en tu propia biblioteca de código.

Detrás de este tweet se transmite una pequeña señal de que esta era está cambiando silenciosamente, y la mayoría de las personas aún no lo han notado.

Una "captura de pantalla filtrada" que no es una filtración revela una verdad

La captura de pantalla mostrada por @ai_rohitt es el patrón estándar recomendado públicamente en la documentación oficial de Anthropic para Claude Code.

CLAUDE.md es el archivo de memoria del proyecto que Claude Code lee automáticamente al inicio de cada sesión.

.claude/skills/ y .claude/hooks/ son mecanismos de extensión admitidos oficialmente.

Estas son prácticas públicas que la comunidad ha discutido durante varios meses, y no son un «plantilla interna» robada por nadie.

Pero el hecho de que algunos desarrolladores experimentados lo compartan activamente indica que ha recibido el respaldo de desarrolladores que usan Claude diariamente.

Una buena parte de las personas probablemente solo se dieron cuenta estos últimos días de que se puede usar así.

Y el equipo de élite de Silicon Valley ya ha convertido esto en una línea de producción.

El primer ejemplo es el equipo OpenAI Frontier.

En los experimentos del equipo Frontier divulgados por OpenAI, un beta interno iniciado desde un repositorio vacío generó aproximadamente 1 millón de líneas de código y alrededor de 1500 PR en unos 5 meses mediante Codex; el equipo se expandió de 3 a 7 personas, sin que los humanos escribieran código directamente.

El líder Ryan Lopopolo mencionó posteriormente en una entrevista que este flujo de trabajo ya está cerca de la forma límite de "0 código manual, 0 revisión manual".

Él cree que, en lugar de ahorrar tokens, es mejor aprovechar la capacidad de concurrencia extremadamente alta y el costo extremadamente bajo del modelo para reemplazar la atención sincrónica limitada y costosa de los humanos.

El segundo ejemplo es el sistema de agentes de código automatizado interno de Stripe, Minions.

Los Minions dentro de Stripe generan e impulsan más de 1,300 PR fusionados por semana, cuyo código es generado completamente por IA, pero aún así sometido a revisión humana.

Aquí hay otro conjunto de datos: 1.6% vs 98.4%, proveniente de un artículo publicado por el VILA-Lab de la Universidad Mohamed bin Zayed para la Inteligencia Artificial.

https://arxiv.org/pdf/2604.14228

Los investigadores analizaron sistemáticamente 512.000 líneas de código fuente TypeScript de la versión Claude Code v2.1.88 y concluyeron que solo el 1,6% corresponde a lógica de decisión de IA, mientras que el 98,4% restante es infraestructura de ingeniería determinista.

Específicamente, se refiere a cuatro categorías: puerta de enlace de permisos, gestión de contexto, enrutamiento de herramientas y recuperación de errores.

Este conjunto de números no significa que el modelo contribuya solo con un 1.6% de capacidad, sino que, como producto, Claude Code tiene una gran complejidad que no reside en el modelo en sí, sino en la infraestructura de ingeniería determinista: permisos, contexto, enrutamiento de herramientas, mecanismos de recuperación, etc.

La estructura CLAUDE.md/skills/hooks en esa imagen es una «infraestructura de nivel inicial» que incluso un desarrollador común puede construir; sigue el mismo paradigma que la arquitectura de producción de OpenAI y Stripe, pero a una escala mucho menor.

Los secretos expuestos de CLAUDE.md

Durante los últimos tres años, todos se preguntaban: «¿Cuándo será GPT más inteligente?» «¿Cuándo saldrá una nueva versión de Claude?»

Pero los equipos que realmente han implementado la programación de IA en producción probablemente no se preocupan tanto por esto, sino más bien por cómo hacer que la IA recuerde los errores que cometió anteriormente, cómo hacer que la IA revise las restricciones de arquitectura del proyecto antes de actuar, y cómo hacer que las herramientas impidan los errores de la IA.

CLAUDE.md es el soporte exacto de todo esto.

La definición oficial de Anthropic es solo una frase:

Un archivo markdown, colocado en el directorio raíz del proyecto, que Claude Code lee automáticamente al inicio de cada sesión.

https://code.claude.com/docs/en/memory

Sounds simple, but it's the several layers built around it that make it truly impressive.

CLAUDE.md es el cerebro del proyecto.

Aquí se encuentran las decisiones de arquitectura, las convenciones de nomenclatura, los requisitos de prueba y todos los errores recurrentes. Es el «manual del empleado» que la IA ve primero al iniciarse.

.claude/skills/ son flujos de trabajo reutilizables.

Boris Cherny, el creador de Claude Code, ha enfatizado repetidamente en la comunidad: «Si haces algo más de una vez al día, conviértelo en una habilidad o un comando».

Una skill es un método ejecutable. Revisión de código, generación de mensajes de commit, escritura de notas de lanzamiento: estos no deberían ser tareas que requieran escribir prompts manualmente todos los días, sino que deberían resolverse con solo llamar a una skill.

.claude/hooks/ es un sistema de protección automática.

Esta es la parte más crítica. No depende de que la IA lo determine por sí misma; el código determinístico lo bloquea antes de que la IA cometa un error. Por eso se puede permitir que la IA funcione «sin supervisión», porque los límites de error están bloqueados por los hooks.

docs/decisions/ es un registro de decisiones arquitectónicas.

Haz que la IA no solo sepa qué es el código, sino también por qué es así.

Este es el aspecto más fácil de pasar por alto, pero también el punto de palanca más grande para la colaboración con IA.

tools/ y src/ son capas de ejecución.

Lo realmente notable de esta arquitectura no es que un desarrollador haya creado un directorio elegante, sino que cada vez más equipos independientes están convergiendo hacia la misma dirección: colocar modelos dentro de un entorno compuesto por contexto, herramientas, permisos, evaluación y ciclos de retroalimentación.

En GitHub ya se pueden ver muchos proyectos similares:

awesome-claude-code-toolkit de rohitg00, claude-code-infrastructure-showcase de diet103 y everything-claude-code de affaan-m están construyendo entornos de trabajo ingenieriles para Claude Code alrededor de componentes como agents, skills, hooks, rules y MCP configs.

Esto indica que un flujo de trabajo de programación con IA verdaderamente maduro no depende solo de un modelo más potente ni solo de una prompt más larga, sino que integra el modelo dentro de un sistema de ingeniería reutilizable, controlable, recuperable y auditável.

En cuanto a la estructura de directorios específica, las implementaciones varían entre ellas.

Experimento límite del laboratorio OpenAI

El 11 de febrero de 2026, el blog oficial de OpenAI publicó un artículo: «Harness engineering: leveraging Codex in an agent-first world».

https://openai.com/index/harness-engineering/

Anthropic reconfiguró la arquitectura de Claude Code en torno a este concepto; el sitio web de Martin Fowler lo resumió en una fórmula: «Agent=Model+Harness».

Harness proviene de la equitación. Se refiere al conjunto completo de arreos del caballo: riendas, mordaza, silla, y cabestrillo.

Un caballo puede correr rápido y con fuerza, pero él mismo no sabe hacia dónde ir: todo el arnés determina su dirección.

Análogo a la programación con IA: el modelo tiene una capacidad muy fuerte, pero no sabe por dónde moverse en tu repositorio de código. Harness es el volante, los frenos y el navegador que le creas.

El experimento del equipo Frontier de OpenAI, «1 millón de líneas sin intervención humana», es esencialmente llevar Harness al extremo.

Sus prácticas clave de ingeniería incluyen los siguientes puntos.

Estructura jerárquica con restricciones estrictas.

La dependencia fluye unidireccionalmente desde Types hasta Config, luego a Repo, Service, Runtime y UI, y es obligatoria por un linter en el nivel CI. ¿El agente escribe código que viola la jerarquía? La compilación falla directamente.

El mensaje de error del linter es en sí mismo una instrucción de reparación, y este es el detalle más contraintuitivo.

Los errores de lint de proyectos normales son «violation detected», destinados a personas; los errores de lint de OpenAI Frontier son «use logger.info({event: 'name', …data}) instead of console.log», instrucciones destinadas a Agentes que pueden leerse y corregirse directamente.

El documento sirve como fuente única de verdad. Todos los diagramas arquitectónicos, planes de ejecución y especificaciones de diseño se encuentran en el directorio docs/ dentro del repositorio. El agente no necesita ninguna base de conocimiento externa; todo está dentro del repositorio.

¿Qué tan efectivo es esto?

El modelo no cambió, pero LangChain ajustó el harness, incluyendo la indicación del sistema, herramientas, middleware y modo de razonamiento, elevando finalmente la puntuación de Terminal Bench 2.0 de 52.8 a 66.5.

Lo que puedes hacer hoy

Es crear un cerebro para un proyecto de IA

La pregunta vuelve al desarrollador común: si el paradigma ya ha cambiado, ¿qué puede hacer un ingeniero común hoy mismo?

Lo primero, crea un archivo CLAUDE.md en el directorio raíz de tu proyecto más importante.

No necesitas ser perfecto ni extenso. Escribe las reglas de arquitectura de tu equipo, convenciones de nombres, requisitos de prueba y los errores recurrentes; puedes tener una versión funcional en 10 minutos.

Cuando el AI cometa un error la próxima vez, no lo arregles manualmente; en su lugar, pregúntate: ¿Qué falta en CLAUDE.md?

Lo segundo, convierte las tareas que repites diariamente en habilidades.

Aquí hay que prestar atención a la frase célebre de Boris Cherny: «Si haces algo más de una vez al día, conviértelo en una habilidad o un comando».

La revisión de código, la generación de mensajes de commit, la redacción de notas de lanzamiento y la corrección de errores repetitivos deben ser habilidades, no cosas que se escriban manualmente con prompts todos los días.

Tercer punto, añade un gancho en los lugares donde es fácil caer en trampas.

Hook es la parte más apalancada dentro del 98.4%. No depende de la IA para volverse inteligente, sino de código determinista que realiza verificaciones obligatorias. Es el proceso de traducir el juicio de los ingenieros humanos en restricciones legibles por máquina.

Lo esencial de esto no está en escribir código, sino en escribir reglas.

La frase de Karpathy en Twitter en enero de este año que se volvió viral: "He pasado del 80% de código escrito manualmente al 80% entregado a Agentes."

En los próximos cinco años, la curva de habilidades de los ingenieros está pasando de «cuántas líneas de código puedo escribir» a «qué tan estricto puedo diseñar el entorno de trabajo para la IA».

El trabajo de escribir código está siendo asumido por Agentes.

Pero diseñar el mundo en el que el agente pueda escribir buen código sigue siendo tarea humana. Y es más difícil, más importante y más interesante que nunca.

Claude Code de Anthropic revela el 98,4% de infraestructura de ingeniería detrás de la IA

Lo que puedes hacer hoy