Habang ang karaniwang tao ay nag-aaral pa ng "pinakamalakas na mga mantra ng prompt," ang mga pinakamataas na laboratorio sa Silicon Valley ay nagsagawa na ng AI infrastructure bilang isang production line

May-akda ng artikulo, pinagkukunan: Xinzhisheng

Nasa chatbox ng ChatGPT pa rin ba ang pagpapalit-palit ng prompt mo?

Kahit recent, isang X user ang nag-post ng tweet na nagsisimula sa isang paghinga ng pagkabigla: Leaked template ng Claude Code project na ginagamit nang lihim ng mga malalaking kumpanya!

Hindi na ito pag-sulat ng prompt. Ito ay imprastruktura ng AI engineering.

Ang buong estratehiya ay nakabatay sa isang file na 「CLAUDE.md」, at ang kanyang pangunahing prinsipyo ay tatlo lamang:

Sa bawat pagkakamali ni Claude→dagdagan mo ng isang patakaran; sa bawat pag-uulit mo ng sarili mo→dagdagan mo ng isang workflow; sa bawat bug→dagdagan mo ng isang safeguard.

Ginagawa ito upang i-encode ang karanasan sa proyekto bilang matagalang konteksto at awtomatikong pagkakabigay na babasahin nito bawat pag-start.

Ang buong arkitektura, tulad ng organizational structure ng isang AI company: ang CLAUDE.md ay ang handbook ng pagkakaroon ng trabaho, ang skills/ ay ang SOP ng trabaho, ang hooks/ ay ang compliance department, ang docs/ ay ang articles of incorporation, ang tools/ ay ang logistics team, at ang src/ ay ang tunay na operational department na nagpapagawa ng mga gawain.

Hindi ka na nag-uusap sa isang AI—nagbuo ka ng isang AI na nakakaunawa sa iyong code repository.

Ang pinakakamanghang bahagi ay kailangan mo lang i-configure nang isang beses, at automatic na susuriin ni Claude ang code, aawitain at ipapatupad ang mga patakaran sa arkitektura, isusulat ang release notes, i-rerun ang workflow mula sa mga kasanayan, at tatalikuran ang mga nakaraang error.

At mas matalino ito habang ginagamit.

Ang karamihan sa mga tao ay buksan ang ChatGPT, isusulat ang prompt, kopyahin at ididikit, paulit-ulit; ngunit sa paraang ito, kailangan mo lang buksan ang terminal, patakbuhin ang isang skill code na nai-deliver.

Ito ay parang may isang koponan ng AI na nagtatrabaho sa iyong sariling codebase.

Ang likod ng tweet na ito ay isang maliit na signal na ang panahon ay umuunlad nang tahimik, at marami sa karamihan ay hindi pa nababatid.

Isang 'screenshot ng leak' na hindi talaga leak ay nagbukas ng isang katotohanan

Ang screenshot na ipinakita ni @ai_rohitt ay ang pormal na pamantayan ng Claude Code na inirerekomenda ng opisyal na dokumentasyon ng Anthropic.

Ang CLAUDE.md ay ang project memory file na automatikong binabasa ni Claude Code sa bawat simula ng sesyon.

Ang .claude/skills/ at .claude/hooks/ ay mga opisyal na suportadong mekanismo ng extension.

Ito ay mga pampublikong praktika na pinagdiskusyon ng komunidad nang ilang buwan, at hindi isang 'loob na template' na kinuha ng sinuman.

Ngunit ang pagkakaroon nito ng aktibong pagbabahagi mula sa ilang karanasan na developer ay nagpapakita na ito ay tinanggap ng ilang developer na gumagamit ng Claude araw-araw.

Isang malaking bahagi sa kanila, maaaring nakamit lamang ito sa mga nakaraang araw na maaari itong gamitin nang ganito.

At ang top team mula sa Silicon Valley ay nagsagawa na nito bilang isang produksyon linya.

Ang unang halimbawa ay ang OpenAI Frontier team.

Sa mga eksperimento ng Frontier team na inilabas ng OpenAI, isang internal beta na nagsimula sa isang walang laman na repo ay naglikha ng halos 1 milyong linya ng code at halos 1,500 na PR sa loob ng 5 buwan gamit ang Codex; ang team ay lumawak mula sa 3 hanggang 7 na miyembro, at ang tao ay hindi direktang sumusulat ng code.

Sinabi ni Ryan Lopopolo, ang lider ng grupo, sa isang susunod na interbyu na ang workflow na ito ay malapit na sa limitadong anyo ng "0 manual code, 0 manual review".

Naniniwala siya na mas mabuti na gamitin ang napakataas na concurrency capability at napakababang gastos ng model kaysa mag-save ng token, upang palitan ang limitado at mahal na synchronous attention ng tao.

Ang pangalawang halimbawa ay ang loob na automated code agent system ng Stripe na tinatawag na Minions.

Ang mga Minions sa loob ng Stripe ay gumagawa at pinapalalaganap ang higit sa 1,300 na PR kada linggo, na lahat ng code ay ginawa ng AI, ngunit nananatiling pinapag-ayos ng tao.

Mayroon pa isang set ng datos: 1.6% vs 98.4%, na galing sa isang papel na inilathala ng VILA-Lab ng Mohamed bin Zayed University of Artificial Intelligence.

https://arxiv.org/pdf/2604.14228

Isinagawa ng mga mananaliksik ang sistematikong pagsusuri sa 512,000 na linya ng TypeScript source code ng Claude Code v2.1.88, at ang kanilang konklusyon ay: ang 1.6% lamang ang AI decision logic, habang ang natitirang 98.4% ay deterministic engineering infrastructure.

Tiyak na mga kategorya ay ang permission gateway, context management, tool routing, at error recovery.

Hindi ibig sabihin ng set na ito ng numero na ang modelo ay nag-ambag lamang ng 1.6% sa kakayahan, kundi ipinapakita nito na ang malaking karamihan ng kumplikadong aspeto ng Claude Code bilang isang produkto ay nasa mga deterministic engineering infrastructure tulad ng mga pahintulot, konteksto, pagrute ng mga kasangkapan, at mga mekanismo ng pagbabalik, at hindi sa modelo mismo.

Ang istruktura ng CLAUDE.md/skills/hooks sa larawan na iyon ay isang “pagsisimula na imprastruktura” na maaaring itayo ng anumang karaniwang developer; pareho ito sa paradigm ng produksyon-level na istruktura ng OpenAI at Stripe, ngunit mas maliit ang sukat.

Mga lihim na inilabas ng CLAUDE.md

Sa nakaraang 3 taon, lahat ay nagtatanong, “Kailan magiging mas matalino ang GPT?” “Kailan lalabas ang bagong bersyon ng Claude?”

Ngunit ang mga koponan na talagang nagpapatakbo ng AI programming sa production environment, mas nag-aalala sila sa pagpapalala ng AI kung ano ang kanilang naunang pagkakamali, kung paano gawing makita ng AI ang mga limitasyon ng arkitektura ng proyekto bago ito magsimula, at kung paano i-block ng mga kasangkapan ang AI kapag ito ay nagkakamali.

Ang CLAUDE.md ay ang tagapagdala ng lahat ng ito.

Ang opisyal na depinisyon ng Anthropic ay isang pangungusap lamang:

Isang markdown file, nakalagay sa root ng proyekto, na binabasa nang awtomatiko ni Claude Code sa bawat simula ng sesyon.

https://code.claude.com/docs/en/memory

Mukhang simple, ngunit ang mga antas na nakapalibot dito ang talagang nagiging lakas nito.

Ang CLAUDE.md ay ang utak ng proyekto.

Dito nakalagay ang mga desisyon sa arkitektura, mga konbensyon sa pangalan, mga pangangailangan sa pagsubok, at lahat ng mga pagkakamali na paulit-ulit. Ito ang unang nakikita ng AI na “manual ng empleyado” bawat beses na ito ay i-start.

.claude/skills/ ay mga muling gamitin na workflow.

Ang tagapaglikha ng Claude Code, si Boris Cherny, ay paulit-ulit na binigyang-diin sa komunidad ang sumusunod: "Kung gawin mo ang isang bagay araw-araw nang higit sa isang beses, gawin itong skill o command."

Ang isang skill ay isang executable na pamamaraan. Ang code review, pagbuo ng commit message, at pagsusulat ng release notes ay hindi dapat mga gawain na kailangang i-type nang manual araw-araw; dapat ito ay maaaring i-trigger ang isang skill para agad makakuha ng resulta.

.claude/hooks/ ay isang automatic guardrail.

Ito ang pinakamahalagang bahagi. Hindi ito nakabatay sa sariling pagpapasya ng AI, kundi sa deterministic code na humaharang sa AI bago ito makakamali. Dito nakabatay ang pagpapahintulot sa AI na mag-run nang 'walang pagmamasid', dahil ang mga hangganan ng pagkakamali ay nakaputol ng hooks.

docs/decisions/ ay isang record ng mga desisyon sa arkitektura.

Gawin ang AI na hindi lang alam kung ano ang code, kundi kung bakit ganito ang code.

Ito ang pinakamadaling makalimutan, ngunit ito rin ang pinakamalaking leksyon sa pagtatrabaho ng AI.

Ang tools/ at src/ ay ang execution layer.

Ang tunay na napapanatili sa arkitekturang ito ay hindi ang isang developer na naglikha ng isang magandang directory, kundi ang patuloy na pagkakasundo ng mga independiyenteng team sa iisang direksyon: pagsasama ng model sa isang harness na binubuo ng konteksto, mga kasangkapan, mga pahintulot, pagtataya, at mga siklo ng feedback.

Maaari nang makita ang maraming katulad na proyekto sa GitHub:

Ang awesome-claude-code-toolkit ni rohitg00, ang claude-code-infrastructure-showcase ni diet103, at ang everything-claude-code ni affaan-m, ay nagtatayo ng engineering environment para sa Claude Code gamit ang mga komponent tulad ng agents, skills, hooks, rules, at MCP configs.

Ito ay nagpapakita na ang totoong matatag na AI programming workflow ay hindi lamang batay sa isang mas malakas na model o isang mas mahabang prompt, kundi ang pagtatanim ng model sa isang inhenyerong sistema na maaaring muli gamitin, maaaring kontrolin, maaaring mabawi, at maaaring ma-audit.

Tungkol sa partikular na istruktura ng direktoryo, iba-iba ang bawat implementasyon.

Extreme experiment ng OpenAI Lab

Noong Pebrero 11, 2026, nag-post ang opisyal na blog ng OpenAI ng isang artikulo: >>> Harness engineering: leveraging Codex in an agent-first world<<<

https://openai.com/index/harness-engineering/

Binago ng Anthropic ang kanilang pagkakabuo ng Claude Code batay sa konseptong ito; pinadali ng website ni Martin Fowler ito sa isang pormula: «Agent=Model+Harness.»

Ang salitang "harness" ay nagmula sa kabayo. Ito ay tumutukoy sa buong set ng kagamitan ng kabayo, kabilang ang mga tali, bit, saddle, at headstall.

Maaaring maging mabilis at makapangyarihan ang isang kabayo, ngunit hindi ito alam kung saan dapat pumunta: ang buong set ng pananakop ang nagdedesisyon kung saan ito dadalhin.

Ipaghambing sa AI programming: malakas ang kakayahan ng modelo, ngunit hindi ito alam kung saan dapat lumakad sa iyong codebase. Ang Harness ay ang iyong ginawa para sa ito: steering wheel + brake + navigation.

Ang eksperimento ng OpenAI Frontier team na «1 milyong linya, 0 tao» ay sa katotohanan ay ang pagpapalalim ng Harness.

Ang kanilang mga pangunahang praktis sa inhinyeriya ay kasama ang mga sumusunod.

Strong hierarchical constraints.

Mula sa Types hanggang Config, Repo, Service, Runtime, at UI, ang pagkakasunod-sunod ng mga pagkakadepende ay isang direksyon lamang, at itinutupad ng linter sa CI layer. Sumulat ang Agent ng code na lumalabag sa hierarchy? Agad na mabubuksan ang build.

Ang sariling error message ng linter ay isang instruksyon para sa pagpapabuti, at ito ang pinakamaliit na intuitibong detalye.

Ang lint error ng karaniwang proyekto ay "violation detected", para sa mga tao; ang lint error ng OpenAI Frontier ay "gumamit ng logger.info({event: 'name', …data}) kaysa sa console.log", isang direktang utos para sa Agent na maaaring direktang basahin at ayusin.

Ang dokumento ay nagiging iisang pinagkukunan ng katotohanan. Ang lahat ng mga larawan ng arkitektura, execution plans, at mga spesipikasyon ng disenyo ay nasa loob ng direktoryo ng docs/ sa repository. Hindi kailangan ng Agent anumang eksternal na database; lahat ay nasa loob ng repo.

Gaano kapot ang epekto ng mga ito?

Hindi nagbago ang modelo, ngunit tinawag ng LangChain ang harness, kabilang ang system prompt, mga tool, middleware, at mode ng pag-iisip, at nakapagpataas ng Terminal Bench 2.0 score mula sa 52.8 patungo sa 66.5.

Maaari mong gawin ngayon

Gumawa ng isang puso ng proyekto para sa AI

Balik sa mga karaniwang developer: Kung ang paradigm ay nagsalikway na, ano ang maaari mong gawin bilang isang karaniwang inhinyero ngayon?

Una sa lahat, gumawa ng isang CLAUDE.md sa root directory ng iyong pinakamahalagang proyekto.

Hindi kailangang perpekto, hindi kailangang mahaba. Isulat ang arkitekturang patakaran ng iyong team, mga pangalan na konbensyon, mga pangangailangan sa pagsubok, at mga karaniwang pagkakamali—10 minuto lang para makalikha ng isang gumagana bersyon.

Sa susunod na pagkakamali ng AI, huwag muna i-manual na ayusin, kundi tanungin ang sarili mo: Ano ang kulang sa CLAUDE.md?

Ikalawang bagay, gawing skill ang mga gawain na uulitin araw-araw.

Dapat tandaan ang pahayag ni Boris Cherny: “Kung ginagawa mo ang isang bagay nang higit sa isang beses araw-araw, gawin itong skill o command.”

Ang code review, pagbuo ng commit message, pagsulat ng release notes, at pag-aayos ng isang uri ng paulit-ulit na bug, ay dapat mga kasanayan, hindi araw-araw na pagketik ng prompt.

Ilang pangatlo, magdagdag ng hook sa mga lugar kung saan madaling mabigo.

Ang hook ay ang bahagi na may pinakamataas na leverage sa 98.4%. Hindi ito nakasalalay sa AI para maging mas matalino; nakasalalay ito sa tiyak na code para sa pagsusuri. Ito ay ang proseso ng pagsasalin ng pagpapasya ng mga inhinyero sa mga kundisyon na maunawaan ng machine.

Hindi sa pagsusulat ng code ang core ng bagay na ito, kundi sa pagsusulat ng mga patakaran.

Ang sinabi ni Karpathy noong Enero ngayong taon sa Twitter: “Nagbago na ako mula sa 80% pag-sulat ng code nang manual sa 80% pagbibigay sa Agent para isulat.”

Sa susunod na limang taon, ang curve ng kakayahan ng mga inhinyero ay nagpapalit mula sa “Ilang linya ng code ang kayang kong isulat” patungo sa “Gaano kahigpit ang aking kayang disenyo ang kapaligiran para sa AI”.

Ang paggawa ng code ay kinukuha ng Agent.

Ngunit ang paggawa ng mundo kung saan makakasulat ang Agent ng magandang code ay gawa ng tao. At mas mahirap, mas mahalaga, at mas kasiya-siya kaysa dati.

Ipinakita ng Claude Code ni Anthropic ang 98.4% ng engineering infrastructure sa likod ng AI

Maaari mong gawin ngayon