Claude Code milik Anthropic mendedahkan 98.4% infrastruktur kejuruteraan di sebalik AI

iconMetaEra
Kongsi
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Projek Claude Code milik Anthropic, dianalisis oleh MetaEra, menunjukkan 98.4% operasinya bergantung pada infrastruktur kejuruteraan, bukan AI. Sistem ini menggunakan fail markdown, CLAUDE.md, sebagai panduan dan memori. Pembangun menggunakan kaedah ini untuk membina alur kerja AI yang terstruktur dengan automasi, hook ralat, dan alat eksekusi. Pasukan Proof of Work (PoW) dan Proof of Stake (PoS) di OpenAI dan Stripe sedang mengaplikasikan ini untuk memperbesar penghasilan dan semakan kod.
Saat orang biasa masih mengkaji "mantra petunjuk terkuat", laboratorium terkemuka di Silicon Valley telah menjadikan infrastruktur AI sebagai lini pengeluaran

Penulis artikel, sumber: XinZhiYuan

Masihkah anda berulang kali menyesuaikan prompt di kotak perbualan ChatGPT?

Baru-baru ini, seorang pengguna X menghantar tweet yang bermula dengan seruan terkejut: Templat projek Claude Code yang digunakan secara rahsia oleh syarikat besar bocor!

Ini bukan lagi menulis prompt. Ini adalah infrastruktur kejuruteraan AI.

Seluruh strategi berpusat pada satu fail 「CLAUDE.md」, dan prinsip utamanya hanya tiga:

Setiap kali Claude membuat kesalahan → anda tambah satu peraturan; setiap kali anda mengulangi diri sendiri → anda tambah satu alur kerja; setiap kali berlaku ralat → anda tambah satu penghalang.

Dengan melakukan ini, pengalaman projek akan dijadikan konteks jangka panjang dan batasan automatik yang akan dibaca setiap kali ia dimulakan.

Seluruh arsitektur, seperti struktur jawatan sebuah syarikat AI: CLAUDE.md adalah manual pengenalan, skills/ adalah SOP kerja, hooks/ adalah jabatan kesesuaian, docs/ adalah akta syarikat, tools/ adalah kumpulan sokongan, src/ adalah jabatan operasi sebenar yang menghasilkan kerja.

You are no longer chatting with an AI; you are building an AI that understands your code repository.

Bahagian paling gila ialah, anda hanya perlu mengkonfigurasikan sekali, Claude akan secara automatik mengulas kod, membina semula mengikut arahan, memaksakan peraturan架构, menulis catatan rilis, menjalankan alur kerja daripada kemahiran, mengingati ralat sebelumnya, dan sebagainya.

Dan ia akan menjadi semakin pintar dengan penggunaan.

Kebanyakan orang membuka ChatGPT, menulis prompt, menyalin dan menempel, berulang-ulang; tetapi dengan pendekatan ini, anda hanya perlu membuka terminal dan menjalankan kod skill yang telah diserahkan.

Ia seolah-olah memelihara satu pasukan rakan sekerja AI di dalam perpustakaan kod anda sendiri.

Di sebalik tweet ini, terdapat isyarat kecil bahawa era ini sedang berubah secara perlahan, dan kebanyakan orang mungkin belum sedar.

Sebuah tangkapan layar yang tidak dianggap bocor membongkar satu kebenaran

Screenshot yang dipaparkan oleh @ai_rohitt adalah standard pattern Claude Code yang secara terbuka disyorkan dalam dokumen rasmi Anthropic.

CLAUDE.md adalah fail ingatan projek yang dibaca secara automatik oleh Claude Code pada permulaan setiap sesi.

.claude/skills/ dan .claude/hooks/ adalah mekanisme ekstensi yang disokong secara rasmi.

Ini adalah amalan terbuka yang telah dibincangkan oleh komuniti selama beberapa bulan, bukan 'templat dalaman' yang dicuri oleh seseorang.

Namun, fakta bahawa ia mendorong beberapa pembangun berpengalaman untuk secara aktif berkongsi menunjukkan bahawa ia mendapat pengiktirafan daripada pembangun yang menggunakan Claude setiap hari.

Sebahagian besar daripada mereka mungkin baru sedar dalam dua hari ini bahawa ia boleh digunakan dengan cara ini.

Dan pasukan terkemuka di Silicon Valley telah menjadikan perkara ini sebagai garis pengeluaran.

Contoh pertama ialah pasukan OpenAI Frontier.

Dalam eksperimen pasukan Frontier yang diungkapkan oleh OpenAI, sebuah beta dalaman yang bermula daripada repo kosong menghasilkan sekitar 1 juta baris kod dan sekitar 1,500 PR dalam tempoh kira-kira 5 bulan oleh Codex; pasukan berkembang dari 3 orang kepada 7 orang, tanpa penulisan kod secara manual.

Ryan Lopopolo, yang memimpin pasukan, menyatakan dalam temu bual seterusnya bahawa aliran kerja ini hampir mencapai bentuk maksimum "0 kod manual, 0 semakan manual".

Dia percaya bahawa lebih baik memanfaatkan kapasiti paralel yang sangat tinggi dan kos yang sangat rendah model tersebut untuk menggantikan perhatian serentak manusia yang terhad dan mahal, daripada menghemat token.

Contoh kedua ialah sistem agen automatik dalaman Stripe bernama Minions.

Minions di dalam Stripe menghasilkan dan mendorong lebih daripada 1,300 PR disatukan setiap minggu, di mana kod tersebut dihasilkan sepenuhnya oleh AI, tetapi masih melalui semakan manusia.

Masih terdapat satu set data lagi: 1.6% vs 98.4%, yang berasal daripada sebuah kertas kerja yang diterbitkan oleh VILA-Lab, Universiti Mohamed bin Zayed AI.

https://arxiv.org/pdf/2604.14228

Penyelidik menganalisis secara sistematis 512.000 baris kod TypeScript versi Claude Code v2.1.88, dan menyimpulkan bahawa hanya 1.6% adalah logik pengambilan keputusan AI, manakala 98.4% yang tersisa adalah infrastruktur kejuruteraan yang pasti.

Secara spesifik, ia merujuk kepada empat kategori: gateway kebenaran, pengurusan konteks, penghalaan alat, dan pemulihan ralat.

Nombor-nombor ini bukan bermaksud model hanya menyumbang 1.6% keupayaan, tetapi menunjukkan bahawa sebagai produk, Claude Code memiliki banyak kompleksiti yang bukan berada dalam model itu sendiri, tetapi dalam infrastruktur rekabentuk deterministik seperti kebenaran, konteks, penghalaan alat, dan mekanisme pemulihan.

Struktur CLAUDE.md/skills/hooks dalam gambar itu adalah "infrastruktur versi pemula" yang boleh dibina oleh pembangun biasa, dan ia mengikuti paradigma yang sama seperti infrastruktur peringkat pengeluaran dari OpenAI dan Stripe, hanya saiznya jauh lebih kecil.

Rahsia yang terdedah oleh CLAUDE.md

Dalam tiga tahun terakhir, semua orang bertanya, "Kapankah GPT akan menjadi lebih pintar?" "Kapankah Claude akan melancarkan versi baharu?"

Namun, pasukan yang benar-benar menjalankan pengaturan AI untuk pemrograman dalam persekitaran pengeluaran, mungkin tidak terlalu peduli dengan ini, tetapi lebih tertumpu pada bagaimana membuat AI mengingat kesilapan sebelumnya, bagaimana membuat AI melihat sekilas terhadap batasan struktur projek sebelum bertindak, dan bagaimana memastikan alat-alat menghentikan AI apabila ia membuat kesilapan.

CLAUDE.md adalah wadah yang menampung semua ini.

Definisi rasmi Anthropic hanya mempunyai satu ayat:

Sebuah fail markdown, diletakkan di direktori root projek, yang dibaca secara automatik oleh Claude Code pada setiap permulaan sesi.

https://code.claude.com/docs/en/memory

Kelihatan mudah, tetapi struktur-struktur berlapis yang mengelilinginya adalah bahagian yang benar-benar hebat.

CLAUDE.md adalah otak projek.

Keputusan struktur, konvensi penamaan, keperluan ujian, dan semua kesilapan yang berulang kali dibuat, semuanya dikumpulkan di sini. Ia adalah "buku panduan pekerja" yang pertama kali dilihat oleh AI setiap kali ia dimulakan.

.claude/skills/merupakan alur kerja yang boleh digunakan semula.

Pencipta Claude Code, Boris Cherny, berulang kali menekankan satu perkataan dalam komuniti: "Jika anda melakukan sesuatu lebih daripada sekali setiap hari, jadikan ia sebagai skill atau command."

Satu skill ialah satu kaedah yang boleh dieksekusi. Semakan kod, penghasilan mesej commit, dan penulisan notis pelancaran sepatutnya bukan tugas yang memerlukan pengetikan prompt setiap hari, tetapi sepatutnya hanya memerlukan panggilan skill untuk menghasilkan hasilnya.

.claude/hooks/ adalah penghalang automatik.

Ini adalah bahagian paling penting. Ia tidak bergantung pada penilaian AI sendiri, tetapi blok oleh kod deterministik sebelum AI membuat kesilapan. Inilah sebabnya kami berani membiarkan AI berjalan tanpa pengawasan, kerana sempadan kesilapan telah dihentikan oleh hook.

docs/decisions/ adalah rekod keputusan arsitektur.

Buat AI tidak hanya tahu apa itu kod, tetapi juga mengapa kod begitu.

Ini adalah perkara yang paling sering diabaikan, tetapi juga merupakan titik tuas terbesar untuk kerjasama AI.

tools/ dan src/ adalah lapisan pelaksanaan.

Yang perlu diperhatikan dalam arsitektur ini bukanlah seorang pembangun yang menciptakan direktori yang cantik, tetapi semakin banyak pasukan bebas yang sedang beralih ke arah yang sama: memasukkan model ke dalam satu rangkaian yang terdiri daripada konteks, alat, kebenaran, penilaian, dan kitaran maklum balas.

Projek-projek serupa sudah boleh dilihat di GitHub:

Awesome-claude-code-toolkit oleh rohitg00, claude-code-infrastructure-showcase oleh diet103, dan everything-claude-code oleh affaan-m, semuanya membina persekitaran kerja berteraskan kejuruteraan untuk Claude Code berdasarkan komponen-komponen seperti agen, kemahiran, hook, peraturan, dan konfigurasi MCP.

Ini menunjukkan bahawa alur kerja pengaturcaraan AI yang benar-benar matang bukan hanya bergantung pada model yang lebih kuat, bukan juga hanya pada prompt yang lebih panjang, tetapi melibatkan penanaman model ke dalam sistem kejuruteraan yang boleh digunakan semula, boleh dikawal, boleh dipulihkan, dan boleh diaudit.

Untuk struktur direktori yang spesifik, pelaksanaan setiap pihak tidak sama sepenuhnya.

Eksperimen terhadap batas oleh laboratorium OpenAI

Pada 11 Februari 2026, blog rasmi OpenAI menerbitkan sebuah artikel: >>> Harness engineering: leveraging Codex in an agent-first world<<<

https://openai.com/index/harness-engineering/

Anthropic telah menyesuaikan semula pendekatan arsitektur Claude Code berdasarkan konsep ini; laman web Martin Fowler merumuskannya menjadi satu formula: «Agent=Model+Harness.»

Kata "harness" berasal dari equestrian. Ia merujuk kepada seluruh peralatan kuda, termasuk tali kekang, bit, pelana, dan kepala kuda.

Seekor kuda boleh berlari dengan pantas dan kuat, tetapi ia sendiri tidak tahu ke mana arahnya: seluruh peralatan penarik menentukan arahnya.

Dibandingkan dengan pengaturan AI untuk pemrograman: model itu sendiri sangat berupaya, tetapi ia tidak tahu di mana harus pergi dalam repositori kod anda. Harness ialah stereng + brek + navigasi yang anda ciptakan untuknya.

Eksperimen "1 juta baris tanpa tenaga manusia" dari pasukan Frontier OpenAI pada dasarnya adalah mewujudkan Harness hingga tahap maksimum.

Amalan kejuruteraan utama mereka termasuk perkara-perkara berikut.

Kekangan kuat struktur hierarki.

Dari Types ke Config ke Repo ke Service ke Runtime ke UI, ketergantungan mengalir secara searah dan ditegakkan oleh linter di peringkat CI. Jika agen menulis kod yang melanggar hubungan peringkat? Pembinaan gagal secara terus-menerus.

Mesej ralat linter itu sendiri adalah arahan pembaikan, dan ini adalah butiran paling tidak intuitif.

Ralat lint projek biasa ialah «violation detected», untuk manusia lihat; ralat lint OpenAI Frontier ialah «guna logger.info({event: 'name', …data}) sebagai ganti console.log», arahan untuk Agent yang boleh dibaca dan dibaiki secara langsung.

Dokumen sebagai sumber fakta tunggal. Semua gambar arkaitektur, pelaksanaan rancangan, dan spesifikasi reka bentuk berada di dalam direktori docs/ di dalam repositori. Agen tidak memerlukan sebarang perpustakaan luaran, semuanya ada di dalam repositori.

Sejauh mana kesan perkara ini?

Model tidak berubah, tetapi LangChain menyesuaikan harness, termasuk sistem prompt, alat, middleware, dan modus inferensi, akhirnya meningkatkan skor Terminal Bench 2.0 dari 52.8 menjadi 66.5.

Yang boleh kamu lakukan hari ini

Menciptakan otak projek untuk AI

Masalah kembali kepada pembangun biasa: Jika paradigma telah berubah, sebagai jurutera biasa, anda boleh buat sesuatu hari ini.

Perkara pertama, buat fail CLAUDE.md di direktori utama projek terpenting anda.

Tidak perlu sempurna, tidak perlu panjang. Tulis peraturan struktur pasukan anda, konvensyen penamaan, keperluan ujian, dan kesilapan berulang yang pernah anda alami—versi yang boleh digunakan boleh ditulis dalam 10 minit.

Semasa AI berbuat kesilapan seterusnya, jangan memperbaiki secara manual, tetapi tanya diri sendiri: Apa yang tertinggal di CLAUDE.md?

Perkara kedua, ubah perkara yang diulang setiap hari menjadi skill.

Perhatikan petikan bijak Boris Cherny: "Jika anda melakukan sesuatu lebih daripada sekali setiap hari, jadikan ia sebagai kemahiran atau arahan."

Ulasan kod, penghasilan pesan commit, penulisan penerangan rilis, dan pembaikan jenis bug yang berulang, semuanya seharusnya menjadi kemahiran, bukan perkara yang perlu diketik secara manual setiap hari.

Perkara ketiga, tambahkan hook di tempat yang mudah terperangkap.

Hook adalah bahagian paling berpengaruh dalam 98.4%. Ia tidak bergantung pada AI untuk menjadi lebih pintar, tetapi bergantung pada kod pasti untuk pemeriksaan paksa. Ini adalah proses menterjemahkan pertimbangan jurutera manusia menjadi batasan yang boleh dibaca mesin.

Inti perkara ini bukan pada penulisan kod, tetapi pada penulisan peraturan.

Kata-kata Karpathy di Twitter pada Januari ini yang banyak dibagikan: "Saya telah berubah dari menulis kod secara manual 80% menjadi menyerahkan 80% kepada Agent."

Dalam lima tahun ke depan, lengkung kemampuan jurutera sedang berpindah dari "Berapa banyak baris kod yang saya boleh tulis" kepada "Seberapa ketat persekitaran kerja yang saya boleh reka untuk AI".

Tugas menulis kod sedang diambil alih oleh Agent.

Tetapi mereka yang merancang dunia di mana Agent boleh menulis kod yang baik masih merupakan tugas manusia. Dan ia lebih sukar, lebih penting, dan lebih menarik daripada sebelum ini.

Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.