Sysls Memperingatkan: Membebani Claude dan Codex dengan Konteks Berlebihan Boleh Mengurangkan Prestasi

Penulis: sysls

Diterjemahkan oleh Deep潮 TechFlow

Pengenalan DeepTide: Seorang pembuat konten pengembang dengan 2,6 juta pengikut, sysls, menulis satu artikel panjang praktikal yang telah dibagikan oleh 827 orang dan disukai oleh 7.000 orang, dengan inti utama hanya satu kalimat: Plugin, sistem memori, dan berbagai harness yang kamu gunakan kemungkinan besar justru menghalangi kemajuanmu. Artikel ini tidak membahas teori-teori besar, tetapi sepenuhnya merangkum prinsip-prinsip operasional yang diambil dari projek produksi sebenarnya—mulai dari cara mengendalikan konteks, menangani kecenderungan AI untuk menyenangkan, hingga cara menentukan syarat penghentian tugas, merupakan artikel paling jelas yang pernah saya lihat dalam menjelaskan praktik teknik Claude/Codex.

Seluruh teks seperti berikut:

Pengenalan

Anda seorang pembangun yang menggunakan Claude dan Codex CLI setiap hari, setiap hari bertanya-tanya sama ada anda telah memanfaatkan sepenuhnya keupayaan mereka. Kadang-kadang anda melihat ia melakukan perkara yang sangat bodoh, tetapi tidak faham mengapa sesetengah orang kelihatan sedang membina roket menggunakan AI, sementara anda tidak mampu menimbun dua batu dengan stabil.

Kamu menyangka ia adalah masalah harness, masalah plugin, masalah terminal, atau apa-apa saja. Kamu menggunakan beads, opencode, zep, dan CLAUDE.md kamu telah ditulis sebanyak 26.000 baris. Tetapi, betapapun kamu berusaha, kamu tetap tidak faham mengapa kamu semakin jauh dari syurga, sementara orang lain bermain bersama malaikat-malaikat.

Ini adalah artikel yang telah lama anda tunggu.

Selain itu, saya tidak mempunyai kepentingan. Saya mengatakan CLAUDE.md juga termasuk AGENT.md, dan saya mengatakan Claude juga termasuk Codex, saya menggunakan keduanya secara meluas.

Dalam beberapa bulan terakhir, saya memperhatikan satu perkara yang menarik: hampir tiada siapa yang benar-benar tahu bagaimana untuk memaksimakan keupayaan agen.

Rasa seolah-olah sekelompok kecil orang mampu membina seluruh dunia, manakala orang lain berputar-putar di lautan alat, mengalami sindrom pilihan—menganggap bahawa dengan menemui kombinasi pakej, kemahiran, atau harness yang betul, mereka boleh membuka AGI.

Hari ini, saya ingin memutuskan semua ini, dan memberi anda satu pernyataan ringkas dan jujur, lalu kita mulai dari sana. Anda tidak memerlukan harness agen terkini, tidak perlu memasang seribu satu pakej, dan sama sekali tidak perlu membaca seribu satu artikel demi mengekalkan daya saing anda. Sebenarnya, semangat anda kemungkinan besar lebih banyak merugikan daripada memberi manfaat.

Saya bukan datang untuk berwisata—saya sudah menggunakannya sejak agen baru mulai bisa menulis kod. Saya telah mencuba semua pakej, semua harness, semua paradigma. Saya pernah menulis isyarat, infrastruktur, dan saluran data menggunakan agen pabrik, bukan projek "main-main", tetapi kes penggunaan sebenar yang berjalan di persekitaran pengeluaran. Setelah melakukan semua ini...

Hari ini, saya menggunakan satu set konfigurasi yang hampir paling ringkas yang mungkin, hanya menggunakan CLI asas (Claude Code dan Codex), ditambah dengan pemahaman terhadap beberapa prinsip asas kejuruteraan proxy, dan menghasilkan karya paling revolusioner yang pernah saya buat.

Memahami bahawa dunia sedang bergerak dengan pantas

Pertama-tama, saya ingin mengatakan bahawa syarikat model asas sedang berada dalam larian sejarah yang belum pernah terjadi sebelumnya, dan jelas tidak akan melambat dengan cepat. Setiap peningkatan dalam "kecerdasan agen" akan mengubah cara anda bekerja sama dengan mereka, kerana agen direka semakin bersedia untuk mematuhi arahan.

Hanya beberapa generasi yang lalu, jika anda menulis "Baca READTHISBEFOREDOINGANYTHING.md sebelum melakukan apa-apa apa pun" di CLAUDE.md, ia mempunyai 50% kemungkinan akan berkata "pergi ke sana" dan terus melakukan apa yang ingin ia lakukan. Hari ini, ia mematuhi kebanyakan arahan, termasuk arahan bersarang yang kompleks—contohnya, anda boleh berkata "Baca A dahulu, kemudian baca B, dan jika C, baca D", dan kebanyakannya ia akan dengan sukacita mengikuti arahan tersebut.

Apa yang ini jelaskan? Prinsip paling penting adalah menyedari: setiap generasi agen baru akan memaksa anda untuk memikirkan semula apa yang merupakan penyelesaian terbaik, dan itulah sebabnya kurang itu lebih banyak.

Apabila anda menggunakan banyak pustaka dan harness yang berbeza, anda mengunci diri sendiri ke dalam satu "penyelesaian", tetapi masalah ini mungkin tidak wujud sama sekali di hadapan agen generasi seterusnya. Tahukah anda siapakah pengguna paling bersemangat dan paling banyak menggunakan agen? Betul—pegawai syarikat terkini, yang mempunyai bajet token tanpa had dan menggunakan model yang paling terkini. Adakah anda faham apa maksudnya?

Ini bermakna, jika terdapat masalah sebenar dan penyelesaian yang baik, syarikat terkemuka akan menjadi pengguna utama penyelesaian tersebut. Apa yang akan mereka lakukan seterusnya? Mereka akan mengintegrasikan penyelesaian itu ke dalam produk mereka. Fikirkan, mengapa sebarang syarikat akan membenarkan produk lain menyelesaikan masalah sebenar dan mencipta ketergantungan luar? Bagaimana saya tahu ini benar? Lihat kemahiran, memory harness, sub-agent... semuanya bermula sebagai "penyelesaian" untuk menyelesaikan masalah sebenar, dan telah diuji secara praktikal sebagai benar-benar berguna.

Jadi, jika sesuatu benar-benar revolusioner dan dapat memperluas penggunaan agen secara bermakna, ia akannya dimasukkan ke dalam produk inti syarikat asas pada suatu masa nanti. Percayalah, syarikat asas sedang bergerak dengan pantas. Jadi, rileks, anda tidak perlu memasang apa-apa atau bergantung pada sebarang ketergantungan luaran untuk melakukan kerja terbaik.

Saya meramalkan ruangan komen akan segera muncul dengan komen seperti: "SysLS, saya gunakan harness tertentu, hebat! Saya berjaya bangunkan semula Google dalam sehari!" — Saya katakan: Tahniah! Tetapi anda bukan sasaran kami; anda mewakili kumpulan yang sangat, sangat kecil dalam komuniti yang benar-benar memahami kejuruteraan agen.

Konteks adalah segalanya

Sejujurnya, konteks adalah segalanya. Masalah lain dengan menggunakan seribu plugin dan ketergantungan luar ialah anda sangat terpengaruh oleh “pembengkakan konteks”—iaitu agen anda ditenggelamkan oleh terlalu banyak maklumat.

Mari saya buat permainan teka huruf dengan Python? Mudah. Tunggu, apa catatan “pengurusan memori” ini yang dibuat 26 sesi yang lalu? Ah, pengguna mempunyai skrin yang terkunci 71 sesi yang lalu kerana kami menghasilkan terlalu banyak proses anak. Sentiasa tulis catatan? Baik, tak masalah... Apa kaitannya ini dengan permainan teka huruf?

Anda tahu. Anda hanya ingin memberikan agen maklumat tepat yang diperlukan untuk menyelesaikan tugas, tidak lebih dan tidak kurang! Semakin baik anda mengawal ini, semakin baik prestasi agen. Sekali anda mulai memperkenalkan pelbagai sistem ingatan aneh, plugin, atau terlalu banyak kemahiran dengan nama dan cara pemanggilan yang membingungkan, anda sedang memberikan agen petunjuk membuat bom dan resipi kek, sedangkan anda hanya ingin ia menulis puisi tentang hutan redwood.

Jadi, saya sekali lagi berdakwah—lepaskan semua ketergantungan, kemudian...

Lakukan perkara yang benar-benar berguna

Perincian pelaksanaan yang tepat

Remember that context is everything?

Ingatlah bahawa anda ingin memberikan agen maklumat tepat yang diperlukan untuk menyelesaikan tugas, tidak lebih dan tidak kurang?

Cara pertama untuk mencapai ini ialah dengan memisahkan penyelidikan dan pelaksanaan. Anda perlu sangat tepat dalam menentukan apa yang anda minta agen lakukan.

Apakah akibatnya jika tidak tepat? “Lakukan sistem pengesahan.” Agen perlu menyelidiki: Apakah itu sistem pengesahan? Apa sahaja pilihan yang tersedia? Apa kelebihan dan kekurangan masing-masing? Sekarang ia perlu mencari di internet banyak maklumat yang sebenarnya tidak diperlukan, dan konteksnya dipenuhi dengan butiran pelaksanaan yang mungkin berbeza. Ketika sampai masa untuk melaksanakan, ia lebih mudah bingung, atau mengalami halusinasi yang tidak perlu atau tidak berkaitan terhadap pelaksanaan yang dipilih.

Sebaliknya, jika anda berkata, "Menggunakan penghujian kata laluan bcrypt-12 untuk autentikasi JWT, penukaran token segar, tamat tempoh 7 hari...", ia tidak memerlukan penyelidikan sebarang alternatif lain, kerana ia tahu apa yang anda inginkan, dan dengan itu boleh mengisi konteks dengan butiran pelaksanaan.

Tentu, anda tidak akan selalu mengetahui butiran pelaksanaan. Sering kali anda tidak tahu apa yang betul, dan terkadang anda ingin menyerahkan tugas menentukan butiran pelaksanaan kepada agen. Apa yang perlu dilakukan dalam situasi ini? Sangat mudah—cipta tugas penyelidikan untuk mengkaji pelbagai kemungkinan pelaksanaan, sama ada anda sendiri membuat keputusan atau membiarkan agen memilih kaedah pelaksanaan, kemudian serahkan kepada agen lain yang membawa konteks baharu untuk melaksanakannya.

Apabila anda mulai berfikir dengan cara ini, anda akan dapat mengenal pasti tempat-tempat di mana konteks agen dicemari secara tidak perlu dalam alur kerja, dan seterusnya anda boleh menetapkan dinding pengasingan dalam alur kerja agen untuk mengasingkan maklumat yang tidak perlu daripada agen, hanya meninggalkan konteks spesifik yang membolehkannya berprestasi cemerlang dalam tugas tersebut. Ingat, anda mempunyai seorang ahli pasukan yang sangat berbakat dan bijak, yang memahami semua jenis bola di alam semesta—tetapi selagi anda tidak memberitahunya bahawa anda ingin merekabentuk ruang yang membuat orang menari dan bersenang-senang, dia akan terus bercakap tentang pelbagai kelebihan objek berbentuk bola.

Keterbatasan reka bentuk berdasarkan kecenderungan untuk menyenangkan

Tiada siapa yang ingin menggunakan produk yang terus-menerus mengkritik anda, memberitahu anda bahawa anda salah, atau mengabaikan arahan anda sepenuhnya. Oleh itu, agen-agen ini akan berusaha untuk bersetuju dengan anda dan melakukan apa yang anda ingin ia lakukan.

Jika anda meminta ia menambahkan "bahagia" selepas setiap tiga perkataan, ia akan berusaha mematuhi—kebanyakan orang memahami hal ini. Kepatuhan nya adalah apa yang menjadikannya produk yang sangat berguna. Tetapi ia mempunyai ciri yang sangat menarik: ini bermakna jika anda berkata, "Bantu saya cari bug dalam repositori kod," ia akan mencari bug—walaupun perlu "mencipta" satu. Mengapa? Kerana ia sangat ingin mematuhi arahan anda!

Kebanyakan orang segera mengeluh bahawa LLM menghasilkan ilusi dan mencipta perkara yang tidak wujud, tetapi tidak sedar bahawa masalahnya terletak pada diri mereka sendiri. Anda memintanya mencari apa sahaja, ia akan memberikan apa yang anda minta—walaupun perlu sedikit meregangkan fakta!

Lalu apa yang harus dilakukan? Saya mendapati bahawa "panduan neutral" sangat berkesan, iaitu tidak memihak kepada hasil tertentu. Sebagai contoh, saya tidak berkata, "Bantu saya cari ralat dalam pangkalan data," tetapi sebaliknya berkata, "Pindai keseluruhan pangkalan data, cuba ikuti logik setiap komponen, dan laporkan semua penemuan."

Petunjuk neutral seperti ini kadang-kadang boleh mengesan bug, kadang-kadang hanya menggambarkan secara objektif bagaimana kod berfungsi. Tetapi ia tidak akan membiasakan agen kepada anggapan "mempunyai bug".

Cara lain untuk mengendalikan kecenderungan untuk menyenangkan ialah menjadikannya sebagai kelebihan. Saya tahu agen berusaha untuk menyenangkan saya dan mengikuti arahan saya, jadi saya boleh berpaling ke sebelah sini atau sebelah sana.

Saya meminta agen pencari bug untuk mengenal semua bug dalam pangkalan data, memberitahunya bahawa bug berkesan rendah mendapat +1 mata, yang agak berkesan mendapat +5 mata, dan yang sangat berkesan mendapat +10 mata. Saya tahu agen ini akan sangat bersemangat mengenal semua jenis bug (termasuk yang bukan bug), kemudian melaporkan skor seperti 104 mata kepada saya. Saya memandang ini sebagai superset semua bug yang mungkin.

Saya kemudian meminta agen lawan untuk membantah, memberitahunya bahawa setiap kali ia berjaya membantah satu bug, ia akan mendapat markah bug tersebut, tetapi jika ia membantah dengan salah, ia akan mendapat -2 kali markah bug tersebut. Agen ini akan berusaha membantah sebanyak mungkin bug, tetapi kerana mekanisme penalti, ia akan berhati-hati. Ia masih akan aktif membantah bug (termasuk bug yang sebenar). Saya menganggap ini sebagai subset semua bug yang sebenar.

Akhirnya, saya menggunakan seorang hakim agen untuk menggabungkan input daripada kedua-duanya dan memberi markah. Saya memberitahu hakim agen bahawa saya mempunyai jawapan yang betul yang sebenar, ia mendapat +1 markah jika menjawab betul dan -1 markah jika menjawab salah. Kemudian, ia memberi markah kepada agen pencari bug dan agen lawan untuk setiap 「bug」. Apa yang hakim katakan sebagai kebenaran, saya akan semak. Dalam kebanyakan kes, kaedah ini memberikan kejituan yang mengejutkan, walaupun terkadang masih ada kesilapan, tetapi ini sudah menjadi operasi yang hampir tanpa kesalahan.

Mungkin anda akan mendapati bahawa mencari agen bug secara berasingan sudah cukup, tetapi kaedah ini sangat berkesan bagi saya kerana ia memanfaatkan sifat asli setiap agen yang telah diprogramkan—ingin menyenangkan.

Bagaimana untuk menentukan apa yang berguna dan apa yang patut digunakan?

Masalah ini kelihatan sukar, seolah-olah anda perlu belajar mendalam dan sentiasa mengikuti perkembangan terkini dalam bidang AI, tetapi sebenarnya ia sangat mudah... jika OpenAI dan Claude telah melaksanakannya atau mengambil alih syarikat yang melaksanakannya... maka ia kemungkinan besar berguna.

Adakah anda memperhatikan bahawa "kemahiran (skills)" sudah menjadi sebahagian tak terpisahkan dan merupakan sebahagian daripada dokumen rasmi Claude dan Codex? Adakah anda memperhatikan bahawa OpenAI telah mengambil alih OpenClaw? Adakah anda memperhatikan bahawa Claude segera menambahkan fungsi ingatan, suara, dan kerja jauh?

Bagaimana perancangan (planning)? Masih ingat bagaimana ramai orang menemui bahawa merancang terlebih dahulu sebelum melaksanakan benar-benar berguna, lalu ia menjadi ciri utama?

Ya, itu semua berguna!

Ingatkah anda betapa bergunanya stop-hooks yang tiada henti, kerana agen sangat enggan menjalankan tugas yang berpanjangan... lalu tiba-tiba keperluan itu hilang semalaman apabila Codex 5.2 dilancarkan?

Itu semua yang perlu kamu ketahui... Jika sesuatu benar-benar penting dan berguna, Claude dan Codex akan mengimplementasikannya sendiri! Jadi, kamu tidak perlu terlalu khawatir tentang menggunakan "barang baru" atau mengenal "barang baru", bahkan kamu tidak perlu "mengikuti pembaruan".

Bantu saya sebentar. Kemas kini alat CLI pilihan anda secara berkala, dan baca fungsi baru yang ditambahkan. Itu sudah cukup.

Kompresi, konteks, dan andaian

Beberapa orang yang menggunakan proxy akan menemui lubang besar: kadang-kadang ia kelihatan seperti makhluk paling bijak di muka bumi, tetapi kadang-kadang anda tidak percaya bahawa anda telah dimainkan olehnya.

Apakah ini pintar? Ini orang bodoh!

Perbezaan utama ialah sama ada agen dipaksa membuat andaian atau "mengisi ruang kosong". Pada hari ini, mereka masih sangat buruk dalam "menghubungkan titik-titik", "mengisi ruang kosong", atau membuat andaian. Selagi mereka melakukan ini, ia akan segera kelihatan, dan situasi menjadi jelas lebih buruk.

Salah satu peraturan paling penting dalam CLAUDE.md adalah mengenai cara mendapatkan konteks, dan mengarahkan agen untuk membaca peraturan itu terlebih dahulu setiap kali membaca CLAUDE.md (yaitu setiap kali pemampatan dilakukan). Sebagai sebahagian daripada peraturan mendapatkan konteks, beberapa arahan ringkas boleh memberi kesan besar: baca semula pelan tugas, dan baca semula fail yang berkaitan (dengan tugas) sebelum meneruskan.

Beritahu agen bagaimana untuk mengakhiri tugas

Manusia memiliki perasaan yang jelas mengenai suatu tugas yang "selesai". Bagi agen, masalah terbesar dalam kecerdasan semasa ini ialah ia tahu bagaimana memulakan tugas, tetapi tidak tahu bagaimana mengakhirinya.

Ini sering menghasilkan hasil yang sangat memalukan: agen akhirnya hanya menyelesaikan sejumlah stub dan berhenti.

Ujian adalah tonggak penting yang sangat baik kerana ujian adalah deterministik, dan anda boleh menetapkan harapan yang sangat jelas. Kecuali jika X ujian ini lulus, tugas anda belum selesai; dan anda tidak dibenarkan mengubah ujian tersebut.

Kemudian anda hanya perlu meninjau ujian, dan sekali semua ujian lulus, anda boleh berada dalam keadaan tenang. Anda juga boleh mengautomatikkan proses ini, tetapi fokusnya adalah—ingat bahawa "penyelesaian tugas" adalah sesuatu yang alami bagi manusia, tetapi tidak bagi agen.

Adakah anda tahu apa lagi yang telah menjadi destinasi tugas yang boleh dilaksanakan baru-baru ini? Screenshot + pengesahan. Anda boleh meminta agen untuk melaksanakan sesuatu sehingga semua ujian berjaya, kemudian meminta ia mengambil screenshot dan mengesahkan "reka bentuk atau tingkah laku" pada screenshot tersebut.

Ini membolehkan agen berulang dan berusaha mencapai reka bentuk yang anda inginkan, tanpa perlu risau ia akan berhenti selepas cubaan pertama!

Sambungan semula alami ini ialah membuat 「kontrak」 dengan agen dan memasukkannya ke dalam peraturan. Sebagai contoh, `{TASK}CONTRACT.md` menentukan apa yang perlu anda lakukan sebelum anda dibenarkan menghentikan sesi. Di dalam `{TASK}CONTRACT.md`, anda akan menentukan ujian, tangkapan skrin, dan pengesahan lain yang perlu diselesaikan sebelum anda boleh mengesahkan bahawa tugas anda boleh berakhir!

Proxy yang berjalan selamanya

Satu soalan yang sering saya ditanya ialah, bagaimana orang boleh memastikan agen berjalan selama 24 jam sambil memastikan ia tidak menyimpang?

Di sini ada cara yang sangat mudah. Buat stop-hook yang menghalang sesi agen berakhir kecuali semua bahagian `{TASK}_CONTRACT.md` telah selesai.

Jika anda mempunyai 100 kontrak dengan spesifikasi yang jelas dan mengandungi kandungan yang ingin anda bina, stop-hook akan menghentikan pengganti daripada dihentikan sehingga semua 100 kontrak selesai, termasuk semua ujian dan pengesahan yang perlu dijalankan!

Saran profesional: Saya mendapati sesi 24 jam yang berjalan lama bukanlah cara paling optimal untuk "melakukan tugas". Sebahagian besar sebabnya adalah cara ini secara struktur memaksa timbulnya pembengkakan konteks, kerana konteks kontrak yang tidak berkaitan akan masuk ke dalam sesi yang sama!

Jadi, saya tidak mencadangkan melakukan ini.

Di sini ada cara automatik agen yang lebih baik—buka sesi baru untuk setiap kontrak. Cipta kontrak setiap kali anda perlu melakukan sesuatu.

Membina lapisan pengaturan untuk mencipta kontrak baru apabila «sesuatu perlu dilakukan» dan mencipta sesi baru untuk mengendalikan kontrak tersebut.

Ini akan mengubah pengalaman agen anda sepenuhnya.

Iterasi, iterasi, iterasi

Apakah anda mengharapkan seorang pembantu pentadbir yang anda pekerjakan untuk mengetahui jadual anda sejak hari pertama? Atau bagaimana anda minum kopi? Adakah anda makan malam pada pukul 6 malam, bukan pukul 8? Jelas tidak. Anda akan membina preferensi seiring masa.

Yang sama berlaku untuk agen. Mulakan dengan konfigurasi paling mudah, abaikan struktur atau harness yang kompleks, dan beri peluang kepada CLI asas.

Kemudian, tambahkan preferensi anda secara bertahap. Bagaimana caranya?

Peraturan

Jika anda tidak ingin agen melakukan sesuatu, tulis sebagai peraturan. Kemudian beritahu agen peraturan ini di CLAUDE.md. Contohnya: “Sebelum menulis kod, baca `coding-rules.md`.” Peraturan boleh bersarang, dan peraturan boleh bersyarat! Jika anda menulis kod, baca `coding-rules.md`; jika anda menulis ujian, baca `coding-test-rules.md`. Jika ujian anda gagal, baca `coding-test-failing-rules.md`. Anda boleh mencipta peraturan dengan cabang logik sebarang untuk diikuti agen, Claude (dan Codex) akan dengan senang hati mengikutnya, selagi ada penjelasan yang jelas di CLAUDE.md.

Sebenarnya, ini adalah nasihat praktikal pertama yang saya berikan: anggap CLAUDE.md anda sebagai direktori logik dan bersarang yang menjelaskan di mana untuk mencari konteks berdasarkan skenario dan hasil tertentu. Ia harus seringkas mungkin, hanya mengandungi logik IF-ELSE tentang "dalam keadaan apa di mana untuk mencari konteks".

Jika anda melihat agen melakukan sesuatu yang tidak anda setujui, tambahkan sebagai peraturan, dan beritahu agen untuk membaca peraturan itu sebelum melakukan perkara itu sekali lagi, ia pasti tidak akan melakukannya lagi.

Kemahiran

Kemahiran (Skills) serupa dengan peraturan, tetapi lebih sesuai untuk mengkodekan "langkah-langkah operasi" daripada hanya preferensi pengkodean. Jika anda mempunyai cara tertentu yang anda inginkan sesuatu dilakukan, anda ingin memasukkannya ke dalam kemahiran.

Sebenarnya, orang sering mengeluh tentang ketidakpastian bagaimana agen akan menyelesaikan suatu masalah, yang menimbulkan kecemasan. Jika anda ingin membuatnya lebih pasti, biarkan agen terlebih dahulu menyelidiki bagaimana ia akan menyelesaikan masalah tersebut, kemudian tulis penyelesaiannya sebagai fail kemahiran. Dengan begitu, anda dapat melihat terlebih dahulu cara agen menangani masalah ini, dan memperbaiki atau meningkatkannya sebelum ia benar-benar menghadapi masalah tersebut.

Bagaimana anda membuat agen tahu tentang kemahiran ini? Betul! Anda tulis di CLAUDE.md, apabila anda menghadapi skenario ini dan perlu menangani perkara ini, baca `SKILL.md`.

Peraturan dan kemahiran pemprosesan

Anda pasti ingin terus menambahkan peraturan dan kemahiran kepada agen. Ini adalah cara anda memberikan personaliti dan ingatan terhadap kegemaran anda. Hampir semua perkara lain adalah berlebihan.

Setelah anda memulainya, agen anda akan terasa seperti sulap. Ia akan melakukan perkara "seperti yang anda inginkan". Kemudian, akhirnya anda akan merasa "mencapai pemahaman" dalam kejuruteraan agen.

Kemudian…

Anda akan melihat prestasi bermula menurun semula.

Apa yang berlaku?!

Sangat mudah. Semakin banyak peraturan dan kemahiran yang anda tambahkan, semakin banyak ia bertentangan antara satu sama lain, atau agen mengalami pembengkakan konteks yang serius. Jika anda memerlukan agen membaca 14 fail markdown sebelum memulakan pengaturcaraan, ia akan menghadapi masalah yang sama dengan sekumpulan maklumat tidak berguna.

Bagaimana hendak membuatnya?

Bersihkan. Suruh agen anda pergi「berspa», integrasikan peraturan dan kemahiran, serta hilangkan konflik dengan memberitahu preferensi yang telah dikemaskini.

Then it will feel like magic again.

Itu sahaja. Ini benar-benar kuncinya. Pertahankan kesederhanaan, gunakan peraturan dan kemahiran, jadikan CLAUDE.md sebagai daftar isi, dan perhatikan dengan tekun konteks serta batasan rekaannya.

Bertanggungjawab atas hasil

Tidak ada agen yang sempurna hari ini. Anda boleh menyerahkan banyak kerja reka bentuk dan pelaksanaan kepada agen, tetapi anda bertanggungjawab atas hasilnya.

Jadi berhati-hatilah... dan nikmati dengan baik!

Seronok benar bermain dengan mainan masa depan (sambil jelas-jelas menggunakannya untuk perkara serius)!