Anthropic Mengklaim Lintasan Peningkatan Diri AI Menjadi Lebih Jelas, Memicu Perdebatan Naratif IPO

Oleh | Huruf AI

Anthropic mempublikasikan satu artikel panjang semalam, berjudul "When AI builds itself", yang kedengarannya seperti salah satu novel sains fiksi Asimov, dan topiknya juga benar-benar konsep yang sangat sains fiksi: recursive self-improvement.

Claude

Secara ringkas, dahulu penyelidik manusia menulis kod, menjalankan eksperimen, dan melatih model untuk membuat AI menjadi lebih kuat. Tetapi jika AI itu sendiri mula terlibat dalam merekabentuk, melatih, menguji, dan mengoptimumkan versi seterusnya, maka kelajuan kemajuan AI tidak lagi hanya didorong oleh manusia, tetapi mungkin bermula dengan “evolusi diri” AI.

Untuk itu, Anthropic membuat seruan:

Kami percaya bahawa jika dunia boleh memilih untuk memperlambat atau menghentikan sementara pembangunan AI terkini, membolehkan struktur sosial dan penyelidikan keselarasan mengejar kemajuan teknologi, ia akan memberi manfaat besar kepada dunia.

Perkataan ini kedengaran seperti amaran keselamatan, tetapi pada masa Anthropic bersiap untuk IPO, ia sukar untuk tidak dilihat sebagai persiapan naratif lain: Claude terlalu berguna sehingga mulai menciptakan Claude generasi seterusnya sendiri.

Badai baru telah muncul

Untuk menunjukkan bahawa AI semakin banyak terlibat dalam pembangunan AI itu sendiri, Anthropic telah memaparkan banyak data dalaman.

Sebagai contoh, sehingga Mei 2026, lebih daripada 80% kod yang digabungkan ke dalam repositori Anthropic ditulis oleh Claude. Sebelum pelancaran Claude Code, nombor ini hanya berada dalam angka tunggal.

Pada suku kedua tahun 2026, menurut statistik Anthropic, jumlah kod yang digabungkan setiap hari oleh jurutera telah meningkat sebanyak kira-kira 8 kali ganda berbanding tahun 2024.

Claude

Yang lebih patut diperhatikan selain jumlah kod ialah Claude sedang menangani masalah kejuruteraan yang lebih terbuka.

Anthropic menyatakan bahawa dalam setahun terakhir, frekuensi di mana pekerja memperbaiki Claude, mengembalikan Claude ke jalan yang betul, atau mengambil alih tugas di tengah jalan terus menurun. Perubahan ini tidak hanya berlaku pada tugas-tugas ringkas, tetapi juga pada tugas terbuka yang paling kompleks.

Tugas terbuka merujuk kepada masalah yang tidak mempunyai panduan yang jelas. Contohnya, sistem gagal atau tugas latihan terhenti; jurutera sendiri tidak tahu bentuk jawapannya pada awalnya, dan hanya boleh mengesan serta menilai sambil bergerak.

Tugas-tugas semacam ini dahulunya paling bergantung kepada pengalaman manusia, tetapi dalam tugas-tugas yang paling terbuka, kejayaan Claude telah mencapai 76% pada Mei 2026, meningkat 50 peratus dalam tempoh enam bulan.

Claude

Bukan hanya menulis kod, Anthropic juga menggunakan Claude untuk semakan kod, memeriksa bug, lubang keselamatan, dan kecacatan lainnya. Mereka menganalisis semula dan mendapati bahawa jika setiap perubahan kod pada masa lalu telah melalui semakan automatik oleh Claude, sekitar sepertiga bug yang menyebabkan kejadian di talian claude.ai boleh dihentikan sebelum dilancarkan.

Lebih lanjut, Claude telah mula terlibat dalam proses penyelidikan.

Anthropic mempunyai ujian tetap: memberikan kod latihan model kecil kepada Claude, dan meminta Claude untuk mencari cara mempercepatkan pelaksanaan kod tanpa mengubah hasil yang betul. Pada Mei 2025, Claude Opus 4 mampu mencapai percepatan sebanyak 3 kali; pada April 2026, Claude Mythos Preview telah meningkatkan nombor ini kepada kira-kira 52 kali.

Anthropic juga menyebutkan satu kesan kajian keselamatan AI terbuka. Mereka memberikan satu soalan kepada agen yang digerakkan oleh Claude: Adakah model yang lebih lemah mampu memantau model yang lebih kuat dengan boleh dipercayai?

Proses ini memerlukan pembentukan hipotesis, pengujian hipotesis, dan perkongsian penemuan secara selari antara agen, diulang secara berulang-ulang.

Dua penyelidik manusia menghabiskan seminggu untuk menutup jurang sebanyak kira-kira 23%; sementara Claude menutup 97% dengan penggunaan kuasa komputasi sebanyak kira-kira 800 jam dan $18,000.

Keputusan ini tentu mempunyai batasan, masalahnya dipilih oleh manusia, kriteria penilaian juga ditetapkan oleh manusia, dan keputusan tersebut belum sepenuhnya dipindahkan ke model berskala pengeluaran. Namun, ia masih menunjukkan bahawa Claude sudah mampu mereka eksperimen, melaksanakan, dan mengiterasi sendiri dalam kerangka penyelidikan yang arahnya telah ditetapkan oleh manusia.

Selain itu, apabila penyelidik manusia tersesat, Claude masih boleh memberikan penilaian langkah seterusnya yang lebih baik.

Anthropic mengambil 129 sesi penyelidikan internal Claude Code, di mana penyelidik manusia dan Claude bekerja sama menyelesaikan masalah penyelidikan terbuka. Anthropic memilih beberapa titik di mana manusia kemudian membuktikan bahawa mereka telah mengambil jalan yang tidak langsung, kemudian memberikan konteks sebelum titik tersebut kepada versi berbeza Claude untuk melihat apa cadangan yang akan diberikan. Selepas itu, Claude judge lain yang mengetahui kesudahan penuh sesi tersebut menilai: cadangan model atau pilihan manusia pada masa itu, yang lebih baik.

Hasil menunjukkan bahawa Claude semakin mampu mencadangkan langkah seterusnya yang lebih baik pada nod-nod di mana penyelidik manusia telah dibuktikan mempunyai ruang untuk peningkatan selepas kejadian.

Claude

Di masa lalu, kemajuan model AI terutama didorong oleh penyelidik dan jurutera manusia. Manusia menentukan eksperimen apa yang perlu dilakukan, menulis kod, melatih model, dan mendorong peningkatan fungsi AI.

Sekarang, semakin banyak peringkat dalam rantai ini mulai diambil alih oleh Claude.

Anthropic memberikan jadual peringkat yang sangat intuitif:

Claude

Pada tahun 2021 hingga 2023, Anthropic tidak berbeza daripada syarikat teknologi biasa, di mana manusia menulis kod dan dokumen di komputer riba.

Pada tahun 2023 hingga 2025, chatbot mula memasuki alur kerja. Jurutera meminta model menghasilkan petikan kod, kemudian menyalinnya ke dalam editor.

Pada tahun 2025 hingga 2026, agen pemrograman muncul, Claude mula mampu menulis dan mengubah kod secara bebas, kadang-kadang bahkan mampu menyelesaikan keseluruhan fail secara berdiri sendiri.

Hingga hari ini, agen sudah boleh menjalankan kod sendiri dan juga mengalihkan tugas yang memakan berjam-jam kepada agen lain.

Selepas itu, ia adalah peringkat yang benar-benar menjadi kebimbangan Anthropic: gelung tertutup.

Jika hari itu tiba, versi seterusnya Claude mungkin terus diperbaiki oleh Claude sendiri—ini dikenali sebagai recursive self-improvement, peningkatan diri berulang.

Anthropic menyatakan dengan berhati-hati dalam teks tersebut: kami belum sampai ke tahap itu, dan peningkatan diri rekursif bukanlah sesuatu yang pasti terjadi. Namun, ia tetap menekankan bahawa jalan menuju tahap tersebut telah mulai kelihatan.

Oleh itu, Anthropic membincangkan pengurangan kelajuan, bahkan penghentian, di akhir artikel tersebut. Maksudnya bukan semua syarikat AI berhenti beroperasi sekarang, tetapi bahawa jika risiko peningkatan diri AI terus meningkat di masa depan, makmal terkini memerlukan mekanisme pengurangan kelajuan yang terkoordinasi dan boleh disahkan.

Dengan kata lain, “titik singulariti” akan segera tiba, dan umat manusia mesti mengawalnya.

Claude yang tak terbendung

Jika dilihat secara permukaan, ini adalah dokumen keselamatan yang sangat proaktif. Anthropic membincangkan peningkatan diri berulang, bagaimana AI mungkin memperbaiki dirinya sendiri dengan semakin cepat, dan bagaimana masyarakat manusia perlu bersedia sedini mungkin dengan mekanisme perlambatan dan penghentian.

Tetapi pada titik masa Anthropic bersiap untuk IPO, artikel ini mempunyai maksud lain.

Dalam beberapa segi, perkembangan terkini Kilang A sangat mirip dengan pelajar cemerlang yang suka berlagak di kelas—ia memang berupaya, tetapi juga benar-benar berpura-pura.

Ia bukan sekadar berkata, “Kami mempunyai Claude yang sangat kuat,” tetapi melangkah lebih jauh, ia ingin mengatakan, “Claude sedang membantu kami menciptakan Claude yang lebih kuat.”

Jika Anthropic hanya menjual satu model atau satu alat, ia akan sukar untuk benar-benar mengelakkan perbandingan mendatar: Anthropic mempunyai Claude, OpenAI mempunyai GPT; Anthropic mempunyai Claude Code, OpenAI mempunyai Codex; Anthropic merebut pelanggan korporat, OpenAI juga merebut pelanggan korporat. Persaingan antara dua syarikat ini sangat sengit, dan ia bergantung pada siapa yang mampu menceritakan kisah yang lebih besar kepada pasaran.

Perlu diperhatikan bahawa, baru 3 hari yang lalu, OpenAI baru sahaja menulis dalam sebuah dokumen mengenai tata kelola AI mutakhir:

Kami juga melihat tanda-tanda awal peningkatan diri berulang dalam sistem hari ini: perkembangan AI sendiri sedang dipercepat oleh AI.

Ini akan meningkatkan tekanan persaingan antara pembangun dan negara, serta membawa cabaran tata pentadbiran yang tidak dapat diatasi oleh institusi sedia ada.

Tiga hari kemudian, Anthropic segera mengatakan: Jalan Claude menuju peningkatan diri berulang telah mulai kelihatan.

Claude

Jika Claude benar-benar berkembang seperti yang diharapkannya, ia bukan sekadar naratif produk biasa, tetapi akan menjadi roda pendorong penyelidikan dan pembangunan.

Claude menulis kod, menjalankan eksperimen, mengoptimumkan proses latihan, dan seterusnya mengurangkan insiden dalam produk Anthropic sendiri... Sekali sistem ini berjalan, Claude bukan sekadar produk Anthropic, tetapi juga alat penghasilan penting Anthropic.

Pengguna melihat produk bernama Claude, pelanggan korporat membeli kemampuan Claude, tetapi apa yang sebenarnya ingin Anthropic tonjolkan kepada pasaran modal ialah: Claude telah disematkan ke dalam proses dasar pengembangan model canggih, dan ia ditempatkan di dalam enjin Anthropic.

Pasar modal paling suka mendengar cerita roda pemutar, seperti periuk harta yang mengalirkan kekayaan tanpa henti: Claude yang lebih kuat membolehkan jurutera Anthropic menggabungkan lebih banyak kod, lebih banyak kod mempercepatkan pengembangan produk dan infrastruktur, pengembangan yang lebih pantas membolehkan penyelidik menjalankan lebih banyak eksperimen, dan lebih banyak eksperimen ini secara berbalik membantu Claude generasi seterusnya menjadi lebih kuat. Selepas Claude generasi seterusnya menjadi lebih kuat, ia akan terus mempercepatkan penyelidikan dan pembangunan Anthropic.

Kadar pengulangan Claude juga menyokong roda ini. Dari segi tarikh pelancaran awam, antara 2023 hingga awal 2025, kemas kini model utama Claude kebanyakannya berlaku setiap tiga hingga empat bulan, tetapi selepas memasuki Claude 4, kemas kini model Anthropic menjadi jauh lebih kerap.

Claude 4 dilancarkan pada Mei 2025, Opus 4.1 pada Ogos, Sonnet 4.5 pada September, Haiku 4.5 pada Oktober, dan Opus 4.5 pada November.

Pada tahun 2026, Opus 4.6 dikeluarkan pada 5 Februari, Sonnet 4.6 pada 17 Februari, Opus 4.7 pada 15 April, dan Opus 4.8 pada 28 Mei. Hanya 42 hari berlalu antara Opus 4.7 dan Opus 4.8.

Anthropic secara zahir mengatakan, "Perkara ini mungkin sangat berbahaya, kita perlu bersedia untuk brek terlebih dahulu," tetapi ia juga secara implisit mengisyaratkan: "Kita sudah melihat apa yang berlaku selepas pedal gas ditekan."

Kedalamannya dalam naratif IPO terletak di sini. Ia sambil menekankan risiko yang tinggi, juga menaikkan kedudukan teknologinya sendiri.

Tidak semua syarikat AI layak membincangkan peningkatan diri berulang; anda perlu membuat pihak luar percaya bahawa AI anda telah memasuki proses pembangunan AI terlebih dahulu, baru anda boleh mengatakan bahawa perkara ini mungkin memerlukan koordinasi global.

OpenAI: Bagaimana mungkin begini?

Seperti yang disebutkan sebelumnya, baru sahaja OpenAI meletakkan peningkatan diri berulang di atas meja sebelum Anthropic menerbitkan artikel panjang ini.

Tetapi kedua-dua syarikat tersebut menyampaikan perkara yang sangat berbeza.

OpenAI artikel《Democratic Governance of Frontier AI》adalah satu rangka dasar yang ditujukan kepada Washington, yang lebih memperhatikan bagaimana mengawal AI hadapan apabila ia terus maju, bukan bagaimana model menjadi lebih kuat.

Kebanyakan kandungan dalam laporan tersebut tidak sesuai untuk diperincikan lebih lanjut, tetapi satu ayat penting: OpenAI mengatakan bahawa tanda awal peningkatan diri berulang sudah dapat dilihat dalam sistem hari ini.

Ayat ini dan artikel panjang Anthropic sebenarnya menunjuk ke arah yang sama.

Hanya sahaja OpenAI berbincang tentang sistem, sementara Anthropic berbincang tentang diri mereka sendiri.

OpenAI bermaksud: perkembangan AI terlalu pantas, struktur pentadbiran semasa mungkin tidak mampu mengejarnya, jadi diperlukan satu set peraturan baharu.

Dan Anthropic secara langsung memaparkan sistem tersebut kepada pasaran, memberitahu bahawa Claude telah memasuki proses pembangunan kami, jadi kami melihat jalan pengautomasian AI.

Permainan ini sangat licik, rasanya di dalam OpenAI mungkin sudah mulai berbisik-bisik—ini benar-benar pencurian ide! Kita yang datang lebih dulu!

Canda belaka, tetapi OpenAI memang perlu bekerja lebih keras, segera keluarkan GPT 5.6.