Anthropic Mengklaim Jalur Peningkatan Diri AI Menjadi Jelas, Memicu Perdebatan Narasi IPO

Oleh | Huruf AI

Anthropic kemarin merilis sebuah artikel panjang berjudul "When AI builds itself", yang terdengar seperti salah satu novel fiksi ilmiah Asimov, dengan tema yang memang merupakan konsep sangat fiksi ilmiah: recursive self-improvement.

Claude

Secara sederhana, dulu peneliti manusia menulis kode, menjalankan eksperimen, dan melatih model untuk membuat AI menjadi lebih kuat. Namun, jika AI mulai terlibat dalam merancang, melatih, menguji, dan mengoptimalkan versi berikutnya sendiri, maka kecepatan kemajuan AI tidak lagi hanya didorong oleh manusia, tetapi mungkin mulai dipicu oleh “evolusi mandiri” AI.

Untuk ini, Anthropic mengeluarkan seruan:

Kami percaya bahwa jika dunia dapat memilih untuk memperlambat atau sementara menghentikan pengembangan AI mutakhir, agar struktur sosial dan penelitian alignment dapat mengejar kemajuan teknologi, ini akan sangat bermanfaat bagi dunia.

Kalimat ini terdengar seperti peringatan keamanan, tetapi pada titik waktu di mana Anthropic bersiap untuk IPO, sulit untuk tidak melihatnya sebagai pra-pementasan narasi lain: Claude terlalu mudah digunakan, bahkan mulai menciptakan Claude generasi berikutnya sendiri.

Badai baru telah muncul

Untuk menunjukkan bahwa AI semakin banyak terlibat dalam pengembangan AI itu sendiri, Anthropic memperlihatkan sejumlah besar data internal.

Misalnya, hingga Mei 2026, lebih dari 80% kode yang digabungkan ke dalam kodebase Anthropic ditulis oleh Claude. Sebelum rilis Claude Code, angka ini hanya berada di angka satuan.

Pada Q2 2026, menurut statistik Anthropic, jumlah kode yang digabungkan setiap hari oleh insinyur telah meningkat sekitar 8 kali lipat dibandingkan tahun 2024.

Claude

Yang lebih patut diperhatikan daripada jumlah kode adalah bahwa Claude sedang menangani masalah teknik yang lebih terbuka.

Anthropic menyatakan bahwa dalam setahun terakhir, frekuensi karyawan memperbaiki Claude, mengarahkan Claude kembali ke jalur yang benar, atau mengambil alih tugas di tengah jalan terus menurun. Perubahan ini tidak hanya terjadi pada tugas sederhana, tetapi juga pada tugas terbuka paling kompleks.

Tugas terbuka merujuk pada masalah tanpa petunjuk jelas. Misalnya, sistem crash atau tugas pelatihan gagal; insinyur awalnya bahkan tidak tahu seperti apa jawabannya, dan harus memeriksa serta menilai sambil berjalan.

Tugas-tugas semacam ini sebelumnya paling bergantung pada pengalaman manusia, namun pada tugas-tugas paling terbuka, tingkat keberhasilan Claude mencapai 76% pada Mei 2026, meningkat 50 poin persentase dalam enam bulan.

Claude

Selain menulis kode, Anthropic juga menggunakan Claude untuk melakukan tinjauan kode, memeriksa bug, kerentanan keamanan, dan cacat lainnya. Mereka melakukan analisis retrospektif dan menemukan bahwa jika setiap perubahan kode di masa lalu telah melalui tinjauan otomatis oleh Claude, sekitar sepertiga bug yang menyebabkan insiden di claude.ai dapat dicegah sebelum diluncurkan.

Lebih lanjut, Claude telah mulai berpartisipasi dalam proses penelitian.

Anthropic memiliki ujian tetap: memberikan kode pelatihan model kecil kepada Claude, lalu meminta Claude untuk mempercepat eksekusi kode tersebut tanpa mengubah hasil yang benar. Pada Mei 2025, Claude Opus 4 kemungkinan dapat mencapai percepatan 3 kali; pada April 2026, Claude Mythos Preview telah mendorong angka ini hingga sekitar 52 kali.

Anthropic juga menyebutkan sebuah kasus penelitian keamanan AI terbuka. Mereka memberikan pertanyaan kepada agen yang didorong oleh Claude: apakah model yang lebih lemah dapat mengawasi model yang lebih kuat secara andal?

Proses ini memerlukan perumusan hipotesis, pengujian hipotesis, dan berbagi temuan secara paralel antar agen, dengan iterasi berulang-ulang.

Dua peneliti manusia menghabiskan satu minggu untuk menutup sekitar 23% kesenjangan; sementara Claude menutup 97% dengan konsumsi daya komputasi sekitar 800 jam dan biaya sekitar $18.000.

Hasil ini tentu memiliki keterbatasan, karena pemilihan masalahnya dilakukan oleh manusia, kriteria penilaian juga ditetapkan oleh manusia, dan hasilnya belum sepenuhnya diterapkan pada model berskala produksi. Namun, hal ini tetap menunjukkan bahwa Claude sudah dapat merancang eksperimen, melaksanakan, dan mengiterasi sendiri dalam kerangka penelitian yang arahnya telah ditetapkan oleh manusia.

Selain itu, ketika peneliti manusia salah jalan, Claude masih dapat memberikan penilaian langkah selanjutnya yang lebih baik.

Anthropic mengambil 129 sesi penelitian internal Claude Code, di mana peneliti manusia dan Claude bekerja sama untuk menyelesaikan masalah penelitian terbuka. Anthropic memilih beberapa titik di mana manusia kemudian terbukti mengambil jalan yang tidak efisien, lalu memberikan konteks sebelum titik tersebut kepada berbagai versi Claude untuk melihat rekomendasi langkah selanjutnya yang diberikan. Selanjutnya, sebuah Claude judge yang mengetahui hasil akhir sesi tersebut menilai: rekomendasi model atau pilihan manusia pada saat itu, mana yang lebih baik.

Hasil menunjukkan bahwa pada titik-titik di mana para peneliti manusia telah terbukti memiliki ruang untuk perbaikan, Claude semakin mampu mengusulkan langkah selanjutnya yang lebih baik.

Claude

Di masa lalu, kemajuan model AI terutama didorong oleh para peneliti dan insinyur manusia. Manusia menentukan eksperimen apa yang akan dilakukan, menulis kode, melatih model, dan mendorong iterasi fungsi AI.

Sekarang, semakin banyak tahapan dalam rantai ini yang diambil alih oleh Claude.

Anthropic memberikan tabel tahapan yang sangat intuitif:

Claude

Dari 2021 hingga 2023, Anthropic tidak berbeda dengan perusahaan teknologi biasa, semuanya dilakukan oleh manusia yang menulis kode dan dokumen di laptop mereka.

Dari 2023 hingga 2025, chatbot mulai memasuki alur kerja. Insinyur meminta model untuk menghasilkan potongan kode, lalu menyalinnya ke editor.

Pada tahun 2025 hingga 2026, agen pemrograman muncul, Claude mulai mampu menulis dan mengubah kode secara mandiri, terkadang bahkan dapat menyelesaikan seluruh file secara independen.

Hari ini, agen sudah dapat menjalankan kode sendiri dan menugaskan pekerjaan yang memakan waktu berjam-jam kepada agen lain.

Selanjutnya adalah tahap yang benar-benar dikhawatirkan oleh Anthropic: loop tertutup.

Jika hari itu tiba, versi lanjutan Claude mungkin terus ditingkatkan oleh Claude sendiri—ini disebut recursive self-improvement, atau perbaikan diri rekursif.

Anthropic berbicara dengan hati-hati dalam artikel tersebut: kami belum sampai pada tahap itu, dan peningkatan diri rekursif bukanlah sesuatu yang pasti terjadi. Namun, ia tetap menekankan bahwa jalur menuju tahap tersebut mulai menjadi terlihat.

Oleh karena itu, Anthropic membahas perlambatan, bahkan penghentian, di akhir artikelnya. Maksudnya bukan bahwa semua perusahaan AI harus segera menghentikan operasinya sekarang, tetapi bahwa jika risiko peningkatan mandiri AI terus meningkat di masa depan, laboratorium terdepan memerlukan mekanisme perlambatan yang terkoordinasi dan dapat diverifikasi.

Dengan kata lain, "titik singularitas" akan segera tiba, dan umat manusia harus mengendalikannya.

Claude yang Tak Terbendung

Jika dilihat sekilas, ini adalah dokumen keamanan yang sangat proaktif. Anthropic membahas peningkatan diri rekursif, bagaimana AI mungkin semakin cepat meningkatkan dirinya sendiri, dan bagaimana masyarakat manusia perlu bersiap sejak dini dengan mekanisme perlambatan dan penghentian.

Namun, dilihat dari waktu persiapan Anthropic untuk IPO, artikel ini memiliki makna lain.

Dalam beberapa hal, dinamika pabrik A baru-baru ini sangat mirip dengan siswa unggulan di kelas yang sok pintar—memang punya kemampuan, tapi juga sangat berpura-pura.

Ini bukan hanya ingin mengatakan "Kami memiliki Claude yang sangat kuat," tetapi melangkah lebih jauh, ia ingin mengatakan "Claude sedang membantu kami membuat Claude yang lebih kuat."

Jika Anthropic hanya menjual satu model atau satu alat, maka sulit baginya untuk benar-benar lepas dari perbandingan horizontal: Anthropic memiliki Claude, OpenAI memiliki GPT; Anthropic memiliki Claude Code, OpenAI memiliki Codex; Anthropic merebut pelanggan perusahaan, OpenAI juga merebut pelanggan perusahaan. Persaingan antara kedua perusahaan sangat ketat, tergantung pada siapa yang bisa menceritakan kisah yang lebih besar kepada pasar.

Perlu diperhatikan bahwa baru 3 hari yang lalu, OpenAI baru saja menulis dalam sebuah dokumen tentang tata kelola AI canggih:

Kami juga melihat tanda-tanda awal perbaikan diri rekursif dalam sistem hari ini: perkembangan AI sendiri sedang dipercepat oleh AI.

Ini akan memperburuk tekanan kompetisi antara pengembang dan negara, serta membawa tantangan tata kelola yang tidak dapat diatasi oleh lembaga yang ada.

Tiga hari kemudian, Anthropic segera mengatakan: Jalur Claude menuju peningkatan diri rekursif telah mulai terlihat.

Claude

Jika Claude benar-benar berkembang seperti yang diharapkannya, bukan lagi sekadar narasi produk biasa, melainkan akan menjadi roda pengembangan.

Claude menulis kode, menjalankan eksperimen, mengoptimalkan proses pelatihan, dan kemudian mengurangi insiden dalam produk Anthropic sendiri... Setelah sistem ini berjalan, Claude bukan lagi sekadar produk Anthropic, tetapi juga alat produksi penting bagi Anthropic.

Pengguna melihat produk Claude, pelanggan perusahaan membeli kemampuan Claude, tetapi yang sebenarnya ingin diperhatikan oleh Anthropic oleh pasar modal adalah: Claude telah tertanam dalam proses dasar pengembangan model mutakhir, dan ia ditempatkan di dalam mesin Anthropic.

Pasar modal paling suka mendengar cerita roda pelindung, seperti kendi ajaib yang mengalirkan kekayaan: Claude yang lebih kuat memungkinkan insinyur Anthropic untuk menggabungkan lebih banyak kode, lebih banyak kode membuat produk dan infrastruktur beriterasi lebih cepat, iterasi yang lebih cepat memungkinkan peneliti menjalankan lebih banyak eksperimen, dan lebih banyak eksperimen justru membantu Claude generasi berikutnya menjadi lebih kuat. Setelah Claude generasi berikutnya menjadi lebih kuat, ia akan terus mempercepat riset dan pengembangan Anthropic.

Kecepatan iterasi Claude juga mendukung roda ini. Dari waktu rilis publik, dari tahun 2023 hingga awal 2025, pembaruan model utama Claude umumnya setiap tiga hingga empat bulan sekali, tetapi setelah memasuki Claude 4, pembaruan model oleh Anthropic jelas menjadi lebih sering.

Claude 4 dirilis pada Mei 2025, Opus 4.1 pada Agustus, Sonnet 4.5 pada September, Haiku 4.5 pada Oktober, dan Opus 4.5 pada November.

Pada tahun 2026, Opus 4.6 dirilis pada 5 Februari, Sonnet 4.6 dirilis pada 17 Februari, Opus 4.7 dirilis pada 15 April, dan Opus 4.8 dirilis pada 28 Mei. Hanya selang 42 hari antara Opus 4.7 dan Opus 4.8.

Anthropic secara terbuka mengatakan, "Hal ini mungkin berbahaya, kita perlu bersiap untuk rem," tetapi sekaligus juga menyiratkan: "Kami sudah melihat apa yang terjadi setelah akselerator ditekan."

Kehalusan narasi IPO terletak di sini. Di satu sisi, ia menekankan risikonya, di sisi lain, ia juga meningkatkan posisi teknologinya.

Tidak semua perusahaan AI berhak membahas peningkatan diri rekursif; Anda harus terlebih dahulu meyakinkan pihak luar bahwa AI Anda telah memasuki proses pengembangan AI, baru kemudian Anda bisa mengatakan bahwa hal ini mungkin memerlukan koordinasi global.

OpenAI: Bagaimana mungkin ini terjadi?

Seperti disebutkan sebelumnya, tepat sebelum Anthropic menerbitkan artikel panjang ini, OpenAI baru saja membahas peningkatan diri rekursif.

Tetapi kedua perusahaan menyampaikan hal yang sangat berbeda.

OpenAI mempublikasikan "Democratic Governance of Frontier AI", sebuah peta jalan kebijakan yang ditujukan kepada Washington, yang lebih peduli bukan pada "bagaimana model menjadi lebih kuat", melainkan bagaimana mengendalikan AI terdepan yang terus melaju maju.

Sebagian besar konten dalam laporan tersebut tidak cocok untuk dijelaskan lebih lanjut, kecuali satu kalimat kunci: OpenAI mengatakan, dalam sistem saat ini, sudah dapat terlihat tanda-tanda awal dari peningkatan diri rekursif.

Kalimat ini dan artikel panjang Anthropic sebenarnya menunjuk ke arah yang sama.

Hanya saja OpenAI membahas sistem, sedangkan Anthropic membahas dirinya sendiri.

OpenAI berarti: perkembangan AI terlalu cepat, struktur tata kelola yang ada mungkin tidak bisa mengejar, sehingga diperlukan seperangkat aturan baru.

Sementara Anthropic langsung memperlihatkan sistem tersebut kepada pasar, memberi tahu bahwa Claude telah memasuki proses pengembangan kami, sehingga kami melihat jalur akselerasi diri AI.

Ini trik yang sangat cerdas, rasanya di dalam OpenAI mungkin sudah mulai saling bergosip—ini benar-benar pencurian ide! Kita yang datang lebih dulu!

Bercanda saja, tapi OpenAI memang perlu lebih berusaha, segera rilis GPT 5.6.