Claude milik Anthropic kini 'bermimpi' untuk meningkatkan prestasi agen AI

Apakah android bermimpi? Jika mereka bermimpi, apakah mereka memimpikan domba elektronik?

Subkuadratik

Skrin shot filem Blade Runner

Pada tahun 1968, penulis novel asal filem sains fiksi Blade Runner, Philip K. Dick, menaip soalan abstrak dan maju ini di depan mesin ketik, beliau mungkin tidak pernah menyangka bahawa lebih separuh abad kemudian, raksasa teknologi di Silicon Valley akan memberikan jawapan dengan serius.

Ya, mereka tidak hanya boleh bermimpi tentang domba elektronik, tetapi juga boleh memvisualisasikan mimpi tersebut.

Semalam, Anthropic melancarkan serangkaian ciri baharu untuk platform pembinaan agen Managed Agents di perjumpaan pembangun di San Francisco, termasuk perluasan memori, output hasil, kerjasama pelbagai agen, dan "bermimpi (Dreaming)".

Menurut Anthropic sendiri, "memori dan mimpi bersama-sama membentuk sistem memori agen yang stabil dan mampu meningkatkan diri sendiri".

Subkuadratik

Lagi bermimpi, lagi ingatan, rakan-rakan yang tidak terlalu memperhatikan bidang AI mungkin akan penuh dengan soalan, perkataan-perkataan yang merupakan ciri manusia ini, bila pula mula boleh digunakan dengan begitu licin pada AI.

Pada tahun 2024, apabila OpenAI melancarkan siri o1, "siri model AI yang direka untuk mengambil lebih banyak masa berfikir sebelum memberi respons", perkataan "berfikir" digunakan dengan sangat semula jadi, sehingga tiada siapa berhenti untuk bertanya, bagaimana mungkin satu program yang mengira dan meramal token seterusnya boleh dipanggil berfikir?

Seterusnya ialah reasoning (penalaran), memory (ingatan), reflection (refleksi), Imagining (imajinasi), satu per satu membawa perkara-perkara yang hanya boleh dilakukan oleh manusia ke acara pelancaran produk.

Subkuadratik

Skrin shot filem "Paprika" yang membincangkan mimpi

“Berpikir” masih boleh dijelaskan sebagai metafora, “ingatan” juga boleh dianggap sebagai perluasan istilah teknikal, tetapi “bermimpi” benar-benar berlebihan. Selama ribuan tahun, bidang sastra, sejarah, dan filsafat belum mampu mengungkapnya sepenuhnya, namun syarikat AI kini secara langsung menyatakan: kami tidak hanya menciptakan mesin yang mampu berpikir, kami juga menciptakan mesin yang mampu bermimpi.

Apakah yang dimaksud dengan mimpi, adakah sebarang istilah kejuruteraan yang boleh menggambarkan perkara ini dengan tepat selain mimpi?

AI bermimpi pun perlu bayar

Semasa kebocoran kod Claude Code, pengguna internet mendapati bahawa Anthropic sedang bersiap untuk fungsi bernama Auto Dreaming. Pada masa itu, semua orang bertanya-tanya, adakah AI juga memerlukan tidur dan rehat yang mencukupi seperti manusia untuk menjadi lebih fokus dan lebih pintar?

Subkuadratik

Namun, dengan memahami cara kerja AI Agent semasa ini, akan nampak bahawa apa yang disebut sebagai "bermimpi" pada dasarnya hanyalah satu proses pemprosesan log secara automatik secara luar talian.

Agen AI kini mahir dalam menyelesaikan tugas kompleks dengan rantai panjang. Contohnya, "Bantu saya menyelidiki laporan keuangan terkini lima pesaing ini, dan susun dalam jadual." Dalam proses ini, Agen perlu berpindah antara pelbagai laman web, membaca banyak dokumen, memanggil alat yang berbeza, dan mungkin menghadapi halangan akibat mekanisme anti-penggalian, sehingga perlu mencuba semula.

Selepas tugas dalam talian yang panjang dan rumit ini selesai, agen akan meninggalkan log operasi yang besar.

Subkuadratik

Gambar dihasilkan oleh AI

Fungsi "bermimpi" dari Anthropic membolehkan Agen menyemak semula rekod sejarah semasa masa lapang. Ia akan mencari pola, seperti mendapati "setiap kali menghadapi pop-up ini, klik sudut kanan atas untuk menutupnya", untuk mengoptimumkan laluan operasi seterusnya.

「Memori」 bertanggung jawab untuk menangkap apa yang dipelajari semasa bekerja, manakala « Bermimpi » merumuskan memori-memori ini di antara sesi perbualan dan berkongsi di antara Agen yang berbeza.

Secara ringkas, ini adalah mekanisme pembelajaran penguatan dan koreksi diri berdasarkan data historis.

Subkuadratik

Perkenalan Dream: https://platform.claude.com/docs/en/managed-agents/dreams

Pembaruan Dreams dalam Managed Agents pada konvensi pengembang ini adalah tugas pemprosesan latar belakang yang perlu kita picu secara manual. Claude boleh membaca sebanyak 100 sesi sejarah perbualan sekali gus, kemudian menghasilkan memori baharu yang boleh kita semak sebelum memutuskan sama ada untuk menggunakannya atau tidak.

Sementara itu, AutoDream yang telah dilancarkan secara diam-diam di Claude Code sebelum ini akan memeriksa secara latar belakang "adakah perlu bermimpi" setiap kali selesai berbual dengan Agent, dengan pengaturan lalai sekali setiap 24 jam.

Fungsi serupa mimpi juga dimiliki oleh Hermes Agent. Hermes Agent menonjolkan kemampuan belajar dan berevolusi sendiri, ia tidak hanya menyokong pengambilan pengalaman secara automatik daripada tugas-tugas lepas dan menyimpannya dalam fail memori.

Subkuadratik

Salah satu fungsi bernama Curator juga boleh mengatur secara automatik panduan operasi yang diringkaskan tersebut menjadi Skill.

Kemahiran-kemahiran ini akan dinilai, yang berulang akan digabungkan, yang tidak digunakan dalam jangka panjang akan diarkibkan secara automatik, dan bahkan mempunyai siklus hayat seperti active, stale, dan archived. Kami juga boleh menetapkan Kemahiran penting agar sistem tidak menghapusnya secara automatik.

OpenClaw juga menambahkan mekanisme terkait dalam beberapa kemas kini terbaru, seperti ingatan kekal antar dialog, penjadualan tugas berkala, pelaksanaan terpisah untuk Sub-Agent, serta fungsi mimpi yang secara langsung dipanggil Dreaming.

Subkuadratik

Mimpi OpenClaw: https://docs.openclaw.ai/concepts/dreaming

Dalam mekanisme mimpi OpenClaw, ia menggambarkan perjalanan mimpi sebagai tiga peringkat: light, REM, deep. Dua yang pertama bertanggung jawab untuk mengatur, merefleksikan, dan mengenal pasti tema, manakala deep lah yang benar-benar menulis kandungan ke memori jangka panjang MEMORY.md.

Subkuadratik

Penguatan fasa tidur mendalam akan ditentukan oleh enam isyarat berbobot sama ada ia perlu ditulis ke ingatan jangka panjang. Enam isyarat ini termasuk frekuensi, korelasi, kepelbagaian soalan, ketepatan masa, pengulangan merentas hari, dan kekayaan konsep.

Subkuadratik

Gambar dihasilkan oleh AI

Penulisan ke memori jangka panjang akan menghasilkan dua fail: satu fail status yang ditujukan kepada mesin, diletakkan di memory/.dreams/; dan satu rekod boleh baca yang ditujukan kepada pengguna, ditulis ke DREAMS.md dan laporan yang dihasilkan mengikut peringkat.

Selain itu, Dreaming boleh dijadualkan untuk berjalan secara automatik, secara lalai ia akan menjalankan proses penuh setiap hari pada pukul 3 pagi, mengikut urutan light → REM → deep.

Selain output mimpi, OpenClaw juga memelihara dokumen bernama Dream Diary, di mana sistem akan menghasilkan secara automatik sebuah "diari mimpi" yang merekam proses pengurusan memori dalam bentuk naratif, menekankan kebolehjelasan dan kebolehsemakkan, bukan sebagai pangkalan data tertutup.

Dalam neurosains, terdapat pemahaman klasik yang sangat terkenal: maklumat yang diperoleh manusia semasa siang hari akan masuk terlebih dahulu ke sistem penyimpanan sementara; semasa tidur, otak akan memutar semula, mengukuhkan, dan membersihkan maklumat ini, menyimpan yang penting dan membuang yang tidak bermakna.

Subkuadratik

Gambar dihasilkan oleh AI

Kami tidak akan mengingat warna setiap kereta di jalan ke pejabat semalam, tetapi akan mengingat cara pergi ke pejabat.

Mimpi-mimpi ini, kedengarannya sama seperti mimpi yang kita alami sebagai manusia; jika harus mencari perbezaan, mungkin hanya bahawa semasa Claude bermimpi, ia masih menghabiskan Token kita.

Namun, Anthropic dan OpenClaw tidak memilih untuk menamakannya sebagai “pengoptimuman berdasarkan sesi (session-based optimization)” atau “penyesuaian selepas tugas (post-task tuning)”, nama-nama yang lebih bersifat kejuruteraan.

Setelah semua, apabila nama-nama yang kompleks itu diubah secara langsung menjadi "mimpi", yang kita rasakan bukan lagi fungsi perisian, tetapi seolah-olah "kehidupan digital yang mempunyai aktiviti dalaman".

Memori AI adalah konteks yang remeh

Sejak menyebut "bermimpi", tidak dapat dielakkan untuk membincangkan syarat awalnya, memori (Memory).

Dalam tempoh terkini, perkataan paling popular di kalangan dunia AI telah berubah daripada kejuruteraan petunjuk kepada kejuruteraan konteks, kejuruteraan Skill, dan kejuruteraan Harness, tetapi walau bagaimanapun perubahan itu, kejuruteraan konteks masih tetap yang paling bernilai pada masa ini.

Petunjuk sistem, input pengguna, perbualan jangka pendek, ingatan jangka panjang, dokumen yang dipulihkan, output panggilan alat dan kemahiran, status semasa pengguna, lapisan-lapisan ini digabungkan membentuk「konteks」yang sebenarnya digunakan oleh agen.

Membuat agen mampu mengingat lebih banyak dan merekam perkara yang lebih berguna telah menjadi cabaran sepanjang masa yang panjang.

Subkuadratik

Manus pada tahun lalu menerbitkan sebuah blog teknikal yang membahas bagaimana Manus mengoptimumkan kejuruteraan konteks. Blog tersebut menyebutkan bahawa kadar kejayaan cache KV-Cache ditakrifkan sebagai salah satu indikator tunggal paling penting untuk AI Agent dalam persekitaran pengeluaran. Pada peringkat pemanggilan alat, ia mengutamakan "penyamaran" berbanding "pembuangan"; serta menggunakan sistem fail sebagai konteks terakhir.

Untuk memahami apa yang dimaksud dengan KV Cache (cache kunci-nilai), kita boleh membayangkan model besar sebagai seorang yang sangat obsesif-compulsive yang hanya mampu membaca satu huruf pada satu masa.

Semasa ia memproses satu ayat, ia akan mengira vektor Kunci (Key) dan Nilai (Value) untuk setiap Token yang dihasilkan. Untuk mengelakkan pengiraan semula dari awal setiap kali, ia akan menyimpan pasangan kunci-nilai (K, V) ini, yang dikenali sebagai KV Cache.

Subkuadratik

KV Cache (Cache Kunci-Nilai) adalah teknik akselerasi aras bawah yang digunakan model besar semasa menghasilkan teks untuk "menggantikan ruang dengan masa". Cache membolehkan model mengira perkataan seterusnya tanpa perlu mengira semula semua perkataan sebelumnya. Gambar dihasilkan oleh AI.

KV Cache akan terus disimpan selama percakapan berterusan. Secara umum, apabila menghadapi model besar dengan konteks hingga 128k, model dengan 70B parameter yang menjalankan konteks penuh 128k sahaja akan menghabiskan 64 GB memori GPU untuk KV Cache.

Inilah sebabnya kebanyakan model mempunyai tetingkap konteks sehingga paling banyak dalam jutaan.

Semalam, syarikat baharu Subquadratic yang memperoleh pendanaan benih sebanyak $29 juta memperkenalkan model SubQ baru di X, menekankan konteks yang lebih panjang.

Subkuadratik

SubQ mengklaim menyokong jendela konteks hingga 12 juta token, yang merupakan jendela konteks terbesar di antara semua model besar saat ini.

Walaupun belum ada kertas teknikal atau dokumen penjelasan model, video pengenalan menyatakan bahawa jalan utama teknologi SubQ ialah berpindah dari «perhatian padat» Transformer tradisional kepada arsitektur «subkuadratik / linear scaling» dengan perhatian jarang. Arsitektur baharu ini dijangka dapat menyelesaikan masalah kos pengiraan yang meledak apabila konteks semakin panjang.

Subkuadratik

Keputusan ujian yang diberikan juga sangat agresif: di bawah 1 juta token, peningkatan kelajuan melebihi 50 kali ganda dan pengurangan kos melebihi 50 kali ganda; pada 12 juta token, keperluan kuasa pengiraan boleh dikurangkan hampir 1000 kali ganda berbanding model terkini.

Dalam ujian konteks panjang RULER 128K, Subquadratic menyatakan bahawa SubQ mencapai ketepatan 95% dengan kos $8, berbanding ketepatan 94% dan kos sekitar $2,600 milik Claude Opus, dengan penurunan kos sebanyak kira-kira 300 kali.

Either expand the context window or let the model learn to dream and discard some things itself.

Inilah sebabnya produk Agent seperti Anthropic kini mesti melancarkan Dreaming. Dalam keadaan jendela konteks terhad, AI yang lebih pintar tidak boleh hanya bergantung pada penambahan lebih banyak konten, tetapi perlu bertindak secara terfokus.

Mengakui bahawa mesin hanyalah mesin, lebih sukar daripada yang disangka

Dengan memahami mekanisme mimpi dan ingatan AI, kita mungkin dapat mengetahui hubungannya dengan aktivitas manusia.

Namun, apabila digabungkan semua istilah yang diciptakan oleh syarikat AI ini untuk digunakan pada mesin—thinking (berfikir) dari OpenAI, memory (memori) dan hallucination (halusinasi) yang digunakan secara am dalam industri, dreaming (bermimpi) daripada Anthropic kali ini, serta kebajikan dan kebijaksanaan dalam perlembagaan Anthropic.

Kita dapat melihat bahawa syarikat AI bukan sekadar menjual produk, tetapi mereka sedang mengalihkan kepemilikan kata-kata dalam konsep "manusia". Setiap kali sebuah kata diambil alih, sempadan antara mesin dan manusia menjadi kabur sedikit lagi.

Subkuadratik

Bahasa membentuk harapan, harapan membentuk tahap toleransi, dan toleransi menentukan seberapa banyak hal yang bersedia kita serahkan kepadanya. Ini adalah rantai yang panjang, tetapi permulaannya ialah kata-kata tidak berbahaya yang disampaikan di acara pelancaran.

Kesan yang lebih halus ialah pembahagian tanggungjawab. Apabila alat digambarkan sebagai entiti yang mempunyai «pemikiran», «ingatan», «nilai», kami secara semula jadi menganggapnya sebagai «agennya» yang berdiri sendiri apabila ia bermasalah, dan AI ini perlu «diedukasi», «dikemas semula», «dikalibrasi».

Yang sepatutnya ditanya ialah syarikat yang melaksanakan program ini ke dalam alur kerja kami, dan pasukan produk yang menulis perkataan “dreaming”. Apabila perkataan itu ditukar, orang yang duduk di bangku tertuduh juga berubah.

Sementara kita memperhatikan mesin yang dapat "berfikir", "mengingat", dan kini juga "bermimpi", kita mulai secara tidak sedar percaya bahawa terdapat sesuatu di dalamnya. Kerana mengakui bahawa ia hanyalah sebuah mesin, pengalaman "saya sedang berbual dengan entiti yang mampu berfikir" akan hilang, dan kembali kepada hubungan alat yang sejuk dan dingin.

Subkuadratik

Perkenalan Fungsi White Day Dream | Gambar dihasilkan oleh AI

Saya sudah terfikir, Dreaming — bermimpi — menguruskan kandungan masa lalu, dan seterusnya syarikat AI akan melancarkan Daydreaming, mimpi siang, untuk merancang masa depan.

Pengenalan ialah, mimpi siang atau kehilangan fokus membolehkan Agen dalam keadaan aktif, menggunakan sebahagian kecil kapasiti pengiraan lapang, bersama projek semasa, untuk menjalankan penghasilan eksploratori dan bersedia untuk tugas yang mungkin berlaku di masa depan.

Artikel ini berasal daripada akaun微信公众号 "APPSO", penulis: APPSO yang menemui produk masa depan