Anthropic Melaporkan Kadar Perompakan 31.5% untuk Agen Perintah Opus 4.8 Sebelum Langkah Keselamatan

iconCryptoBriefing
Kongsi
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconRingkasan

expand icon
Anthropic mengungkapkan kadar perampasan sebanyak 31.5% terhadap agen peramban Opus 4.8 sebelum langkah keselamatan, menandakan titik berita kerentanan utama. Model ini menghadapi serangan penyuntikan arahan semasa tugas web. Laporan keselamatan sebanyak 244 muka surat, yang dikeluarkan pada 28 Mei, merangkumi empat permukaan agen. Data menunjukkan keperluan untuk garis panduan yang lebih kuat. Projek kripto yang menggunakan agen AI untuk penggalian pada rantai, interaksi DEX, dan perniagaan menghadapi risiko. Berita kadar faedah dan kemas kini keselamatan tetap penting untuk sistem DeFi berasaskan AI.

Arahkan seorang red-teamer ke model terbaru Anthropic semasa ia melayari web, dan penyerang berjaya menguasainya hampir satu daripada tiga kali. Itu adalah statistik mentah: kadar kejayaan 31.5% untuk serangan penyuntikan arahan terhadap agen pelayar Claude Opus 4.8 sebelum langkah-langkah keselamatan pertahanan aktif.

Kesenjangan transparansi antara makmal

Anthropic menerbitkan laporan keselamatan sebanyak 244 muka surat pada 28 Mei, yang merangkumi empat permukaan agen yang berbeza: melayari web, menulis kod, mengkoordinasikan dengan agen AI lain, dan berinteraksi dengan alat luar.

OpenAI melaporkan hanya pada satu permukaan: penyambung. Google memindahkan keseluruhan topik tersebut keluar daripada kad modelnya dan ke dalam dokumen kerangka keselamatan yang berasingan. Meta tidak menghantar kad model tertutup sama sekali.

Iklan

Angka 31.5% adalah sebelum langkah keselamatan, bermakna ia mewakili kerentanan model mentah sebelum lapisan pertahanan Anthropic berfungsi. Setiap pelaksanaan pengeluaran termasuk pengawal, pemantauan, dan penyaringan yang mengurangkan kadar eksploitasi di dunia nyata. Tetapi mengetahui kerentanan asas adalah jenis data tepat yang diperlukan oleh arkitek keselamatan untuk membina pengawal tersebut dengan betul.

Apa yang sebenarnya dilakukan secara berbeza oleh Opus 4.8

Kesalahan negatif palsu pada ralat pengaturcaraan, di mana model gagal menangkap ralatnya sendiri, turun dari 19.7% kepada 3.7%. Opus 4.8 juga memperkenalkan orkestrasi agen pelbagai dinamik pada skala besar, mengkoordinasikan ratusan sub-agen secara serentak untuk mengurus projek perisian besar.

Mengapa kripto perlu memperhatikan

Kadar perampasan 31.5% sebelum perlindungan untuk agen berbasis browser sepatutnya membuat sesiapa yang menjalankan sistem AI dalam kripto berhenti sebentar. Agen berbasis browser adalah jenis alat tepat yang digunakan oleh projek kripto untuk papan pemantauan, pengutipan data atas rantai, berinteraksi dengan antaramuka DEX, dan melaksanakan perdagangan melalui antaramuka web.

Penyuntikan prompt dalam agen peramban bermaksud laman web jahat, respons API yang telah disusupi, atau bahkan nama token yang dirangka dengan bijak boleh mengalihkan tingkah laku agen AI. Dalam perisian tradisional, itu adalah kebocoran data. Dalam kripto, itu adalah dompet yang dikosongkan.

Orkestrasi agen pelbagai menambah lapisan kompleksiti tambahan. Apabila Opus 4.8 mengkoordinasikan ratusan agen sub, satu serangan penyuntikan arahan yang berjaya boleh menimbulkan kesan berantai ke seluruh alur kerja. Dalam konteks kripto, ini adalah perbezaan antara satu transaksi yang disusupi dan kegagalan sistemik merentasi keseluruhan operasi perdagangan automatik.

Penafian: Maklumat yang terdapat pada halaman ini mungkin telah diperoleh daripada pihak ketiga dan tidak semestinya menggambarkan pandangan atau pendapat KuCoin. Kandungan ini adalah disediakan bagi tujuan maklumat umum sahaja, tanpa sebarang perwakilan atau waranti dalam apa jua bentuk, dan juga tidak boleh ditafsirkan sebagai nasihat kewangan atau pelaburan. KuCoin tidak akan bertanggungjawab untuk sebarang kesilapan atau pengabaian, atau untuk sebarang akibat yang terhasil daripada penggunaan maklumat ini. Pelaburan dalam aset digital boleh membawa risiko. Sila menilai risiko produk dan toleransi risiko anda dengan teliti berdasarkan keadaan kewangan anda sendiri. Untuk maklumat lanjut, sila rujuk kepada Terma Penggunaan dan Pendedahan Risiko kami.