- Anthropic memulihkan Fable 5 secara global setelah kontrol ekspor AS berakhir pada 30 Juni.
- Perlindungan baru sekarang memblokir cara bypass yang dilaporkan dalam lebih dari 99% kasus yang diuji.
- Anthropic dan mitra Project Glasswing sedang membangun kerangka bersama untuk menilai jailbreak AI.
Anthropic telah memulihkan akses global ke model Claude Fable 5 setelah pemerintah AS mencabut kontrol ekspor yang sementara membatasi ketersediaannya. Perusahaan mengatakan kontrol tersebut, yang diperkenalkan pada 12 Juni, mengharuskannya menangguhkan akses karena tidak dapat segera memverifikasi kewarganegaraan pengguna secara real time.
Dengan dibatalkannya pembatasan sejak 30 Juni, Fable 5 kini tersedia di seluruh Platform Claude, Claude.ai, Claude Code, dan Claude Cowork, sementara akses ke Mythos 5 telah dilanjutkan untuk sekelompok terbatas organisasi AS yang disetujui.
Seiring dengan pemulihan, Anthropic merinci langkah-langkah keamanan siber baru, merinci rencana untuk kerangka kerja industri bersama mengenai jailbreak AI, dan menggambarkan perluasan kerja sama dengan lembaga pemerintah AS.
Kontrol Ekspor Dicabut Setelah Penangguhan Dua Minggu
Anthropic said Fable 5 dan Mythos 5 diluncurkan pada 9 Juni menggunakan model dasar yang sama, meskipun masing-masing dirancang untuk tujuan berbeda. Fable 5 dirilis dengan perlindungan keamanan siber yang lebih kuat untuk pengguna umum, sementara Mythos 5 hanya tersedia untuk mitra terpilih Project Glasswing yang bekerja pada keamanan siber defensif.
Kontrol ekspor mengikuti laporan yang menggambarkan metode yang melewati beberapa perlindungan Fable 5. Menurut Anthropic, pengujian yang dilakukan bersama lembaga pemerintah dan mitra menemukan bahwa beberapa model AI lainnya dapat mengidentifikasi kerentanan perangkat lunak yang sama yang disebutkan dalam laporan tersebut, dan setiap model yang diuji juga mampu menghasilkan demonstrasi yang sama untuk mengeksploitasi satu kerentanan.
Anthropic menyatakan bahwa perilaku yang dilaporkan tidak mengekspos kemampuan unik Mythos 5 dan sebaliknya melibatkan tugas siber yang telah diblokir sebagai bagian dari langkah-langkah pencegahan Fable 5’s.
Perlindungan Baru dan Koordinasi Industri
Untuk mengatasi pelanggaran yang dilaporkan, Anthropic memperkenalkan klasifier keamanan yang diperbarui yang memblokir teknik yang diidentifikasi dalam lebih dari 99% kasus yang diuji. Ketika permintaan diblokir, pengguna akan dialihkan ke Claude Opus 4.8. Perusahaan menambahkan bahwa sistem yang diperbarui juga dapat meningkatkan false positif selama tugas pemrograman dan debugging rutin sambil terus melakukan penyempurnaan lebih lanjut.
Secara terpisah, Anthropic mengatakan sedang bekerja sama dengan Amazon, Microsoft, Google, dan mitra Project Glasswing lainnya untuk mengembangkan kerangka kerja umum guna mengevaluasi jailbreak AI. Sistem yang diusulkan akan menilai jailbreak berdasarkan peningkatan kemampuan, cakupan kemampuan, tingkat kemudahan senjata, dan kemudahan ditemukan untuk membantu menentukan tingkat keparahan teknik baru yang diidentifikasi.
Terkait:AS Mengizinkan Mythos AI dari Anthropic Kembali Online saat Trump Mengancam Tarif 100%
Penafian: Informasi yang disajikan dalam artikel ini hanya untuk tujuan informasi dan pendidikan. Artikel ini tidak merupakan nasihat keuangan atau nasihat apa pun. Coin Edition tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan konten, produk, atau layanan yang disebutkan. Pembaca disarankan untuk berhati-hati sebelum mengambil tindakan apa pun yang terkait dengan perusahaan.
