Setelah pemerintah AS meminta Anthropic untuk membatasi ekspor dua model tingkat tinggi, Fable dan Mythos, sekelompok profesional keamanan siber secara terbuka menentang keputusan ini, berpendapat bahwa pembatasan tersebut melemahkan kemampuan pihak pertahanan keamanan dalam menggunakan AI canggih untuk menemukan kerentanan, memperbaiki kelemahan, dan memperkuat perangkat lunak.
Surat terbuka saat ini telah ditandatangani oleh 76 pakar keamanan siber, termasuk mantan kepala keamanan Facebook Alex Stamos, pendiri Bugcrowd Casey Ellis, pakar kriptografi Jon Callas, ilmuwan komputer Paul Vixie, dan pendiri Luta Security Katie Moussouris. Surat bersama tersebut menyatakan bahwa dalam menghadapi kemajuan teknologi lawan yang cepat, mencabut kemampuan terkuat dari pihak pertahanan merupakan tindakan yang berbahaya.
Penghentian akses global setelah perintah pemerintah
Anthropic menyatakan bahwa pemerintah AS memberikan perintah pembatasan ekspor minggu lalu dengan alasan keamanan nasional, tetapi tidak menjelaskan dasar yang lebih spesifik. Perusahaan kemudian menghentikan akses pengguna global terhadap Fable dan Mythos.
Mythos diluncurkan dalam bentuk pratinjau pada April tahun ini. Pada saat itu, Anthropic menyatakan bahwa model ini memiliki kemampuan kuat dalam mengidentifikasi kerentanan keamanan, sehingga aksesnya perlu dibatasi ketat untuk mencegah penyalahgunaan oleh peretas jahat atau lawan asing. Awalnya, hanya sekitar 50 perusahaan yang memenuhi syarat untuk menggunakannya, kemudian diperluas menjadi sekitar 150 institusi di 15 negara.
Kontroversi berfokus pada metode penghindaran yang disebutkan
Anthropic juga menyebutkan bahwa perintah pembatasan Gedung Putih ini mungkin terkait dengan sebuah laporan. Laporan tersebut menyatakan bahwa ada cara untuk melewati pembatasan Fable, sehingga melepaskan kemampuan yang mendekati tingkat Mythos.
Katie Moussouris menyatakan, penelitian yang belum dipublikasikan ini dilakukan oleh peneliti Amazon, dan dia sendiri telah melihat isinya. Menurutnya, makalah tersebut tidak menunjukkan metode "jailbreak" yang sebenarnya. Menurutnya, para peneliti hanya meminta model untuk memperbaiki kode sumber terbuka yang mengandung kerentanan publik dan kerentanan yang disengaja ditanamkan, bukan berhasil melewati perlindungan asli model.
Dia menunjukkan bahwa operasi semacam ini merupakan bagian dari prosedur harian tim keamanan, yaitu mengidentifikasi masalah, memperbaiki kelemahan, dan memverifikasi apakah patch berfungsi dengan baik. Jika kemampuan ini dianggap sebagai cara untuk melewati batasan, hasilnya hanya akan mengurangi nilai model dalam skenario pertahanan.
Para kolaborator menyatakan masalah tersebut bukan milik Anthropic semata
Surat terbuka juga menyatakan bahwa metode terkait tidak hanya berlaku untuk model Anthropic, tetapi juga kemungkinan terjadi pada GPT-5.5 dari OpenAI, Claude Opus 4.8 dan Sonnet yang telah dirilis oleh Anthropic, bahkan model China Kimi 2.7.
Para pendukung juga mendesak pemerintah AS untuk meningkatkan transparansi dalam menyusun aturan terkait, serta mempercepat prosesnya melalui prosedur yang lebih terbuka, berdasarkan hasil penelitian dari industri dan akademisi, serta meminimalkan langkah-langkah pembatasan sebanyak mungkin.
