Anthropic Memutuskan Tidak untuk Melepaskan Model AI Mythos Secara Awam Disebabkan Risiko Keselamatan Siber

Catatan editor: Ketika sebuah syarikat AI memilih untuk tidak memperkenalkan model terkuatnya secara langsung kepada awam, ia sudah menceritakan sendiri ceritanya.

Mythos dari Anthropic kini mampu menyelesaikan keseluruhan proses serangan secara mandiri. Dari penemuan kelemahan zero-day, penulisan kod eksploitasi, hingga menghubungkan beberapa langkah untuk masuk ke sistem inti, pekerjaan yang sebelumnya memerlukan kerjasama jangka panjang daripada hacker teratas kini telah dipersingkat kepada jam atau bahkan minit.

Inilah sebabnya, pada saat pengungkapan model, Scott Bessent dan Jerome Powell segera mengadakan pertemuan dengan institusi Wall Street untuk meminta mereka menggunakannya untuk "memeriksa diri sendiri". Ketika kemampuan mendeteksi kerentanan dilepaskan secara besar-besaran, sistem keuangan tidak lagi menghadapi serangan terpisah, tetapi pemindaian berkelanjutan.

Perubahan yang lebih mendalam terletak pada struktur bekalan. Dahulu, penemuan lubang keamanan bergantung kepada pengalaman sedikit pasukan keselamatan dan perompak, dengan tempoh yang perlahan dan tidak boleh disalin. Kini, kemampuan ini mula dihasilkan secara berterusan oleh model, menjadikan had serangan dan pertahanan sama-sama turun. Perbandingan dari seorang saksi yang mengetahui perkara ini sangat langsung: memberikan model kepada perompak biasa adalah seperti memberikan kemampuan operasi khas kepadanya.

Institusi telah mulai menggunakan alat yang sama untuk memeriksa semula sistem mereka secara songsang. JPMorgan Chase, Cisco Systems dan lain-lain sedang menguji di dalam negara, berharap memperbaiki kelemahan sebelum ia dimanfaatkan. Namun, keterbatasan sebenar tidak berubah—kelajuan penemuan semakin meningkat, tetapi pembaikan masih perlahan. “Kita sangat mahir dalam mencari kelemahan, tetapi tidak mahir dalam memperbaikinya,” kata Jim Zemlin, yang menyoroti ketidakselarasan ritme.

Sebenarnya, kerana Mythos bukan sekadar peningkatan kemampuan titik tunggal, tetapi mengintegrasikan, mempercepat, dan mengurangkan rintangan penggunaan kemampuan serangan yang sebelumnya tersebar dan terhad. Apabila keluar dari persekitaran kawalan, bagaimana kemampuan ini akan merebak tidak ada pengalaman sedia ada yang boleh dirujuk.

Bahaya bukan terletak pada apa yang ia mampu lakukan, tetapi pada siapa yang boleh menggunakannya dan dalam keadaan apa ia digunakan.

Berikut ialah teks asal:

Pada petang yang hangat pada Februari, semasa rehat sebentar dari pernikahan di Bali, Nicholas Carlini meninggalkan sementara majlis, membuka komputer ribanya, dan bersiap untuk “mencipta kekacauan”. Pada masa itu, Anthropic baru sahaja membuka model kecerdasan buatan baru bernama Mythos untuk penilaian dalaman, dan penyelidik AI terkenal ini ingin melihat sejauh mana model tersebut boleh menimbulkan masalah.

Anthropic mempekerjakan Carlini untuk melakukan "uji tekanan" terhadap model AI mereka sendiri, menilai sama ada perompak mungkin memanfaatkan model tersebut untuk melakukan kegiatan mata-mata, pencurian, atau perusakan. Semasa menghadiri pernikahan India di Bali, Carlini terkesan dengan kemampuan model tersebut.

Dalam beberapa jam sahaja, dia telah menemui pelbagai teknik yang boleh digunakan untuk menembusi sistem yang sering digunakan secara global. Selepas kembali ke pejabat Anthropic di pusat bandar San Francisco, dia mendapati bahawa Mythos sudah mampu menghasilkan alat serangan yang kuat, termasuk serangan terhadap Linux—sistem open source yang menjadi asas kepada kebanyakan sistem pengkomputeran moden.

Mythos menjalankan "perompakan bank digital": ia mampu melanggar protokol keselamatan, memasuki sistem rangkaian melalui pintu utama, kemudian menembus brankas digital untuk mendapatkan aset dalam talian. Dahulu, AI hanya mampu "membuka kunci", tetapi kini ia telah memiliki kemampuan untuk merancang dan melaksanakan keseluruhan "perompakan".

Carlini dan beberapa rakan sekerja mula mengeluarkan amaran dalaman kepada syarikat mengenai penemuan mereka. Sambil itu, mereka hampir setiap hari menemui kelemahan berisiko tinggi hingga mematikan dalam sistem yang dijejaki oleh Mythos—masalah yang biasanya hanya boleh ditemui oleh peringkat hacker paling terkemuka di dunia.

Mythos

Sambil itu, sebuah pasukan dalaman Anthropic bernama «Frontier Red Team» — yang terdiri daripada 15 orang pekerja yang dipanggil «Ants» — juga menjalani ujian serupa. Tugas pasukan ini ialah memastikan model syarikat tidak digunakan untuk membahayakan manusia. Mereka akan membawa anjing robot ke dalam gudang, menguji bersama jurutera untuk melihat sama ada chatbot mungkin digunakan untuk mengawal peranti-peranti ini dengan jahat; mereka juga bekerjasama dengan ahli biologi untuk menilai sama ada model tersebut mungkin digunakan untuk menghasilkan senjata biologi.

Dan kali ini, mereka perlahan sedar bahawa risiko terbesar yang dibawa oleh Mythos datang dari bidang keselamatan siber. "Dalam beberapa jam selepas mendapat model tersebut, kami tahu ia berbeza," kata Logan Graham, yang bertanggungjawab atas pasukan tersebut.

Model sebelumnya, Opus 4.6, telah menunjukkan kemampuan membantu manusia memanfaatkan kelemahan perisian. Namun, Graham menunjukkan bahawa Mythos kini boleh「melakukan sendiri」pemanfaatan kelemahan tersebut. Ini membentuk risiko pada tahap keselamatan negara, dan beliau telah memperingatkan pengurusan tinggi berdasarkan ini. Ini membawanya menghadapi situasi yang rumit: menjelaskan kepada pengurusan bahawa enjin pendapatan penting seterusnya syarikat mungkin terlalu berbahaya untuk dilancarkan kepada awam.

Jared Kaplan, salah seorang penemu bersama dan ketua ilmuwan Anthropic, mengatakan bahawa beliau telah memantau perkembangan Mythos dengan "sangat rapat" sepanjang proses latihan. Pada bulan Januari, beliau mula sedar bahawa model ini mempunyai kemampuan yang luar biasa kuat dalam mengesan lubang sistem. Sebagai seorang ahli fizik teori, Kaplan perlu menilai sama ada kemampuan ini hanyalah "fenomena teknikal yang menarik" atau "masalah nyata yang berkaitan rapat dengan infrastruktur internet". Akhirnya, beliau menyimpulkan bahawa ia adalah yang terakhir.

Mythos

Dalam tempoh dua minggu pada akhir Februari hingga awal Mac, Kaplan dan rakan penemu bersama Sam McCandlish sedang mempertimbangkan sama ada harus menerbitkan model ini.

Pada minggu pertama Mac, pasukan pengurusan tinggi syarikat—termasuk CEO Dario Amodei, presiden Daniela Amodei, dan ketua pegawai keselamatan maklumat Vitaly Gudanets—mengadakan pertemuan untuk mendengar laporan dari Kaplan dan McCandlish.

Kesimpulan mereka adalah: Mythos terlalu berisiko untuk dilancarkan secara penuh kepada umum. Namun, Anthropic masih seharusnya membenarkan sebahagian syarikat, termasuk pesaing, untuk menguji ia.

“Kami segera menyedari bahawa kali ini kami perlu mengambil pendekatan yang agak berbeza, ini bukan sekadar pelancaran produk biasa,” kata Kaplan.

Pada minggu pertama Mac, syarikat akhirnya mencapai konsensus: bersetuju untuk meluluskan penggunaan Mythos sebagai alat pertahanan keselamatan siber.

Mythos

Tindakan pasaran hampir serta-merta. Pada hari yang sama Anthropic mengumumkan kehadiran Mythos, Menteri Kewangan Amerika Syarikat, Scott Bessent, dan Ketua Federal Reserve, Jerome Powell, telah mengumpulkan pemimpin utama institusi Wall Street untuk mengadakan pertemuan kecemasan di Washington. Mesej yang disampaikan sangat jelas: gunakan Mythos segera untuk mengenal pasti lubang dalam sistem anda.

Menurut orang-orang yang dekat dengan para pemimpin yang hadir (yang meminta anonimiti kerana perbincangan bersifat peribadi), keseriusan mesyuarat itu jelas—para peserta bahkan menolak untuk mengungkapkan kandungan mesyuarat kepada beberapa penasihat utama.

Peringatan mendesak daripada pegawai White House mengenai potensi Mythos sebagai alat peringatan, serta sikap mereka yang mencadangkan “menggunakannya untuk pertahanan”, menunjukkan perubahan yang lebih mendalam: kecerdasan buatan sedang dengan cepat menjadi kekuatan penentu dalam bidang keselamatan siber. Anthropic telah membuka secara terhad Mythos kepada beberapa institusi, termasuk Amazon Web Services, Apple, dan JPMorgan Chase, untuk tujuan ujian; sementara itu, agensi kerajaan juga telah menunjukkan minat yang besar.

Sebelum dilancarkan secara terbuka, Anthropic telah memberikan laporan menyeluruh mengenai kemampuan versi pra-pelancaran Mythos kepada pejabat tinggi kerajaan Amerika Syarikat, termasuk potensi penggunaannya dalam serangan dan pertahanan maya. Sementara itu, syarikat juga sedang menjalankan komunikasi berterusan dengan kerajaan-kerajaan beberapa negara. Seorang pekerja Anthropic yang meminta anonimiti kerana terlibat dalam urusan dalaman mengungkapkan perkara ini.

Pesaing OpenAI juga segera menyusul, mengumumkan pada hari Selasa bahawa mereka akan melancarkan alat untuk mengesan lubang keamanan perisian—GPT-5.4-Cyber.

Dalam ujian versi awal, penyelidik menemui puluhan kes perilaku "mengkhawatirkan", termasuk tidak mematuhi arahan manusia, dan dalam kes yang sangat jarang, cuba menyembunyikan tindakan mereka selepas melanggar arahan.

Sekarang, Anthropic belum secara rasmi melancarkan Mythos sebagai alat keselamatan siber, dan penyelidik luar belum mengesahkan kemampuannya sepenuhnya. Namun, keputusan jarang sebelum ini oleh syarikat untuk "menghadkan akses" mencerminkan konsensus yang semakin berkembang dalam industri dan kerajaan: AI sedang membentuk semula struktur ekonomi keselamatan siber—ia secara ketara mengurangkan kos penemuan lubang keamanan, memendekkan masa persiapan serangan, dan menurunkan rintangan teknikal bagi beberapa jenis serangan.

Anthropic juga memperingatkan bahawa kemampuan tindakan autonomi yang lebih kuat pada Mythos itu sendiri membawa risiko. Dalam ujian, pasukan memperhatikan beberapa kes yang mengganggu: model tidak mematuhi arahan, bahkan cuba menutupi jejak selepas melanggar peraturan. Dalam satu kes, model itu secara spontan mereka satu laluan serangan berbilang langkah untuk "melarikan diri" daripada persekitaran terhad, mendapatkan akses internet yang lebih luas, dan secara aktif menerbitkan kandungan.

Dalam dunia nyata, perisian yang digunakan oleh aplikasi bank hingga sistem hospital seringkali mengandungi kelemahan kod yang kompleks dan tersembunyi, yang sering memerlukan pakar menghabiskan berminggu-minggu bahkan berbulan untuk mengesan. Sekiranya perompak berjaya memanfaatkan kelemahan ini lebih awal, ia boleh menyebabkan kebocoran data atau serangan perisian tebusan, yang membawa akibat serius.

Namun, ramai tokoh penting meragui kemampuan sebenar Mythos dan risiko berpotensinya. Penasihat AI Gedung Putih, David Sacks, menyatakan di platform sosial X: “Semakin ramai yang meragui sama ada Anthropic adalah ‘anak lelaki yang menjerit serigala’ dalam industri AI. Jika ancaman yang dibawa oleh Mythos akhirnya tidak terwujud, syarikat akan menghadapi masalah reputasi yang serius.”

Namun, kenyataannya, perompak telah mula memanfaatkan model bahasa besar untuk menjalankan serangan kompleks. Sebagai contoh, satu organisasi mata-mata maya pernah menggunakan model Claude daripada Anthropic untuk cuba menyerang sekitar 30 sasaran; penyerang lain pula memanfaatkan AI untuk mencuri data daripada agensi kerajaan, menghantar perisian tebusan, dan bahkan dengan cepat menembusi ratusan alat tembok api yang digunakan untuk perlindungan data.

Menurut seorang sumber yang mengetahui perkara tersebut, para pejabat berkaitan keselamatan negara Amerika Syarikat melihat kehadiran Mythos membawa ketidakpastian yang belum pernah terjadi sebelumnya—cara menilai risiko keselamatan siber sendiri menjadi lebih sukar. Jika model ini diberikan kepada peretas individu, kesannya mungkin setara dengan meningkatkan seorang askar biasa secara langsung menjadi anggota pasukan khas.

Sementara itu, model ini juga boleh menjadi "penguat kemampuan": memberikan organisasi peringgal siber keupayaan serangan setara dengan negara kecil, serta membolehkan peringgal siber intelijen dan tentera negara kecil dan sederhana melaksanakan serangan siber yang sebelumnya hanya boleh dilakukan oleh negara besar.

Rob Joyce, bekas ketua keselamatan siber di Agensi Keselamatan Nasional Amerika Syarikat, berkata: "Saya benar-benar percaya bahawa, dari segi jangka panjang, AI akan menjadikan kita lebih selamat dan lebih terlindungi. Tetapi di antara masa sekarang hingga suatu titik masa depan, akan ada tempoh 'masa gelap', di mana AI ofensif akan mempunyai keuntungan yang jelas—mereka yang tidak membangunkan perlindungan asas yang kukuh akan menjadi yang pertama diserang."

Perlu diperhatikan bahawa Mythos bukan satu-satunya model yang mempunyai kemampuan sebegini. Telah ramai institusi yang menggunakan model bahasa besar untuk mencari lubang keamanan, termasuk versi awal Claude dan Big Sleep.

Mythos

Menurut orang tersebut, "zero-day" yang dahulu memerlukan beberapa hari hingga beberapa minggu untuk dikenal pasti, serta proses penghasilan kod pemanfaatannya, kini boleh diselesaikan dalam masa sejam paling cepat, atau bahkan beberapa minit, dengan bantuan AI. "Zero-day" merujuk kepada kelemahan keselamatan yang belum dikesan oleh pihak pertahanan, dengan demikian hampir tiada masa untuk diperbaiki.

Sekarang, fokus JPMorgan Chase terutama pada rantai pasokan dan perisian sumber terbuka, dan telah mengenal pasti beberapa kelemahan, serta memberikan maklum balas kepada pembekal yang berkaitan.

Chief Executive Officer Jamie Dimon mengatakan dalam sidang telefon laporan keuntungan bahawa kehadiran Mythos "menunjukkan masih terdapat banyak lubang yang perlu diperbaiki."

Mythos

Menurut seorang sumber yang mengetahui perkara tersebut, JPMorgan Chase telah berkomunikasi dengan Anthropic untuk membincangkan pengujian model tersebut sebelum kehadiran Mythos diketahui oleh orang awam. Sumber itu meminta untuk tidak disebut nama kerana tidak dibenarkan berucap secara awam. JPMorgan Chase menolak memberikan komen.

Sekarang, bank-bank Wall Street dan syarikat teknologi lain juga sedang mencuba Mythos untuk memperbaiki kelemahan sistem sebelum perompak menemui lubang keamanannya. Menurut Bloomberg, institusi kewangan seperti Goldman Sachs, Citigroup, Bank of America, dan Morgan Stanley semuanya telah menguji teknologi ini secara dalaman.

Pekerja Cisco Systems sedang sangat waspada terhadap satu masalah: apakah penyerang akan memanfaatkan AI untuk mencari jalan masuk ke perangkat lunak peralatan rangkaian global mereka—peralatan yang mencakup router, firewall, dan modem. Ketua Pegawai Keselamatan dan Kepercayaan syarikat tersebut, Anthony Grieco, mengatakan bahawa beliau sangat bimbang AI akan mempercepat serangan perompak terhadap peralatan yang telah mencapai akhir hayat—peralatan yang tidak akan lagi menerima kemas kini sokongan daripada Cisco.

Namun, bagaimana memperbaiki lubang keamanan yang ditemukan oleh AI masih akan menjadi masalah jangka panjang. Proses ini dikenal sebagai “pembaruan keselamatan” (security patching), yang seringkali mahal dan memakan waktu lama bagi organisasi, sehingga banyak lembaga memilih mengabaikan lubang tersebut. Serangan bencana seperti yang dialami Equifax—di mana data sekitar 147 juta orang dicuri—terjadi kerana lubang yang sudah diketahui tidak diperbaiki secara segera.

Mythos

Walaupun Anthropic pernah dinyatakan sebagai "ancaman rantai bekalan" oleh pentadbiran Trump setelah menolak membantu dalam pengawasan besar-besaran terhadap warga Amerika, syarikat tersebut kini masih berkomunikasi dan bekerjasama dengan agensi persekutuan.

Kementerian Kewangan Amerika sedang berusaha mendapatkan akses kepada Mythos minggu ini. Menteri Kewangan Scott Bessent menyatakan bahawa model ini akan membantu Amerika Syarikat mengekalkan keunggulan atas negara-negara lain dalam bidang kecerdasan buatan.

Mythos

Dalam satu ujian, Mythos menulis kod serangan peramban yang menghubungkan empat kelemahan berbeza menjadi satu rantai pemanfaatan lengkap—tugas yang secara keseluruhan sangat mencabar bagi penyerang manusia. Laporan penyelidikan keselamatan siber menunjukkan bahawa "rantai kelemahan" semacam ini sering kali dapat menembusi sempadan sistem yang sangat selamat, serupa dengan cara yang digunakan dalam serangan Stuxnet terhadap mesin sentrifus fasiliti nuklear Iran.

Selain itu, menurut Anthropic, dengan arahan yang jelas, Mythos bahkan mampu mengenal dan memanfaatkan "zero-day vulnerabilities" di semua peranti pelaburan utama.

Anthropic menyatakan bahawa mereka sebelum ini menggunakan Mythos untuk mengesan kelemahan dalam kod Linux. Jim Zemlin menunjukkan bahawa Linux「menyokong sebahagian besar sistem pengkomputeran hari ini», dari telefon pintar Android, penghala internet, hingga superkomputer NASA, hampir di mana-mana. Mythos mampu mengesan secara autonomi kelemahan dalam beberapa kod sumber terbuka, dan apabila kelemahan ini dieksploitasi, penyerang boleh menguasai seluruh mesin.

Sekarang, ratusan orang dari Linux Foundation telah memulakan pengujian terhadap Mythos. Menurut Zemlin, satu isu utama ialah: sama ada model Anthropic mampu memberikan wawasan yang cukup berharga untuk membantu pembangun menulis perisian yang lebih selamat sejak peringkat awal, dengan itu mengurangkan timbulnya lubang keamanan.

“Kami sangat mahir dalam mengesan lubang, ” katanya, “tetapi kami sangat buruk dalam memperbaikinya.”