Anthropic Melancungkan Model AI Mythos, Sementara Dibatasi kepada Audit Keselamatan Infrastruktur

Anthropic melancungkan model AI canggih bernama Mythos, yang secara menyeluruh mengungguli model terkini Claude Opus 4.6 dalam kemampuan pengkodean, penalaran, dan penggalian lubang keamanan; disebabkan kemampuannya yang revolusioner dalam ancaman keselamatan, model ini belum dilancarkan secara terbuka, tetapi sebaliknya memulakan projek Project Glasswing, bekerjasama dengan 12 institusi teknologi utama termasuk AWS, Apple, Microsoft, serta organisasi sumber terbuka seperti Linux Foundation, untuk digunakan terlebih dahulu dalam audit dan penguatan infrastruktur digital kritikal global.

Penulis artikel: Tang Ren

Sumber artikel: Huoxing Caijing

Saya rasa, manusia mungkin sedang dikejar oleh AI dengan kelajuan yang melampaui pemahaman biasa.

Saya tidak tahu keadaan anda sekarang, tetapi setidaknya saya sudah tidak dapat hidup tanpa AI lagi; sekurang-kurangnya 50% pekerjaan saya setiap hari diselesaikan dengan bantuan AI.

Selain itu, nisbah ini terus meningkat.

Sementara itu, dengan pelancaran model baru yang berterusan, baik kecekapan dan kualiti kerja saya, mahupun perbelanjaan bulanan saya pada Token, semuanya meningkat dengan pesat.

Semalam saya melihat satu berita, Anthropic telah melancarkan satu model yang bahkan mereka sendiri tidak berani memperkenalkannya kepada semua orang kerana ia benar-benar hebat.

Nama model baru ini ialah 「Mythos」, yang diterjemahkan ke dalam bahasa Cina bermaksud 「mitos».

Sekarang merupakan versi pra-pandangan, jadi pihak rasmi menyebutnya sebagai 'Mythos Preview'. Namun, kali ini ia dilancarkan dalam bentuk projek bernama 'Project Glasswing'.

Mengenai projek ini, saya akan bincangkan selepas ini.

Mythos

Bulan lepas, sebuah dokumen dalaman Anthropic bocor secara tidak sengaja, menyebutkan bahawa satu model yang lebih besar dan lebih kuat daripada Opus sedang dibangunkan, dengan kod nama Mythos.

Selepas itu, Anthropic menyalahkan kebocoran ini kepada "kesilapan manusia" tanpa memberikan penjelasan lanjut.

Sekarang, model dengan kod nama Mythos telah secara rasmi diumumkan.

Meskipun telah diumumkan secara rasmi, ia belum dilancarkan secara awam. Dengan kata lain, pengguna biasa masih tidak boleh menggunakannya.

Sebabnya sangat jelas, Anthropic merasa model ini terlalu kuat dan tidak sesuai untuk dibuka kepada semua orang sebelum mekanisme keselamatan siap.

Saya rasa, ayat ini patut dihentikan sebentar untuk dipikirkan.

Biasanya, sebuah syarikat AI yang melancarkan model baharu akan berusaha untuk memasuki pasaran secepat mungkin, tetapi kali ini, pendekatan Anthropic jelas agak tidak biasa.

Menurut saya, bukan mereka tidak ingin menghantar, tetapi takut untuk menghantar.

Kerana model yang dipanggil Mythos ini memang sangat kuat.

Lihat beberapa data ujian yang diumumkan secara rasmi.

Dalam kemampuan pengkodean, jurang antara Mythos dan Claude Opus 4.6, yang merupakan model terkuat yang telah diumumkan, agak besar; dalam semua ujian piawai, Mythos secara keseluruhan mengalahkan Opus 4.6.

Mythos

Dalam hal kemampuan penalaran, pada ujian GPQA Diamond (soal sains tahap sarjana), hasilnya 94.6% berbanding 91.3%, Mythos menang.

Dalam ujian dengan dan tanpa alat di Humanity's Last Exam, Mythos juga menang mutlak.

Mythos

Dalam kemampuan operasi komputer yang berkaitan dengan Agent, OSWorld-Verified (menyelesaikan tugas komputer secara mandiri), Mythos mencapai 79.6%, melebihi Oputs 4.6 yang berada pada 72.7%.

Pada setiap dimensi, Mythos lebih unggul daripada Opus 4.6, dan beberapa bahkan melampaui secara telak.

Mythos

Pada beberapa tugas, jurang telah bukan lagi peningkatan bertahap, tetapi lompatan besar. Sebagai contoh, SWE-bench Multimodal meningkat dari 27.1% kepada 59%, hampir ganda dua kali.

Satu alasan paling utama mengapa mereka takut untuk online Mythos ialah kemampuannya yang sangat kuat dalam menembusi pertahanan keselamatan dunia perisian.

Dengan kata lain, semua sistem dan perisian di seluruh dunia mempunyai kelemahan, dan Mythos boleh mengesan dan menyerang kelemahan-kelemahan ini pada tahap yang melebihi manusia.

Andaikan kemampuan ini dikuasai oleh peretas, maka semua sistem operasi dan perisian di seluruh dunia akan terjejas, terutamanya beberapa infrastruktur awam dan keselamatan negara.

Anthropic dalam pengumuman mereka menyatakan satu ayat, setelah membacanya, saya rasa ia menakutkan apabila dipikirkan lebih dalam.

Mythos

The encoding capability of AI models has reached an extremely high level, and in discovering and exploiting software vulnerabilities, they can almost surpass everyone except the most skilled humans.

Tentang pernyataan ini, saya ingin memperluasnya sedikit lagi.

Saya berasal dari latar belakang pengaturcara, jadi saya tahu bagaimana perisian dibina dan seberapa besar perbezaan kod yang ditulis oleh orang yang berbeza.

Selain itu, tiada perisian yang berani mengatakan ia tidak mempunyai lubang, walaupun lubang itu tidak pernah ditemui.

Lubang sebelum ini boleh berada dalam sistem selama puluhan tahun tanpa gangguan bukan kerana sistem cukup selamat.

Namun, kerana mencari lubang kelemahan memerlukan kemahiran profesional yang sangat tinggi, kesabaran dan tenaga yang besar, serta masa yang banyak.

Terlalu sedikit orang yang berani, dan masih lebih sedikit lagi yang berani berinvestasi.

Kekurangan "kemampuan" ini membentuk prasyarat tersirat seluruh dunia keselamatan perisian. Selepas AI terlibat, prasyarat ini mulai longgar.

AI boleh berfungsi dengan cara yang melebihi keupayaan kebanyakan manusia bukan terkemuka, dan kita boleh menggunakannya untuk menyerang lubang kelemahan, atau juga untuk menutup lubang kelemahan tersebut.

Untuk menyelesaikan masalah ini, saya akan terangkan apakah Project Glasswing yang dibuat oleh Anthropic.

Secara ringkas, ini adalah projek yang memanfaatkan kemampuan Mythos untuk mencari ralat dalam sistem infrastruktur di seluruh dunia.

Pihak-pihak yang terlibat termasuk AWS, Apple, Microsoft, Google, NVIDIA, Cisco, Linux Foundation, dan sebanyak 12 institusi lainnya.

Mythos

Rangkaian ini merangkumi awan komputing, sistem pengendalian, cip, peramban, infrastruktur kewangan, keselamatan siber, dan ekosistem sumber terbuka.

Dengan kata lain, pemain utama infrastruktur digital global hampir semuanya ada dalam projek ini.

Logik utama projek ini hanyalah satu: membolehkan pihak bertahan menggunakan kemampuan model AI tingkat atas ini terlebih dahulu.

Kerana jika pihak serang terlebih dahulu mendapatkan alat yang setara, tingkap tersebut akan sukar ditutup sekali dibuka. Anthropic berjanji memberikan kredit penggunaan model sebanyak $100 juta, yang mencakup tempoh persembahan penyelidikan.

Selain 12 institusi inti, lebih daripada 40 organisasi yang memelihara infrastruktur perisian penting juga mendapat akses untuk menggunakan Mythos untuk memindai sistem dan projek sumber terbuka mereka sendiri.

Sementara itu, Anthropic menyumbang 2,5 juta dolar AS kepada Linux Foundation dan 1,5 juta dolar AS kepada Apache Software Foundation, kedua-duanya merupakan infrastruktur dunia perisian.

Dengan kata lain, pelbagai aplikasi, laman web, dan sistem yang kita gunakan sekarang pada dasarnya menggunakan mereka sebagai arsitektur bawahannya.

Menurut saya, Anthropic kali ini telah melakukan perkara yang baik, tidak hanya melancarkan model yang lebih kuat, tetapi juga menghabiskan wang untuk infrastruktur maklumat global supaya mereka boleh menyempurnakan diri mereka sendiri.

After all, going naked benefits no one.

Mungkin anda masih tidak merasakan sekuat apa Mythos, tetapi saya melihat tiga kesan spesifik daripada teks rasmi, dan saya rasa ia lebih mampu menjelaskan berbanding nombor.

Mythos

Pertama, OpenBSD.

Ini adalah sistem operasi yang diakui memiliki keselamatan yang sangat tinggi, dan banyak infrastruktur penting berjalan di atasnya, termasuk sistem iOS dan Android pada telefon Apple yang kita gunakan, serta beberapa sistem dalaman perusahaan dan institusi.

Mythos menemukan satu lubang kelemahan yang telah wujud selama 27 tahun, di mana penyerang hanya perlu menyambungkan ke mesin sasaran untuk menyebabkannya gagal jauh.

27 tahun! Bukan tiada yang peduli, tetapi memang tiada siapa yang menemui.

Kedua, FFmpeg.

Hampir semua perisian yang memproses video bergantung padanya, dan anda hampir pasti akan menemui ia dalam pelbagai perisian pemutaran video yang anda gunakan.

Sebuah lubang keamanan bersembunyi dalam baris kod yang ditulis 16 tahun lalu, dan alat ujian automatik menyerang sebanyak 5 juta kali tanpa berjaya menemukannya.

Namun, Mythos telah ditemukan.

Ketiga, kernel Linux.

Ini tidak perlu dijelaskan lagi, secara keseluruhan boleh dikatakan sebagai infrastruktur asas seluruh internet, dan paling perlu diwaspadai.

Mythos bukan sahaja menemui beberapa kelemahan berasingan, tetapi menghubungkan beberapa kelemahan menjadi satu rantai serangan.

Bermula dengan kebenaran pengguna biasa, naikkan kekuasaan secara berperingkat, sehingga mencapai kawalan penuh atas keseluruhan mesin.

Mengenai Linux ini, ia benar-benar berbeza sifatnya dengan dua kes sebelumnya.

Mencari lubang kelemahan adalah kemampuan analisis.

Tetapi kelemahan aliran adalah kemampuan strategi.

Seperti banyak produk manajer yang mampu membuat prototaip, menulis dokumen, dan melakukan analisis data—semua ini adalah kemampuan titik tunggal. Tetapi, menghubungkan bisnis, produk, dan komersial bersama-sama adalah kemampuan strategik.

Sebuah model yang mampu merancang laluan serangan bukan lagi sekadar alat audit, tetapi lebih mendekati agen yang boleh bertindak secara aktif dalam persekitaran digital.

Dalam ketiga-tiga kes ini, Anthropic mengambil pendekatan menemui, melaporkan, memperbaiki, kemudian mengumumkan, dan semuanya telah diperbaiki.

Dengan melihat ini, anda akan tahu betapa kuatnya Mythos, seperti seekor binatang buas yang belum dilepaskan dari sangkar, dunia nyata perlu bersedia untuk menyesuaikan diri dengannya.

Saya ingin menyatakan beberapa pemerhatian di sini, yang mungkin juga menjadi permulaan perubahan sebenar seterusnya.

Pertama, andaian keselamatan dunia perisian sedang gagal.

Kestabilan perisian yang kita anggap biasa hari ini tidak sepenuhnya datang daripada reka bentuk sistem yang cukup baik. Sebahagian besar ia bergantung kepada kelangkaan kemampuan serangan.

Dengan kata lain, bukan perisian cukup kuat, tetapi manusia tidak cukup kuat.

Mencari lubang memerlukan kos, membina rantai pemanfaatan memerlukan masa, dan pemindanan skala besar memerlukan sumber daya. Oleh itu, banyak hutang teknikal, bug lama, dan sistem usang terus hidup tanpa dibersihkan dengan serius.

Seperti ketika kami membuat produk, kami merasa logikanya sudah tertutup dan tidak ada masalah, tetapi itu tidak bermakna semuanya sudah aman—mungkin sahaja kami telah mencapai had kemampuan kami.

Kemampuan yang ditunjukkan oleh Mythos adalah jendela masa antara penemuan dan pemanfaatan lubang keamanan telah dipersingkat dari beberapa bulan menjadi beberapa minit.

Apa yang dimaksud dengan beberapa minit?

Maksudnya, tempoh pembaikan dan proses memperbaiki telah bermula tertinggal daripada kelajuan serangan.

Kedua, dunia sumber terbuka akan merasakan tekanan terlebih dahulu.

Hari ini, kebanyakan perisian moden di bawahnya bergantung pada banyak ketergantungan sumber terbuka. Biasanya tidak kelihatan, tetapi sekali diserang, seluruh industri akan terkesan serentak.

Mungkin ada pembaca yang tidak begitu memahami logik ini; dengan kata mudah, semua perisian yang kita gunakan sekarang mempunyai projek sumber terbuka sebagai asasnya, dan kod sumber projek-projek ini boleh dilihat oleh semua orang.

Selepas ini, apabila model mampu memindai projek sumber terbuka secara berterusan dan berskala besar, tahap tekanan yang dihadapi oleh pengekalan komuniti sumber terbuka akan benar-benar berbeza.

Inilah sebab mengapa Anthropic memberi sumbangan kepada Linux Foundation dan Apache Foundation.

Bukan tentang kegiatan kebajikan, tetapi mengakui bahawa infrastruktur sumber terbuka adalah tapak paling rapuh dan paling tidak boleh runtuh dalam dunia digital di era AI; mereka hanya tidak ingin dianggap sebagai orang jahat.

Ketiga, manusia akan dilemahkan, dan AI akan mulai bermain melawan AI.

Nilai pasukan keselamatan produk internet dahulu terletak pada keupayaan penilaian manusia, pengalaman yang terkumpul, dan pemahaman mendalam terhadap sistem.

Di masa depan, perkara ini akan mengikuti logik yang berbeza.

Yang dipertandingkan ialah siapa model yang lebih kuat, siapa alat yang lebih pantas disambungkan, dan siapa yang boleh memasukkan audit AI ke hujung paling awal dalam proses pembangunan.

Ini bukan masalah programmer digantikan, tetapi cara penghasilan dalam industri keselamatan itu sendiri akan disusun semula.

Di sisi lain, ribuan lubang kelemahan berisiko tinggi boleh ditemui dalam beberapa minggu. Masalahnya, pihak serang juga akannya memiliki alat yang setara pada suatu masa.

Pada masa itu, keselamatan produk perisian bukan lagi pertarungan antara manusia dengan manusia, tetapi permainan serangan dan pertahanan antara model dengan model.

Kali ini, Anthropic tidak hanya memperkenalkan kemampuan, tetapi juga risikonya. Mungkin ini adalah kejujuran yang paling diperlukan oleh seluruh industri pada peringkat ini.

Semua orang membincangkan bagaimana AI mengubah kecekapan kerja, dan itu tidak salah.

Namun, Mythos juga mengingatkan kita bahawa lompatan kemampuan AI akhirnya akan merambat dari dunia kandungan ke dunia perisian, kemudian ke infrastruktur seluruh dunia digital.

Dunia kandungan telah ditulis semula, yang mempengaruhi logik trafik.

Dunia perisian ditulis semula, dan fondasinya digerakkan.

Pada masa ini, saya teringat kepada satu baris dialog dari filem "2012", yang juga menjadi penutup artikel ini.

Sama ada siapa pun anda, tanpa mengira kaum atau negara, esok kita semua tidak berbeza!