Anthropic Meluncurkan Model AI Mythos, Sementara Dibatasi untuk Audit Keamanan Infrastruktur

Anthropic meluncurkan model AI canggih bernama Mythos, yang secara komprehensif mengungguli model terkemuka saat ini, Claude Opus 4.6, dalam kemampuan pemrograman, penalaran, dan penemuan kerentanan; karena memiliki kemampuan ancaman keamanan yang revolusioner, model ini belum dirilis secara publik, melainkan memulai proyek Project Glasswing, bekerja sama dengan 12 lembaga teknologi inti seperti AWS, Apple, Microsoft, serta organisasi open source seperti Linux Foundation, untuk pertama kalinya digunakan dalam audit dan penguatan keamanan infrastruktur digital kritis global.

Penulis artikel: Tang Ren

Sumber artikel: Huoxing Caijing

Saya merasa, manusia mungkin sedang dikejar oleh AI dengan kecepatan yang melampaui pemahaman biasa.

Saya tidak tahu keadaan Anda sekarang, tapi setidaknya saya sekarang sudah benar-benar tidak bisa lepas dari AI, setidaknya 50% pekerjaan saya setiap hari diselesaikan dengan bantuan AI.

Selain itu, rasio ini terus meningkat.

Meanwhile, with each new generation of models being released, both my work efficiency and quality, as well as my monthly spending on tokens, are growing rapidly.

Tadi malam saya melihat sebuah berita, Anthropic meluncurkan model yang bahkan mereka sendiri tidak berani merilis secara publik karena benar-benar sangat kuat.

Nama model baru ini adalah "Mythos", yang diterjemahkan ke dalam bahasa Mandarin berarti "mitos".

Saat ini merupakan versi preview, sehingga resminya disebut sebagai 'Mythos Preview'. Namun, kali ini dirilis dalam bentuk proyek bernama 'Project Glasswing'.

Tentang proyek ini, saya akan bahas nanti.

Mythos

Bulan lalu, sebuah dokumen internal Anthropic bocor secara tidak sengaja, menyebutkan bahwa sebuah model yang lebih besar dan lebih kuat daripada Opus sedang dikembangkan, dengan kode nama Mythos.

Selanjutnya, Anthropic menyalahkan kebocoran ini atas "kesalahan manusia" dan tidak memberikan penjelasan lebih lanjut.

Now, the model codenamed Mythos has been officially announced.

Meskipun telah diumumkan secara resmi, namun belum dirilis secara publik. Artinya, pengguna biasa belum dapat menggunakannya.

Alasannya sangat jelas, Anthropic merasa model ini terlalu kuat dan tidak cocok untuk dibuka kepada semua orang sebelum mekanisme keamanan siap.

Saya merasa, kalimat ini layak dihentikan sejenak untuk dipikirkan.

Biasanya, sebuah perusahaan AI yang meluncurkan model baru akan berusaha secepat mungkin untuk memasuki pasar, tetapi kali ini tindakan Anthropic jelas terasa tidak biasa.

Menurut saya, bukan mereka tidak ingin mengirim, tetapi mereka takut untuk mengirim.

Karena model yang disebut Mythos memang sangat kuat.

Lihat terlebih dahulu beberapa data uji yang diumumkan secara resmi.

Dalam kemampuan pemrograman, jarak antara Mythos dan Claude Opus 4.6 yang saat ini merupakan yang terkuat secara publik cukup besar; dalam berbagai tes benchmark, Mythos secara umum mengalahkan Opus 4.6.

Mythos

Dalam hal kemampuan penalaran, pada tes GPQA Diamond (pertanyaan ilmiah tingkat pascasarjana), hasilnya adalah 94,6% vs 91,3%, Mythos menang.

Dalam ujian dengan dan tanpa alat di Humanity's Last Exam, Mythos juga menang mutlak.

Mythos

Dalam kemampuan operasi komputer terkait Agent, OSWorld-Verified (menyelesaikan tugas komputer secara mandiri), Mythos unggul dengan 79,6% dibandingkan Oputs 4.6 yang mencapai 72,7%.

Pada setiap dimensi, Mythos lebih unggul daripada Opus 4.6, beberapa bahkan jauh melampaui.

Mythos

Pada beberapa tugas, kesenjangan bukan lagi berupa iterasi kecil, melainkan lonjakan besar. Misalnya, SWE-bench Multimodal naik dari 27,1% menjadi 59%, hampir dua kali lipat.

Salah satu alasan paling mendasar mengapa mereka takut untuk online ke Mythos adalah kemampuannya yang sangat kuat dalam menembus pertahanan keamanan dunia perangkat lunak.

Secara sederhana, semua sistem dan perangkat lunak di seluruh dunia memiliki kerentanan, dan Mythos dapat menemukan serta menyerang kerentanan tersebut dengan kemampuan di atas manusia.

Misalkan kemampuan ini dikuasai oleh peretas, maka seluruh sistem operasi dan perangkat lunak di dunia akan terdampak, terutama beberapa infrastruktur publik dan keamanan nasional.

Anthropic dalam pengumumannya menyatakan kalimat ini, setelah membacanya, saya merasa sangat menakutkan.

Mythos

The encoding capability of AI models has reached an extremely high level, and in discovering and exploiting software vulnerabilities, they can nearly surpass everyone except the most skilled humans.

Tentang kalimat ini, saya ingin mengembangkannya lebih lanjut.

Saya berlatar belakang sebagai programmer, jadi saya tahu bagaimana perangkat lunak dibangun, dan seberapa besar perbedaan kode yang ditulis oleh orang yang berbeda.

Selain itu, tidak ada perangkat lunak yang berani mengklaim tidak memiliki celah, bahkan jika celah tersebut belum pernah ditemukan.

Kerentanan sebelumnya bisa diam selama puluhan tahun dalam sistem bukan karena sistem cukup aman.

Namun, mencari celah memerlukan kemampuan profesional yang sangat tinggi, kesabaran dan energi yang besar, serta banyak waktu.

Terlalu sedikit orang yang tahu, dan yang berani berinvestasi pun lebih sedikit lagi.

Kelangkaan "kemampuan" ini membentuk asumsi implisit di seluruh dunia keamanan perangkat lunak. Setelah AI terlibat, asumsi ini mulai goyah.

AI dapat bekerja dengan cara yang melampaui kemampuan sebagian besar manusia non-unggul, dan kita dapat menggunakannya untuk menyerang kerentanan, serta juga untuk menutup kerentanan tersebut.

Untuk menyelesaikan masalah ini, saya akan menjelaskan apa itu Project Glasswing yang dibuat oleh Anthropic.

Secara sederhana, ini adalah proyek yang memanfaatkan kemampuan Mythos untuk mencari bug pada sistem infrastruktur di seluruh dunia.

Pihak-pihak yang terlibat termasuk AWS, Apple, Microsoft, Google, NVIDIA, Cisco, Linux Foundation, dan total 12 institusi.

Mythos

Rangkaian ini mencakup komputasi awan, sistem operasi, chip, browser, infrastruktur keuangan, keamanan siber, dan ekosistem open source.

Dengan kata lain, hampir semua pemain utama dalam infrastruktur digital global ada dalam proyek ini.

Logika inti proyek ini hanya satu: biarkan pihak bertahan terlebih dahulu memanfaatkan kemampuan model AI tingkat atas ini.

Karena jika pihak penyerang terlebih dahulu mendapatkan alat setara, jendela yang terbuka akan sulit ditutup. Anthropic berkomitmen menyediakan kredit penggunaan model senilai $100 juta, mencakup periode pra-peluncuran penelitian.

Selain 12 lembaga inti, lebih dari 40 organisasi yang memelihara infrastruktur perangkat lunak kritis juga mendapatkan akses untuk memindai sistem dan proyek open source mereka menggunakan Mythos.

Sementara itu, Anthropic menyumbangkan 2,5 juta dolar AS ke Linux Foundation dan 1,5 juta dolar AS ke Apache Software Foundation, keduanya merupakan infrastruktur dunia perangkat lunak.

Secara singkat, berbagai aplikasi, situs web, dan sistem yang kita gunakan saat ini pada dasarnya didasarkan pada mereka.

Menurut saya, Anthropic kali ini melakukan hal yang baik, tidak hanya meluncurkan model yang lebih kuat, tetapi juga menghabiskan uang untuk infrastruktur informasi global agar mereka dapat menyempurnakan diri.

After all, going naked benefits no one.

Mungkin hingga saat ini Anda masih belum merasakan seberapa kuatnya Mythos. Saya menemukan tiga contoh spesifik dari teks resmi, dan menurut saya contoh-contoh ini lebih mampu menjelaskan daripada angka-angka.

Mythos

Pertama, OpenBSD.

Ini adalah sistem operasi yang diakui memiliki keamanan sangat tinggi, banyak infrastruktur kritis yang berjalan di atasnya, termasuk sistem iOS pada ponsel Apple yang kita gunakan, sistem Android, bahkan beberapa sistem internal perusahaan dan lembaga.

Mythos menemukan kerentanan yang telah ada selama 27 tahun, di mana penyerang hanya perlu terhubung ke mesin target untuk membuatnya crash jarak jauh.

27 tahun! Bukan tidak ada yang peduli, tapi memang tidak ada yang menemukannya.

Kedua, FFmpeg.

Hampir semua perangkat lunak yang memproses video bergantung padanya, dan hampir semua perangkat lunak pemutar video yang Anda gunakan pasti mengandalkannya.

Sebuah kerentanan bersembunyi di dalam kode yang ditulis dalam satu baris 16 tahun lalu, dan alat pengujian otomatis menyerangnya sebanyak 5 juta kali berturut-turut tanpa berhasil menemukannya.

Namun, Mythos telah ditemukan.

Ketiga, kernel Linux.

Ini tidak perlu dijelaskan lebih lanjut, secara dasar bisa dikatakan sebagai infrastruktur utama seluruh internet, dan paling perlu diwaspadai.

Mythos tidak hanya menemukan beberapa kerentanan terpisah, tetapi menghubungkan beberapa kerentanan menjadi satu rantai serangan.

Mulai dari izin pengguna biasa, naikkan hak akses secara bertahap, hingga mencapai kendali penuh atas seluruh mesin.

Tentang Linux, ini sama sekali berbeda sifatnya dengan dua contoh sebelumnya.

Mencari kerentanan adalah kemampuan analitis.

Namun, kerentanan rantai adalah kemampuan strategis.

Seperti banyak produk manajer yang dapat membuat prototipe, menulis dokumen, dan melakukan analisis data, semuanya merupakan kemampuan titik tunggal. Tetapi menghubungkan bisnis, produk, dan komersial menjadi satu kesatuan adalah kemampuan strategis.

Sebuah model yang dapat merencanakan jalur serangan sudah bukan lagi sekadar alat audit, melainkan lebih mendekati agen yang dapat bertindak aktif di lingkungan digital.

Dalam ketiga kasus di atas, Anthropic mengikuti pendekatan menemukan, melaporkan, memperbaiki, lalu mengungkapkan, dan semua masalah tersebut kini telah diperbaiki.

Melihat ini, Anda akan tahu seberapa kuatnya Mythos, seperti seekor binatang buas yang belum dilepaskan dari sangkarnya—dunia nyata perlu bersiap untuk beradaptasi dengannya.

Saya ingin menyampaikan beberapa pengamatan di sini, yang mungkin juga menjadi awal dari perubahan nyata berikutnya.

Pertama, asumsi keamanan di dunia perangkat lunak sedang gagal.

Stabilitas perangkat lunak yang biasa kita anggap sehari-hari hari ini tidak sepenuhnya berasal dari desain sistem yang cukup baik. Sebagian besar, ia bergantung pada kelangkaan kemampuan serangan.

Secara jelas, bukan perangkat lunaknya yang cukup kuat, tapi orangnya yang belum cukup kuat.

Mencari kerentanan memerlukan biaya, merancang rantai eksploitasi memerlukan waktu, dan pemindaian skala besar memerlukan sumber daya. Oleh karena itu, banyak utang teknis, bug lama, dan sistem usang tetap hidup tanpa pernah dibersihkan secara serius.

Seperti saat kami mengembangkan produk, kami merasa logikanya sudah tertutup dan tidak ada masalah, tapi itu tidak berarti semuanya sudah aman—kemungkinan besar kami telah mencapai batas kemampuan kami.

Kemampuan yang ditunjukkan oleh Mythos adalah jendela waktu dari penemuan hingga eksploitasi kerentanan yang sebelumnya berbulan-bulan kini diperpendek menjadi beberapa menit.

Apa artinya beberapa menit?

Artinya, ritme patch dan proses perbaikan sudah mulai tidak mampu mengikuti kecepatan serangan.

Kedua, dunia open source akan merasakan tekanan terlebih dahulu.

Hari ini, sebagian besar perangkat lunak modern didukung oleh banyak ketergantungan open source. Biasanya tak terlihat, tetapi begitu terobos terjadi, seluruh industri akan terdampak secara bersamaan.

Mungkin ada pembaca yang tidak terlalu memahami logika ini; dengan kata sederhana, semua perangkat lunak yang kita gunakan saat ini memiliki proyek open source sebagai dasarnya, dan kode sumber dari proyek-proyek ini dapat dilihat oleh semua orang.

Di masa depan, ketika model dapat secara konsisten dan skala besar memindai proyek open source, tingkat tekanan yang dihadapi oleh maintainer komunitas open source akan benar-benar berbeda.

Ini juga alasan mengapa Anthropic menyumbang kepada Linux Foundation dan Apache Foundation.

Bukan melakukan kegiatan amal, tetapi mengakui bahwa infrastruktur open source adalah fondasi paling rapuh dan paling tak boleh runtuh di dunia digital di era AI, mereka hanya tidak ingin dianggap sebagai orang jahat.

Ketiga, manusia akan dilemahkan, dan AI mulai bermain melawan AI.

Nilai tim keamanan produk internet sebelumnya terletak pada kemampuan penilaian manusia, akumulasi pengalaman, dan pemahaman mendalam terhadap sistem.

Di masa depan, hal ini akan mengikuti logika yang berbeda.

Yang dipertandingkan adalah siapa yang memiliki model lebih kuat, siapa yang dapat mengintegrasikan alat lebih cepat, dan siapa yang dapat menempatkan audit AI di awal proses pengembangan.

Ini bukan masalah programmer yang digantikan, tetapi cara produksi industri keamanan itu sendiri akan direstrukturisasi.

Di sisi lain, ribuan kerentanan berisiko tinggi dapat ditemukan dalam beberapa minggu. Masalahnya, pihak penyerang juga pasti akan memiliki alat setara.

Pada saat itu, keamanan produk perangkat lunak bukan lagi pertarungan antar manusia, melainkan permainan serangan dan pertahanan antar model.

Kali ini, Anthropic tidak hanya merilis kemampuan, tetapi juga risikonya. Mungkin ini adalah kejujuran yang paling dibutuhkan industri saat ini.

Semua orang membahas bagaimana AI mengubah efisiensi kerja, dan itu tidak salah.

Namun, Mythos juga mengingatkan kita bahwa lonjakan kemampuan AI pada akhirnya akan merambat dari dunia konten ke dunia perangkat lunak, lalu ke infrastruktur seluruh dunia digital.

Dunia konten diubah, yang memengaruhi logika lalu lintas.

Dunia perangkat lunak diubah, yang digoyang adalah fondasinya.

Pada saat ini, saya teringat satu kutipan dari film "2012", yang juga menjadi penutup artikel ini.

Siapa pun kamu, tanpa memandang ras atau negara, besok kita tidak berbeda!