Ipinakilala ni Anthropic ang Mythos AI Model, pansamantalang limitado sa mga pagsusuri ng seguridad ng imprastruktura

Inilunsad ng Anthropic ang napakalakas na AI model na may code name na Mythos, na lubos na lalampas sa kasalukuyang pinakamalalaking model, ang Claude Opus 4.6, sa mga kakayahan tulad ng coding, pag-iisip, at paghahanap ng mga vulnerability; dahil sa kanyang pagbubukas ng breakthrough na panganib sa seguridad, hindi pa ito inilabas sa publiko, kundi pinagsimulan ang Project Glasswing, na nagtatrabaho kasama ang 12 pangunahing teknolohiyang institusyon tulad ng AWS, Apple, at Microsoft, pati na rin ang Linux Foundation at iba pang open-source organizations, upang gamitin muna sa security audit at pagpapalakas ng mga kritikal na digital infrastructure sa buong mundo.

May-akda ng artikulo: Tang Ren

Pinagmulan: Mars Finance

Naniniwala ako na ang mga tao ay maaaring hinahabol ng AI sa isang bilis na labas sa karaniwang pag-unawa.

Hindi ko alam kung ano ang inyong kalagayan, ngunit sa aking kaso, hindi na ako makakalayo sa AI—bawat araw, kahit 50% ng aking trabaho ay natutulungan ng AI.

At patuloy pa itong umuunlad.

Samantala, habang ipinapakilala ang bawat bagong henerasyon ng mga modelo, tumataas nang mabilis ang aking produktibidad at kalidad sa trabaho, pati na rin ang aking buwanang gastusin sa Token.

Kahapon gabi, nakakita ako ng isang mensahe na ang Anthropic ay naglabas ng isang modelo na kahit sila mismo ay takot magbigay sa lahat ng gumagamit dahil sobrang lakas nito.

Ang pangalan ng bagong modelo ay "Mythos", na isalin sa Chinese bilang "mythos".

Kasalukuyang preview version, kaya itinatawag ito ng opisyal na「Mythos Preview」. Gayunpaman, ipinakilala ito sa pamamagitan ng isang proyekto na tinatawag na「Project Glasswing」.

Tungkol sa proyektong ito, ipapaliwanag ko ito pagkatapos.

Mythos

Noong nakaraang buwan, nalikom nang walang kamalian ang isang panloob na dokumento ng Anthropic na nagmumungkahi na may isang mas malaki at mas makapangyarihan na modelo na ginagawa, na may code name na Mythos.

Pagkatapos, isinama ng Anthropic ang paglabas na ito sa “tao na pagkakamali” at hindi nagbigay ng karagdagang paliwanag.

Ngayon, ang modelong may code name na Mythos ay opisyal na inanunsyo.

Ipinapahayag na ipinapahayag, ngunit hindi pa ito ipinakilala sa publiko. Ibig sabihin, hindi pa makakagamit ang karaniwang gumagamit.

Ang dahilan ay diretso: naniniwala si Anthropic na sobrang lakas ng modelo na ito at hindi pa angkop na ibigay sa lahat bago magkaroon ng sapat na mga mekanismo ng seguridad.

Naniniwala ako,值得停下来想一秒。

Karaniwan, isang AI company ay naglalabas ng bagong model nang agad upang makakuha ng market, ngunit ang paraan ng Anthropic sa pagkakataong ito ay malinaw na hindi karaniwan.

Sa palagay ko, hindi sila ayaw mag-post, kundi takot silang mag-post.

Dahil ang modelong tawagin na Mythos ay talagang malakas.

Muna pong tingnan ang ilang pampublikong ipinahayag na test data.

Sa kakayahan sa pag-code, malaki ang pagkakaiba sa pagitan ng Mythos at ng kasalukuyang pinakamalakas na Opus 4.6 na publiko, kung saan ang Mythos ay tila lubos na nananalo sa lahat ng mga benchmark.

Mythos

Sa pag-iisip, sa pagsubok na GPQA Diamond (graduate-level science Q&A), ang resulta ay 94.6% kumpara sa 91.3%, at nanalo ang Mythos.

Sa Humanity's Last Exam, parehong may kasamang kasangkapan at walang kasamang kasangkapan, nanalo ang Mythos.

Mythos

Sa mga kasanayan sa paggamit ng computer na may kaugnayan sa Agent, ang OSWorld-Verified (pagsasagawa ng sariling computer tasks) ay may 79.6% para sa Mythos, na higit sa 72.7% ng Oputs 4.6.

Sa bawat dimensyon, mas malakas ang Mythos kaysa sa Opus 4.6, at ilan ay lalong lubos na labis.

Mythos

Sa ilang mga gawain, ang pagkakaiba ay hindi na maliit na pagpapabuti, kundi malaking paglago. Halimbawa, ang SWE-bench Multimodal ay tumalon mula sa 27.1% patungo sa 59%, halos dumoble.

Ang isa sa mga pangunahing dahilan kung bakit hindi sila makakapag-online sa Mythos ay ang sobrang lakas nito sa pagbubukas ng mga seguridad sa mundo ng software.

Sa madaling salita, lahat ng mga sistema at software sa buong mundo ay may mga butas, at ang Mythos ay maaaring makahanap at magsalakay sa mga butas na iyon sa isang antas na hihigit sa kakayahan ng tao.

Kung ang kakayahang ito ay kinuha ng mga hacker, sasabihin ng lahat ng operating system at software sa buong mundo, lalo na ang ilang mga pampublikong imprastruktura at pambansang kaligtasan.

May isang pangungusap sa pahayag ni Anthropic, at pagkatapos basahin ito, naramdaman kong napakalalim nito.

Mythos

Ang kakayahan ng AI model sa pag-encode ay nasa napakataas na antas, at sa paghahanap at pagsasamantala ng mga bug sa software, halos makalampas na sila sa lahat kundi ang pinakamadaliang mga tao.

Tungkol sa pangungusap na ito, gustong palawigin ko pa.

Ako ay galing sa larangan ng programming, kaya alam kong paano binubuo ang software at gaano kalaki ang pagkakaiba ng code na isinusulat ng iba’t ibang tao.

At, walang software ang nagpapahayag na walang funnel, kahit na ang vulnerability na ito ay hindi pa nagkakaroon ng pagkakataong maipakita.

Hindi dahil sapat na ligtas ang sistema ang nakaraang butas ay nakatira nang tahimik sa loob ng maraming dekada.

Kundi dahil ang paghahanap ng mga bug ay nangangailangan ng napakataas na propesyonal na kakayahan, napakalaking pasensya at enerhiya, at napakaraming oras.

Masyadong kaunti ang mga taong marunong, mas kaunti pa ang mga taong kumakayod.

Ang "kakulangan sa kakayahan" na ito ay bumubuo sa implicit na presuposisyon ng buong mundo ng software security. Pagkatapos ng pagpasok ng AI, nagsimulang magbago ang presuposisyong ito.

Ang AI ay maaaring magtrabaho sa paraang hihigit sa karamihan sa kakayahan ng mga tao na hindi nangunguna, at maaari nating gamitin ito upang serbisyuhin ang mga butas, at maaari rin naming gamitin ito upang tapusin ang mga butas.

Para malutas ang problema, ipapaliwanag ko ngayon kung ano ang Project Glasswing na ginawa ni Anthropic.

Sa simpleng salita, ito ay isang proyekto na gumagamit ng kakayahan ng Mythos upang hanapin ang mga bug sa mga sistema ng infrastruktura sa buong mundo.

Ang mga kalahok ay kasama ang AWS, Apple, Microsoft, Google, NVIDIA, Cisco, Linux Foundation, at iba pa, kabuuan ng 12 na institusyon.

Mythos

Ang lineup na ito ay sumasakop sa cloud computing, operating system, chip, browser, financial infrastructure, cybersecurity, at open-source ecosystem.

Sa ibang salita, ang mga pangunahing tagapag-ugnay sa pandaigdigang digital na infrastruktura ay nasa proyektong ito.

Ang tanging pangunahing lohika ng proyektong ito ay pagpapagana muna ng kakayahan ng pinakamataas na AI model ng mga defender.

Kasi kung ang mga attacker ang unang makakuha ng mga kasangkapan na parehong antas, ang bintana ay mahirap i-close kapag ito ay buksan. Sinasakop ng Anthropic na magbigay ng $100 milyon na credit para sa paggamit ng model, na kumakatawan sa panahon ng pagsubok sa pag-aaral.

Bukod sa 12 pangunahing institusyon, may higit sa 40 na organisasyon na nagmamay-ari ng kritikal na software infrastructure na may access upang gamitin ang Mythos para i-scan ang kanilang sariling sistema at mga open-source project.

Sambil iyon, ibinahagi ni Anthropic ang $2.5 milyon sa Linux Foundation at $1.5 milyon sa Apache Software Foundation, na parehong mga infrastraktura sa mundo ng software.

Sasabihin natin na ang iba’t ibang app, website, at sistema na ginagamit natin ngayon ay batay sa kanilang underlying architecture.

Sa palagay ko, gawa ng mabuti ng Anthropic sa pagkakataong ito, hindi lamang nila ipinakilala ang mas malakas na model, kundi ginastos din nila ang pera para sa global na impormasyon na infrastruktura upang mapabuti ang kanilang sarili.

After all, going naked benefits no one.

Maaari pa ring hindi mo pa maranasan kung gaano kalakas ang Mythos, ngunit nakita ko sa orihinal na pahayag ng opisyal ang tatlong espesipikong kaso, at sa tingin ko mas nagpapaliwanag ito kaysa mga numero.

Mythos

Una, ang OpenBSD.

Ito ay isang operasyonal na sistema na kilala sa mataas na antas ng kaligtasan, at maraming kritikal na imprastruktura ang gumagamit nito, kabilang ang ating mga iPhone na may iOS, ang Android system, at kahit ilang mga pribadong at institusyonal na sistema.

Nakakita ang Mythos ng isang butas na umiiral na sa loob ng 27 taon, kung saan ang isang attacker ay maaaring magpapahinto sa layo ng target machine kung magkakaroon ng koneksyon dito.

27 taon! Hindi walang nag-aalala, kundi wala talagang nakakahanap.

Ikalawa, FFmpeg.

Nakadepende ang karamihan sa software na nagpaproseso ng video dito, at karamihan sa mga video player na ginagamit ninyo ay may kasama ito.

May isang bug na nakatago sa isang linya ng code na isinulat 16 taon na ang nakalipas, at ang automated testing tool ay nag-atake nang 5 milyon beses nang walang pagkakamali.

Ngunit natagpuan na ng Mythos.

Ikatlo, ang Linux kernel.

Hindi kailangang ipaliwanag nang marami, halos ito ang pundasyon ng buong internet, at pinakamalaking babala.

Hindi lang ni Mythos natuklasan ang ilang hiwalay na vulnerability, kundi isinambong nito ang mga ito bilang isang attack chain.

Magsimula sa ordinaryong user permissions, pataasin ang mga pribilehiyo, at makamit ang buong kontrol sa buong machine.

Tungkol sa Linux, iba ang kalikasan nito kumpara sa dalawang nakaraang kaso.

Ang paghahanap ng mga bug ay isang kakayahan sa pagsusuri.

Ngunit ang bug sa chain ay tungkol sa kakayahan ng estratehiya.

Tulad ng maraming product manager na nakakagawa ng prototype, nakasusulat ng dokumentasyon, at nakakagawa ng data analysis, ang mga ito ay mga natatanging kasanayan. Ngunit ang pag-uugnay ng negosyo, produkto, at komersyal ay ang kakayahan sa estratehiya.

Isang modelo na nakakapagplano ng ruta ng pag-atake ay hindi na lamang isang tool sa pagsusuri; mas malapit ito sa isang intelligent agent na kayang mag-act nang aktibo sa digital na kapaligiran.

Sa tatlong kaso na ito, ginamit ng Anthropic ang paraan ng paghahanap, pagrereport, pagpapabuti, at pagpapahayag pagkatapos, at lahat ay naiayos na.

Nakikita mo na kung gaano kalakas ang Mythos, tulad ng isang malakas na hayop na hindi pa nabubuksan sa kanyang bilangguan—kailangan ng mundo ang paghahanda para makasabay sa kanya.

Gusto kong ipahayag ang ilang obserbasyon dito, maaaring ang simula ng totoong pagbabago.

Una, ang mga asumpsyon sa kaligtasan sa mundo ng software ay nagsisimula nang mabigo.

Ang software stability na karaniwan natin sa araw-araw ay hindi lubos na nagmumula sa sapat na magandang disenyo ng sistema. Sa malaking bahagi, ito ay nakadepende sa kakulangan ng kakayahan sa pag-atake.

Sabi nga naman, hindi sapat ang software, kundi kulang ang tao.

Kailangan ng gastos ang paghahanap ng mga butas, kailangan ng oras ang pagbuo ng mga chain ng pagpapakita, at kailangan ng mga yaman ang malawakang pag-scan. Kaya maraming teknikal na utang, matandang bug, at lumang sistema ay nananatiling buhay nang walang seriyosong paglinis.

Tulad ng paggawa natin ng produkto, ang pagkakaisip natin na ang lohika ay kompletong naka-loop at walang problema ay hindi nangangahulugan na lahat ay ligtas na—maaaring tama lang na tayo ay nakarating sa aming pinakamataas na kakayahan.

Ang kakayahan na ipinakikita ng Mythos ay ang pagpapaliit ng oras na window mula sa pagkakatuklas hanggang sa paggamit ng vulnerability, mula sa mga buwan sa nakaraan hanggang sa mga minuto.

Ano ang ibig sabihin ng ilang minuto?

Ang ritmo ng patch at proseso ng pagpapabuti ay nagsimulang hindi makasunod sa bilis ng mga serangan.

Pangalawa, ang open-source community ang unang makakaramdam ng presyon.

Sa karamihan ng modernong software ngayon, maraming open-source na dependency ang nasa ilalim. Karaniwang hindi nakikita, ngunit kapag nasira, epekto ito sa buong industriya nang sabay-sabay.

Maaaring hindi gaanong nauunawaan ng ilang mambabasa ang lohikang ito; sa madaling salita, ang lahat ng software na ginagamit natin ngayon ay may open-source project bilang paaalaman, at ang source code ng mga proyektong ito ay nakikita ng lahat.

Sa hinaharap, kapag ang modelo ay makakapag-scan nang patuloy at sa malaking saklaw ng mga open-source project, iba ang antas ng presyon na haharapin ng mga tagapangalaga ng open-source community.

Ito rin ang dahilan kung bakit ibinigay ng Anthropic ang donasyon sa Linux Foundation at Apache Foundation.

Hindi sila nagtataglay ng gawain para sa kagandahang-loob, kundi nagtanggap na ang open-source infrastructure ay ang pinakamahina at pinakamahalagang pundasyon sa buong digital mundo sa panahon ng AI—sila ay ayaw lamang na ituring na masama o masasama.

Ikatlo, ang mga tao ay mababawasan, at ang AI ay magkakaroon ng labanan sa isa't isa.

Ang halaga ng dating team para sa kaligtasan ng mga produkto sa internet ay nasa paghuhusga ng tao, pagkakaroon ng karanasan, at malalim na pag-unawa sa mga sistema.

Sa hinaharap, magkakaroon ito ng ibang lohika.

Sino ang may mas malakas na modelo, sino ang mas mabilis na nag-uugnay ng mga kasangkapan, at sino ang makakapag-embed ng AI audit sa pinakamuna bahagi ng proseso ng pag-unlad.

Hindi ito tungkol sa pagpapalit ng mga programmer, kundi tungkol sa pagrereorganisa ng sariling paraan ng produksyon sa industriya ng seguridad.

Sa kabilang panig, libu-libo ng mataas na panganib na vulnerability ay maaaring makita sa loob ng ilang linggo. Ang problema ay, ang mga attacker ay may katumbas na kasangkapan din sa huli.

Sa panahong iyon, ang kaligtasan ng software product ay hindi na pagtatagpo ng tao sa tao, kundi pagtatalo ng model sa model.

Sa pagkakataong ito, hindi lang ipinakilala ng Anthropic ang kanilang kakayahan, kundi pati na rin ang mga panganib. Maaaring ito ang pinakamahalagang pagkakataon sa kasalukuyang yugto ng buong industriya na makita ang ganitong pagiging tapat.

Lahat ay nag-uusap kung paano binabago ng AI ang produktibidad sa trabaho, at wala mali dito.

Ngunit binabalaan din tayo ng Mythos na ang paglakas ng kakayahan ng AI ay hahantong sa pagkakalat mula sa mundo ng nilalaman patungo sa mundo ng software, at pagkatapos sa mga imprastruktura ng buong digital mundo.

Ang mundo ng nilalaman ay muling isinulat, at ang epekto nito ay sa lohika ng trapiko.

Ang mundo ng software ay binago, at ang pundasyon ang binago.

Sa kasalukuyan, naisip ko ang isang quote mula sa pelikulang “2012,” na gagamitin ko bilang wakas ng artikulong ito.

Sino man ka, anuman ang lahi mo, anuman ang bansa mo, bukas ay walang pagkakaiba tayo!