Anthropic 推出代號為 Mythos 的超強 AI 模型,其在編碼、推理、漏洞挖掘等能力上全面超越現有頂級模型 Claude Opus 4.6;因具備突破性安全威脅能力,暫未公開上線,轉而啟動 Project Glasswing 項目,聯合 AWS、蘋果、微軟等 12 家核心科技機構及 Linux 基金會等開源組織,率先用於全球關鍵數位基礎設施的安全審計與加固。
文章作者:唐韧
文章來源:火星財經
我覺得,人類或許正以一種超出常規認知的速度被 AI 追趕。
不知道你們的現狀是怎樣的,至少我現在已經完全离不开 AI 了,我每天的工作中至少有 50% 是 AI 輔助完成的。
而且,這個比例仍在持續上升。
Meanwhile, with each new generation of models being released, both my work efficiency and quality, as well as my monthly spending on Tokens, are growing rapidly.
昨晚我看到一條消息,Anthropic 發布了一個連他們自己都不敢公開給所有人使用的模型,因為真的太強了。
這個新模型的名字叫「Mythos」,翻譯成中文就是「神話」的意思。
目前為預覽版,因此官方稱之為「Mythos Preview」。不過,這次是以一個名為「Project Glasswing」的項目形式推出。
關於這個項目,我後面會講。

上個月,Anthropic 一份內部文件意外洩露,其中提到正在開發一個比 Opus 更大、更強的模型,代號為 Mythos。
隨後,Anthropic 將此次洩露歸因於「人為錯誤」,也未進一步說明理由。
現在,這個代號為 Mythos 的模型已正式官宣。
官方宣佈歸官方宣佈,但它並未正式發布上線。也就是說,普通用戶還不能使用。
原因很直接,Anthropic 認為這個模型太強大,在安全機制到位之前不適合向所有人開放。
I think this sentence is worth pausing for a second.
通常,一家 AI 公司發布新模型都急於第一時間上線搶佔市場,但這次 Anthropic 的做法明顯有點反常。
在我看來,不是他們不想發,而是不敢發。
因為這個叫 Mythos 的模型確實很強大。
先看幾個官方公佈的測試數據。
在編碼能力上,Mythos 與目前公開最強的 Claude Opus 4.6 之間的差距不小,在各項基準測試中,Mythos 基本是完勝 Opus 4.6。

在 GPQA Diamond(研究生水平科學問答)測試中,推理能力結果為 94.6% 對 91.3%,Mythos 勝出。
在 Humanity's Last Exam 的有工具和無工具測試中,也都是 Mythos 完勝。

在與 Agent 相關的電腦操作能力上,OSWorld-Verified(自主完成電腦任務),Mythos 以 79.6% 超過 Oputs 4.6 的 72.7%。
在每個維度上,Mythos 都強於 Opus 4.6,有些甚至是碾壓式超越。

在一些任務表現上,差距已不再是小步迭代,而是大幅躍升。例如 SWE-bench Multimodal 從 27.1% 跳到 59%,幾乎翻了一倍。
他們不敢上線 Mythos 的最核心原因,就是它突破軟體世界安全防線的能力太強了。
說白了,全世界所有的系統和軟體都有漏洞,而 Mythos 能以超越人類的水平發現並攻擊這些漏洞。
假設這種能力被駭客掌握,則全球的作業系統和軟體都會受影響,尤其是一些公共基礎設施和國家安全。
Anthropic 在公告中有一句話,看完後我覺得細思極恐。

The encoding capability of AI models has reached an extremely high level, and in discovering and exploiting software vulnerabilities, they can almost surpass everyone except the most skilled humans.
關於這句話,我想多展開一下。
我出身於程式設計,因此我知道軟體是如何構建的,以及不同人撰寫的代碼差異有多大。
而且,沒有任何軟體敢聲稱自己沒有漏斗,即使這個漏洞從未被發現過。
過去的漏洞之所以能安靜地躺在系統裡數十年,並不是因為系統足夠安全。
而是因為尋找漏洞需要極高的專業能力、極大的耐心與精力,以及大量的時間。
會的人太少,敢投入的人就更少了。
這種「能力稀缺」構成了整個軟體安全世界的隱性前提。AI 介入之後,這個前提就開始鬆動了。
AI 能以超過大多數非頂尖人類能力的方式開展工作,我們可以使用它來攻擊漏洞,當然也可以用它來堵住漏洞。
為了解決這個問題,接下來我說明一下 Anthropic 推出的 Project Glasswing 是什麼。
簡單來說,這是一個利用 Mythos 的能力為全球基礎設施系統尋找漏洞的項目。
參與方包括 AWS、蘋果、微軟、谷歌、英偉達、思科、Linux 基金會等共計 12 家機構。

This lineup covers cloud computing, operating systems, chips, browsers, financial infrastructure, cybersecurity, and open-source ecosystems.
In other words, almost all key players in the global digital infrastructure are involved in this project.
這個項目的核心邏輯只有一條:讓防守方先使用這個頂級 AI 模型的能力。
因為如果攻擊方先獲得同等級的工具,一旦窗口打開就難以關閉。Anthropic 承諾提供 1 億美元的模型使用額度,涵蓋研究預覽期。
除了 12 家核心機構外,還有超過 40 個維護關鍵軟體基礎設施的組織獲得了訪問權限,可使用 Mythos 掃描其自身系統和開源項目。
同時,Anthropic 向 Linux 基金會捐贈了 250 萬美元,向 Apache 軟體基金會捐贈了 150 萬美元,這兩者都是軟體世界的基礎設施。
To put it simply, the various apps, websites, and systems we currently use are essentially built on top of their underlying architecture.
在我看來,Anthropic 這次算是做了一件好事,不僅推出了更強的模型,還花錢為全球資訊基礎設施提供支持,以完善自身。
After all, going naked benefits no one.
You may still not fully grasp how powerful Mythos is, but I found three specific examples from the official source that I believe illustrate its strength better than numbers.

第一個,OpenBSD。
這是一個公認安全性極高的作業系統,許多關鍵基礎設施都會在其上運行,包括我們使用的蘋果手機 iOS 系統、Android 系統,甚至一些企業和機構的內部系統。
Mythos 在其中發現了一個存在了 27 年的漏洞,攻擊者只要連上目標機器,就能讓它遠端崩潰。
27 年!不是沒人在意,是根本沒人找到。
第二,FFmpeg。
幾乎所有需要處理視頻的軟件都依賴它,你們使用的各種視頻播放軟件基本上都有它的身影。
一個漏洞藏在 16 年前寫成的代碼中,自動化測試工具反覆攻擊了整整 500 萬次,每次都未能發現。
但是,Mythos 找到了。
第三個,Linux 核心。
This doesn't need much explanation—it's essentially the infrastructure of the entire internet and also the most worth being cautious about.
Mythos 不僅發現了幾個獨立漏洞,更將多個漏洞串聯成一條攻擊鏈。
Start with ordinary user permissions, escalate privileges step by step, and ultimately achieve full control over the entire machine.
關於 Linux 這個,和前兩個案例的性質完全不一樣。
發現漏洞,是分析能力。
但串漏洞,就是策略能力了。
就像許多產品經理,會畫原型圖、寫文檔、做數據分析,這些都是單點能力。但能把業務、產品和商業串聯起來,就是策略能力了。
一個能規劃攻擊路徑的模型,已經不只是審計工具了,它更接近於一個可以在數位環境裡主動行動的智能體。
在以上三個案例中,Anthropic 均採用先發現、先報告、先修復、再披露的方式,目前均已修復。
看到這,你就知道 Mythos 有多強了,就像一頭暫時不敢被放出籠的猛獸,現實世界需要先做好適應它的準備。
我想在這裡說幾個觀察,或許也是接下來真正變化的開始。
第一,軟體世界的安全假設正在失效。
我們今天習以為常的軟體穩定性,並不完全來自系統設計足夠好。很大程度上,它依賴的是攻擊能力的稀缺。
說得直接一點,不是軟體夠強,而是人不夠強。
發現漏洞需要成本,構造利用鏈需要時間,大規模掃描需要資源。因此,許多技術債、陳年 bug 和老舊系統就那樣存在著,從未被認真清理過。
就像我們做產品一樣,我們覺得邏輯閉環了、沒問題了,並不代表真的萬事無憂了,很可能是我們的能力上限到了。
Mythos 展現的能力,是漏洞從被發現到被利用的時間窗口從過去的幾個月被壓縮到了幾分鐘。
幾分鐘意味著什麼?
意味著修補的節奏、修復的流程,已開始跟不上攻擊的速度。
第二,開源世界會最先感受到壓力。
今天大多數現代軟體,底下都壓著大量開源依賴。平時看不見,一旦被攻破,就是全行業同時受影響。
可能有些讀者不太了解這個邏輯,簡單來說,就是我們現在使用的所有軟體,其底層都有開源項目,而這些項目的原始碼對所有人都是公開的。
當模型能夠持續且大規模地掃描開源項目時,開源社區維護者所面對的壓力層級將會完全不同。
這也是為什麼 Anthropic 要向 Linux 基金會和 Apache 基金會捐錢的原因。
並非從事公益,而是承認開源基礎設施是 AI 時代整個數字世界最脆弱、也最不能倒下的那層地基,他們只是不想被當成壞人和惡人而已。
第三,人類會被弱化,AI 將開始與 AI 博弈。
過去,互聯網產品安全團隊的價值在於人的判斷力、經驗積累和對系統的深度理解。
未來,這件事會換個邏輯。
比的是誰的模型更強、誰的工具接得更快、誰能把 AI 審計嵌入開發流程的最前端。
這不是程式設計師被取代的問題,而是安全行業本身的生產方式將會重組。
好的,那面有數千個高危漏洞可以在幾週內被找出。麻煩的是,攻擊方遲早也會擁有同等級的工具。
到那個時候,軟體產品的安全不再是人與人的對抗,而是模型與模型之間的攻防博弈。
這次,Anthropic 不只發布了能力,還發布了風險。可能是目前這個階段,整個行業最需要看到的那種誠實。
所有人都在談 AI 如何改變工作效率,這沒毛病。
但 Mythos 也在提醒我們,AI 能力的躍最終會從內容世界傳導到軟體世界,再傳導到整個數字世界的基礎設施。
內容世界被改寫,影響的是流量邏輯。
The software world has been rewritten, and the foundation has been shaken.
此時,我想起了電影《2012》裡的一句台詞,也作為這篇文章的結尾吧。
Whoever you are, regardless of race or nationality, tomorrow we are all the same!
