X演算法開源三年後，五大重點總結

1、相隔近三年，馬斯克再次開源 X 推薦演算法

剛剛，X 工程團隊在 X 發文宣布，正式開源 X 推薦演算法。據介紹，這個開源庫包含為 X 上「為你推薦」資訊流提供支援的核心推薦系統。它將網絡內內容（來自用戶關注的帳戶）與網絡外內容（透過基於機器學習的檢索發現）結合，並使用基於 Grok 的 Transformer 模型對所有內容進行排序。換句話說，這套演算法採用了與 Grok 相同的 Transformer 架構。

開源地址：https://x.com/XEng/status/2013471689087086804

X 的推薦演算法負責生成用戶在主介面看到的內容。「為你推薦」內容它從兩個主要來源獲取候選貼文：

你關注的賬號（In-Network / Thunder）
平台內發現的其他帖子（Out-of-Network / Phoenix）

這些候選內容隨後會被統一處理、過濾，然後按相關性排序。

那麼，演算法的核心架構與運作邏輯是怎樣的？

演算法首先會從兩個來源抓取候選內容：

關注內容：來自你主動關注的賬號所發佈的帖子。
非關注內容：由系統在整個內容庫中搜尋出的、可能你感興趣的帖子。

這個階段的目標是「找出可能相關的帖子。」

系統會自動移除低質素、重複、違反規定或不恰當的內容。例如：

已被屏蔽的帳戶內容
與用戶明確不感興趣的主題
非法、過時或無效帖子

這樣可確保在最終排序時只處理有價值的候選內容。

這次開源的演算法核心在於系統使用了一個基於 Grok 的 Transformer 模型（類似大型語言模型 / 深度學習網絡）對每一個候選貼文進行評分。Transformer 模型會根據用戶的歷史行為（如贊、回覆、轉發、點擊等）預測每種行為的機率。最後，這些行為機率會被加權組合，形成一個綜合得分，得分越高，貼文就越有可能被推薦給用戶。

這個設計基本上廢除了傳統手動提取特徵的做法，改用端到端的學習方式來預測用戶興趣。

這不是馬斯克首次將 X 的推薦演算法開源。

早在 2023 年 3 月 31 日，正如馬斯克收購 Twitter 時所承諾的，他已正式將 Twitter 的部分原始碼開源，其中包括在用戶時間軸中推薦推文的演算法。項目開源當日，GitHub 上已獲得 10k+ 顆星標。

當時，馬斯克在 Twitter 上表示此次發布的是「大部分推薦演算法」其餘的演算法亦將陸續開放。他還提到，希望「獨立的第三方能夠以合理的準確度確定 Twitter 可能向用戶展示的內容」。

他在 Space 關於演算法發佈的討論中表示，這次開源計劃是希望讓 Twitter 成為「互聯網上最透明的系統」，並讓它像最知名、最成功的開源項目 Linux 一樣強大。「總體目標，就是讓繼續支持 Twitter 的用戶能最大程度地享受這裡。」

現時距離馬斯克首次開放 X 算法的源碼，已經過了近三年的時間。而作為科技圈的超級 KOL，馬斯克早已為這次開源做了充足的宣傳。

1月11日，馬斯克在X發文表示，將在7天內將新的X演算法（包括用於決定向用戶推薦哪些自然搜尋內容和廣告內容的所有代碼）開源。

此流程每 4 週重複一次，並附有詳細的開發者說明，以協助用戶了解發生了什麼改變。

今天，他的承諾再次兌現了。

2、馬斯克為什麼要開源？

當馬斯克再次提及「開源」時，外界的第一反應並非技術理想主義，而是現實壓力。

在過去一年，X 因其內容分發機制屢屢陷入爭議。該平台被廣泛批評在演算法層面偏袒和助長右翼觀點，這種傾向並非零星個案，而被認為具有系統性特徵。去年發布的一份研究報告就指出，X 的推薦系統在政治內容傳播上出現了明顯的新偏見。

同時，一些極端案例進一步放大了外界的質疑。去年，一段涉及美國右翼活動人士查理·柯克遇刺的未經審查視頻在 X 平台迅速傳播，引發輿論震動。批評者認為，這不僅暴露了平台審核機制的失效，也再次凸顯了演算法在「放大什麼、不放大什麼」上的問題。 隱性權力。

在這樣的背景下，馬斯克突然強調演算法透明性，很難被簡單地解讀為一次純粹的技術決定。

3、網民如何看待？

X 平台的推薦演算法開源後，有用戶總結了以下五點關於推薦機制的內容：

回覆你的評論「回覆 + 作者回應」的權重是讚的 75 倍。不回覆評論會嚴重影響曝光率。
連結會降低曝光率應該把連結放在個人簡介或置頂帖內，千萬不要放在帖子正文中。
觀看時長至關重要如果他們滑動屏幕略過，你就無法吸引他們。影片／貼文之所以能獲得高關注，是因為它們能令用戶停下來。
專注你的範疇「模擬叢集」是真實存在的。如果你偏離了你的細分領域（加密貨幣、科技等），你將無法獲得任何分銷渠道。
屏蔽／默不作聲會大幅降低你的分數要有爭議性，但不要令人討厭。

總而言之：與你的受眾溝通，建立關係，讓用戶留在應用程式內。其實很簡單。

也有網民發現，雖然架構是開源的，但仍有部分內容未有開源。該網民表示，此次發布本質上只是一個框架，並沒有引擎。具體缺少了什麼？

缺少權重參數 - 碼數確認「積極行為加分」和「消極行為扣分」，但與 2023 年版本不同的是，具體的數值被刪除了。
隱藏模型權重 - 不包括模型本身的內部參數和計算。
未公佈的訓練數據 - 我們對訓練模型的數據、用戶行為的採樣方式，以及如何構建「好」樣本與「壞」樣本一無所知。

對一般X用戶而言，X的演算法開源不會造成太大影響。但更高的透明度可以解釋為什麼有些帖子能獲得曝光而另一些則無人問津，並使研究人員能夠研究平台如何對內容進行排名。

4、為什麼推薦系統是必爭之地？

在大多數技術討論中，推薦系統這往往被視為後台工程的一部分，低調、複雜，卻很少站在聚光燈下。但如果真正拆解互聯網巨頭的商業運轉方式，會發現推薦系統並不是邊緣模組，而是支撐整個商業模式的「基礎設施級存在」。正因如此，它可以被稱為互聯網行業的「沉默巨獸」。

公開數據已反覆印證這一點。亞馬遜曾披露，其平台上約 35% 的購買行為直接來自推薦系統；Netflix 更為激進，約 80% 的觀看時間由推薦演算法驅動；YouTube 的情況同樣類似，約 70% 的觀看來自推薦系統，特別是資訊流（feed）。至於 Meta，雖然從未給出明確比例，但其技術團隊曾提到，公司內部計算集群中約 80% 的運算週期都用於服務推薦相關任務。

這些數字代表什麼意思？如果將推薦系統從這些產品中移除，幾乎等同於抽掉地基以 Meta 為例，廣告投放、用戶停留時間和商業轉化，幾乎都建立在推薦系統之上。推薦系統不僅決定用戶「看什麼」，更直接決定平台「如何賺錢」。

然而，正是這樣一個決定生死的系統，長期面臨著工程複雜度極高的問題。

在傳統推薦系統架構中，很難用一個統一模型去涵蓋所有場景。現實中的生產系統往往高度碎片化。以 Meta、LinkedIn、Netflix 這類公司為例，一個完整的推薦鏈路背後，通常同時運行著 30 個甚至更多專用模型：召回模型、粗排模型、精排模型、重排模型，各自針對不同目標函數和業務指標進行優化。每個模型背後，往往對應一個甚至多個團隊，負責特徵工程、訓練、調參、上線與持續迭代。

這種模式的代價是顯而易見的：工程複雜、維護成本高、跨任務協同困難。一旦有人提出「是否可以用一個模型解決多個推薦問題」，對整個系統而言，意味著複雜度的數量級下降。這正是行業長期渴望卻難以實現的目標。

大型語言模型的出現，為推薦系統提供了一條新的可能路徑。

大型語言模型（LLM）已在實踐中證明，它們可以成為極其強大的通用模型：具備強大的跨任務遷移能力，而且隨著數據規模和運算能力的擴展，其性能還能持續提升。相比之下，傳統的推薦模型往往是「任務專用型」的，很難在多個場景之間共享能力。

更重要的是，單一大模型帶來的不僅是工程簡化，還包括「交叉學習」的潛力。當同一個模型同時處理多個推薦任務時，不同任務之間的訊號可以互相補充，隨著數據規模增長，模型更容易整體進化。這正是推薦系統長期以來所渴望、卻很難透過傳統方式實現的特性。

LLM 改變了什麼？其實是從特徵工程改變為理解能力。

從方法論層面來看，LLM 對推薦系統最大的改變，發生在「特徵工程」這個核心環節。

在傳統的推薦系統中，工程師需要先人工構造大量信號：用戶點擊歷史、停留時間、相似用戶偏好、內容標籤等，然後明確告訴模型「請根據這些特徵作出判斷」。模型本身並不理解這些信號的語義，只是在數值空間中學習映射關係。

引入語言模型後，這個流程被高度抽象化。你不再需要逐項指定「關注這個信號、忽略那個信號」，而是可以直接向模型描述問題本身：這是一個用戶，這是內容；這個用戶過去喜歡過類似內容，其他用戶對這內容也有正面反饋——現在請判斷，這內容是否應該推薦給這個用戶。

語言模型本身已經具備理解能力，它可以自行判斷哪些資訊是重要信號，以及如何綜合這些信號作出決策。在某種意義上，它不只是執行推薦規則，而是在「理解推薦這件事」。

這種能力的來源，在於 LLM 在訓練階段接觸過海量、多樣化的數據，使其更容易掌握細微但重要的模式。相比之下，傳統推薦系統必須依靠工程師顯式地列舉這些模式，一旦遺漏，模型便無法察覺。

從後端角度看，這種變化並不陌生。就像你向 GPT 提問，它會根據上下文生成回答；同樣地，當你問它「我是否會對這內容感興趣」，它也可以根據已有資訊作出判斷。在某種程度上，語言模型本身已經天然具備「推薦」的能力。