X 推出新推薦演算法，優先考慮用戶行為而非點讚

原文作者：David，深潮 TechFlow

1月20日下午，X開放了新版推薦演算法。

Musk 的回應頗有趣：「我們知道這個演算法很蠢，還需要大幅修改，但至少你能看到我們正在即時掙扎著改進。其他社交平台不敢這樣做。」

這話有兩層意思。一是承認演算法有問題，二是以「透明」作為賣點。

這已是 X 的第二次開源演算法。2023 年那版的程式碼三年沒有更新，早已與實際系統脫節。這次是完全重寫，核心模型由傳統機器學習改為 Grok transformer，官方說法是「徹底消除了手動特徵工程」。

以前的演算法要靠工程師人手調校參數，現在則讓 AI 直接睇你的互動紀錄，決定有沒有需要向你推薦內容。

對內容創作者來說，這意味著以往那些「什麼時間發帖最好」、「加上什麼 tag 才能增加追蹤」的玄學方法可能已經失效了。

我們也翻查了開源的 Github 倉庫，在 AI 的協助下，發現程式碼中確實藏著一些硬邏輯，值得深入研究一下。

演算法邏輯的變化：由手動定義，到由 AI 自動判斷

先講清楚新舊版本的分別，不然后面的討論容易混淆。

2023年，Twitter開源的那一版稱為Heavy Ranker，本質上就是傳統的機器學習。工程師需要手動定義數百個「特徵」：這則貼文有沒有圖片、發帖人的粉絲數有多少、發帖時間距離現在多久、貼文內有沒有連結...

然後為每個特徵配上權重，來回調整，看看哪個組合的效果較好。

這次開源的新版本叫 Phoenix，架構完全不同，你可以理解成一個更加依賴 AI 大模型的演算法，核心是用 Grok 的 transformer 模型，和 ChatGPT、Claude 用的是同一類技術。

官方的 README 文件寫得很直接：「我們已經消除了每一個手動設計的特徵。」

傳統那些依靠手動提取內容特徵的規則，一個不留，全部砍掉。

那現在，這個演算法憑什麼去判斷一個內容到底好不好？

答案在你手上行為序列你過去讚過什麼、回覆過誰、在哪些帖子上停留超過兩分鐘、屏蔽過哪些類型的賬號。Phoenix 把這些行為輸入到 transformer 中，讓模型自行學習規律並作出總結。

舉個例子：舊演算法就像一張人工編寫的評分表，每項打勾計算分數；

新演算法就像一個看過你所有瀏灠紀錄的人工智慧，直接猜你下一秒想睇啲乜。

對創作者來說，這代表著兩件事：

第一，以往那些「最佳發帖時間」、「黃金標籤」之類的技巧，參考價值已經降低了。由於模型不再關注這些固定特徵，而是專注於每個用戶的個人偏好。

其次，你的內容能否被推廣開去，越來越取決於「看到你內容的人會有什麼樣的反應」。這個反應被量化成 15 種行為預測，我們在下一章會詳細說明。

演算法預測你對 15 種反應的表現

Phoenix 在取得一條待推薦的帖子後，會預測當前用戶看到這項內容後可能產生的 15 種行為：

正面行為例如：按讚、回覆、轉發、引用轉發、點擊帖子、點擊作者首頁、觀看影片一半以上、展開圖片、分享、停留超過指定時間、關注作者
負面行為：例如點擊「不感興趣」、封鎖作者、靜音作者、舉報

每種行為對應一個預測概率。例如模型判斷你有 60% 機率點贊這篇貼文、5% 機率屏蔽這位作者等等。

然後演算法做一件簡單的事：將這些概率乘以各自的權重，加起來，得到一個總分。

公式是這樣的：

最終分數 = Σ（權重 × P(行動)）

正向行為的權重為正數，負向行為的權重為負數。

總分高的帖子排在前面，低的則沉下去。

跳出公式，其實說白了就是：

現在我們說一個內容好不好，真的不單單由內容本身寫得好不好來決定（當然可讀性和利他性是傳播的基礎）；更多是取決於「這條內容會令你有什麼樣的反應」。演算法不會關心帖子本身的質量，它只關心你的行為。

按這個思路來想，極端情況下，一條低俗但令人忍不住回應和吐槽的帖子，其得分可能比一條高質素但沒有人互動的帖子更高。這套系統的底層邏輯或許就是這樣。

不過，新開源版本的演算法沒有公開具體行為權重的數值，但 2023 年那版有公開過。

舊版參考：一次舉報 = 738 次讚

接下來我們可以分析一下 23 年的那組數據，雖然已經過時，但能幫助你理解各種行為在演算法眼中的「價值」差別。

2023 年 4 月 5 日，X 確實在 GitHub 上公開過一組權重數據。

直接看數字：

翻译得更直白一點：

資料來源：舊版 GitHub twitter/the-algorithm-ml 倉庫點擊可查看原演算法

幾個數字值得細看。

第一，點讚幾乎毫無價值。 權重只有 0.5，是所有正向行為中最低的。在演算法眼中，一個讚的價值幾乎等於零。

其次，對話互動才是硬通貨。 「你回應，作者又回應你」的權重是 75，是讚的 150 倍。演算法最希望看到的不是單向的讚，而是來回的對話。

第三，負面反饋的代價極高。 一次 Block 或 Mute（-74）需要 148 次贊才能抵消。一次舉報（-369）需要 738 次贊。而且這些負分會累積到你的帳戶聲譽分數中，影響後續所有帖子的分發。

第四，影片完播率的權重低得離譜。 只有 0.005，幾乎可以忽略不計。這與抖音和 TikTok 形成鮮明對比，這兩個平台將完播率視為核心指標。

官方在同一文件中亦有寫道：「檔案中的確切權重可隨時調整……自那時起，我們已定期調整權重以優化平台指標。」

權重隨時都有可能調整，而且確實曾經調整過。

新版本沒有公開具體數值，但 README 裏寫的邏輯框架一樣：正向加分，負向扣分，加權求和。

具體數字或有改變，但數量級的關係大概率仍然存在。回覆別人的留言，比收到 100 個讚更有用。令人想封你，比沒有人互動更糟糕。

在了解這些後，我們創作者可以做些什麼

分析完推特的新舊演算法代碼，綜合來看，總結出幾條具體可行的結論。

1.回覆你的評論者。 在權重表中，「作者回覆評論者」是得分最高的項目（+75），比用戶單方面點讚高 150 倍。這不是叫你去要求評論，而是當有人評論時你就回覆。即使只回覆一句「謝謝」，演算法也會記錄一次。

2. 不要讓人想滑走。 一次 block 的負面影響需要 148 次讚才能抵消。爭議內容確實容易引起互動，但如果互動方式是「這人煩死，block」，你的帳號信譽分會持續受損，影響後續所有貼文的分發。爭議流量是雙刃劍，砍人之前先砍自己。

3. 外鏈請放於評論區。演算法不希望將用戶導出站外。正文中帶有連結的內容會被降低權重這點 Musk 本人曾公開表示過。如果想導流的話，正文寫內容，連結放在第一個評論。

4.不要刷屏。 新版程式碼中加入了一個 Author Diversity Scorer，其作用是對同一作者連續出現的帖子作出降權處理。設計目的是讓用戶的資訊流更加多樣化，副作用是你連發十篇，不如專注發一篇。

6. 已經沒有「最佳發帖時間」了。 舊版的演算法有「發佈時間」這個人工特徵，新版卻說砍就砍。Phoenix 只睇用戶行為序列，唔睇帖文幾點發。那些「週二下午三點發帖效果最好」的攻略，參考價值越來越低。

以上是從程式碼層面可以讀出的東西。

另外一些加分或減分項目來自 X 的公開文件，並不在這次開源的倉庫中：例如藍標認證有加分、全大寫會被減分、觸發敏感內容會導致接觸率削減 80%。這些規則沒有開源，所以不作進一步說明。

總括而言，這次開源的東西相當實在。

完整的系統架構、候選內容的召回邏輯、排序評分的流程、各種過濾器的實現。程式碼主要使用 Rust 和 Python，結構清晰，README 的詳細程度比很多商業項目都高。

但有幾樣關鍵的東西沒有放出來。

1. 權重參數未公佈。 程式碼中只寫了「正面行為加分，負面行為扣分」，但具體點讚值加多少分、block 會扣多少分，並沒有說明。2023 年那個版本至少把數字亮出來了，這次只給了公式框架。

2. 模型權重未公開。 Phoenix 使用的是 Grok transformer，但模型本身的參數並沒有公開。你可以看到模型是如何被調用，但看不到模型內部是如何運算的。

3. 訓練數據沒有公開。 模型是用什麼數據訓練出來的、用戶行為如何採樣、正負樣本怎樣構造，都沒有說明。

舉個例子，這次開源就好像告訴你「我們用加權求和計算總分」，但沒有告訴你權重是多少；告訴你「我們用 transformer 預測行為概率」，但沒有告訴你 transformer 內部是什麼樣子。

相比之下，TikTok 和 Instagram 連這些資料都從未公開過。X 這次開源的資訊量，確實比其他主流平台多。不過距離「完全透明」仍有距離。

這並不是說開源沒有價值。對創作者和研究者來說，能夠看到程式碼總比看不到好。