X 推出新推薦演算法,優先考慮用戶行為而非點讚

iconOdaily
分享
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary icon精華摘要

expand icon
X 已推出新的推薦演算法 Phoenix,取代舊有的 Heavy Ranker。新系統採用 Grok 轉換器模型,分析用戶行為序列,而非依賴「喜歡」或人工設定的特徵。演算法預測 15 種用戶反應,並更重視封鎖或靜音等行為。鏈上新聞顯示,用戶互動現對內容可見度有更大影響。此更新或會影響新代幣上市,因平台內容優先排序方式已改變。

原文作者:David,深潮 TechFlow

1月20日下午,X開放了新版推薦演算法。

Musk 的回應頗有趣:「我們知道這個演算法很蠢,還需要大幅修改,但至少你能看到我們正在即時掙扎著改進。其他社交平台不敢這樣做。」

圖片

這話有兩層意思。一是承認演算法有問題,二是以「透明」作為賣點。

這已是 X 的第二次開源演算法。2023 年那版的程式碼三年沒有更新,早已與實際系統脫節。這次是完全重寫,核心模型由傳統機器學習改為 Grok transformer,官方說法是「徹底消除了手動特徵工程」。

以前的演算法要靠工程師人手調校參數,現在則讓 AI 直接睇你的互動紀錄,決定有沒有需要向你推薦內容。

對內容創作者來說,這意味著以往那些「什麼時間發帖最好」、「加上什麼 tag 才能增加追蹤」的玄學方法可能已經失效了。

我們也翻查了開源的 Github 倉庫,在 AI 的協助下,發現程式碼中確實藏著一些硬邏輯,值得深入研究一下。

演算法邏輯的變化:由手動定義,到由 AI 自動判斷

先講清楚新舊版本的分別,不然后面的討論容易混淆。

2023年,Twitter開源的那一版稱為Heavy Ranker,本質上就是傳統的機器學習。工程師需要手動定義數百個「特徵」:這則貼文有沒有圖片、發帖人的粉絲數有多少、發帖時間距離現在多久、貼文內有沒有連結...

然後為每個特徵配上權重,來回調整,看看哪個組合的效果較好。

這次開源的新版本叫 Phoenix,架構完全不同,你可以理解成一個更加依賴 AI 大模型的演算法,核心是用 Grok 的 transformer 模型,和 ChatGPT、Claude 用的是同一類技術。

官方的 README 文件寫得很直接:「我們已經消除了每一個手動設計的特徵。」

傳統那些依靠手動提取內容特徵的規則,一個不留,全部砍掉。

那現在,這個演算法憑什麼去判斷一個內容到底好不好?

答案在你手上行為序列你過去讚過什麼、回覆過誰、在哪些帖子上停留超過兩分鐘、屏蔽過哪些類型的賬號。Phoenix 把這些行為輸入到 transformer 中,讓模型自行學習規律並作出總結。

圖片

舉個例子:舊演算法就像一張人工編寫的評分表,每項打勾計算分數;

新演算法就像一個看過你所有瀏灠紀錄的人工智慧,直接猜你下一秒想睇啲乜。

對創作者來說,這代表著兩件事:

第一,以往那些「最佳發帖時間」、「黃金標籤」之類的技巧,參考價值已經降低了。由於模型不再關注這些固定特徵,而是專注於每個用戶的個人偏好。

其次,你的內容能否被推廣開去,越來越取決於「看到你內容的人會有什麼樣的反應」。這個反應被量化成 15 種行為預測,我們在下一章會詳細說明。

演算法預測你對 15 種反應的表現

Phoenix 在取得一條待推薦的帖子後,會預測當前用戶看到這項內容後可能產生的 15 種行為:

  1. 正面行為例如:按讚、回覆、轉發、引用轉發、點擊帖子、點擊作者首頁、觀看影片一半以上、展開圖片、分享、停留超過指定時間、關注作者
  2. 負面行為:例如點擊「不感興趣」、封鎖作者、靜音作者、舉報

每種行為對應一個預測概率。例如模型判斷你有 60% 機率點贊這篇貼文、5% 機率屏蔽這位作者等等。

然後演算法做一件簡單的事:將這些概率乘以各自的權重,加起來,得到一個總分。

圖片

公式是這樣的:

最終分數 = Σ(權重 × P(行動))

正向行為的權重為正數,負向行為的權重為負數。

總分高的帖子排在前面,低的則沉下去。

跳出公式,其實說白了就是:

現在我們說一個內容好不好,真的不單單由內容本身寫得好不好來決定(當然可讀性和利他性是傳播的基礎);更多是取決於「這條內容會令你有什麼樣的反應」。演算法不會關心帖子本身的質量,它只關心你的行為。

按這個思路來想,極端情況下,一條低俗但令人忍不住回應和吐槽的帖子,其得分可能比一條高質素但沒有人互動的帖子更高。這套系統的底層邏輯或許就是這樣。

不過,新開源版本的演算法沒有公開具體行為權重的數值,但 2023 年那版有公開過。

舊版參考:一次舉報 = 738 次讚

接下來我們可以分析一下 23 年的那組數據,雖然已經過時,但能幫助你理解各種行為在演算法眼中的「價值」差別。

2023 年 4 月 5 日,X 確實在 GitHub 上公開過一組權重數據。

直接看數字:

圖片

翻译得更直白一點:

資料來源:舊版 GitHub twitter/the-algorithm-ml 倉庫點擊可查看原演算法

幾個數字值得細看。

第一,點讚幾乎毫無價值。 權重只有 0.5,是所有正向行為中最低的。在演算法眼中,一個讚的價值幾乎等於零。

其次,對話互動才是硬通貨。 「你回應,作者又回應你」的權重是 75,是讚的 150 倍。演算法最希望看到的不是單向的讚,而是來回的對話。

第三,負面反饋的代價極高。 一次 Block 或 Mute(-74)需要 148 次贊才能抵消。一次舉報(-369)需要 738 次贊。而且這些負分會累積到你的帳戶聲譽分數中,影響後續所有帖子的分發。

第四,影片完播率的權重低得離譜。 只有 0.005,幾乎可以忽略不計。這與抖音和 TikTok 形成鮮明對比,這兩個平台將完播率視為核心指標。

官方在同一文件中亦有寫道:「檔案中的確切權重可隨時調整……自那時起,我們已定期調整權重以優化平台指標。」

權重隨時都有可能調整,而且確實曾經調整過。

新版本沒有公開具體數值,但 README 裏寫的邏輯框架一樣:正向加分,負向扣分,加權求和。

具體數字或有改變,但數量級的關係大概率仍然存在。回覆別人的留言,比收到 100 個讚更有用。令人想封你,比沒有人互動更糟糕。

在了解這些後,我們創作者可以做些什麼

分析完推特的新舊演算法代碼,綜合來看,總結出幾條具體可行的結論。

1.回覆你的評論者。 在權重表中,「作者回覆評論者」是得分最高的項目(+75),比用戶單方面點讚高 150 倍。這不是叫你去要求評論,而是當有人評論時你就回覆。即使只回覆一句「謝謝」,演算法也會記錄一次。

2. 不要讓人想滑走。 一次 block 的負面影響需要 148 次讚才能抵消。爭議內容確實容易引起互動,但如果互動方式是「這人煩死,block」,你的帳號信譽分會持續受損,影響後續所有貼文的分發。爭議流量是雙刃劍,砍人之前先砍自己。

3. 外鏈請放於評論區。演算法不希望將用戶導出站外。正文中帶有連結的內容會被降低權重這點 Musk 本人曾公開表示過。如果想導流的話,正文寫內容,連結放在第一個評論。

4.不要刷屏。 新版程式碼中加入了一個 Author Diversity Scorer,其作用是對同一作者連續出現的帖子作出降權處理。設計目的是讓用戶的資訊流更加多樣化,副作用是你連發十篇,不如專注發一篇。

6. 已經沒有「最佳發帖時間」了。 舊版的演算法有「發佈時間」這個人工特徵,新版卻說砍就砍。Phoenix 只睇用戶行為序列,唔睇帖文幾點發。那些「週二下午三點發帖效果最好」的攻略,參考價值越來越低。

以上是從程式碼層面可以讀出的東西。

另外一些加分或減分項目來自 X 的公開文件,並不在這次開源的倉庫中:例如藍標認證有加分、全大寫會被減分、觸發敏感內容會導致接觸率削減 80%。這些規則沒有開源,所以不作進一步說明。

總括而言,這次開源的東西相當實在。

完整的系統架構、候選內容的召回邏輯、排序評分的流程、各種過濾器的實現。程式碼主要使用 Rust 和 Python,結構清晰,README 的詳細程度比很多商業項目都高。

但有幾樣關鍵的東西沒有放出來。

1. 權重參數未公佈。 程式碼中只寫了「正面行為加分,負面行為扣分」,但具體點讚值加多少分、block 會扣多少分,並沒有說明。2023 年那個版本至少把數字亮出來了,這次只給了公式框架。

2. 模型權重未公開。 Phoenix 使用的是 Grok transformer,但模型本身的參數並沒有公開。你可以看到模型是如何被調用,但看不到模型內部是如何運算的。

3. 訓練數據沒有公開。 模型是用什麼數據訓練出來的、用戶行為如何採樣、正負樣本怎樣構造,都沒有說明。

舉個例子,這次開源就好像告訴你「我們用加權求和計算總分」,但沒有告訴你權重是多少;告訴你「我們用 transformer 預測行為概率」,但沒有告訴你 transformer 內部是什麼樣子。

相比之下,TikTok 和 Instagram 連這些資料都從未公開過。X 這次開源的資訊量,確實比其他主流平台多。不過距離「完全透明」仍有距離。

這並不是說開源沒有價值。對創作者和研究者來說,能夠看到程式碼總比看不到好。

免責聲明:本頁面資訊可能來自第三方,不一定反映KuCoin的觀點或意見。本內容僅供一般參考之用,不構成任何形式的陳述或保證,也不應被解釋為財務或投資建議。 KuCoin 對任何錯誤或遺漏,或因使用該資訊而導致的任何結果不承擔任何責任。 虛擬資產投資可能存在風險。請您根據自身的財務狀況仔細評估產品的風險以及您的風險承受能力。如需了解更多信息,請參閱我們的使用條款風險披露