BTCC / BTCC Square / TechFlowPost /
X 開源推薦算法,我們到底寫什麼內容才更吸引人?

X 開源推薦算法,我們到底寫什麼內容才更吸引人?

Published:
2026-01-20 06:44:01
18
2

作者:David,深潮 TechFlow

1 月 20 日下午,X 開源了新版推薦算法。

Musk 配的回复挺有意思:「我們知道這算法很蠢,還需要大改,但至少你能看到我們在實時掙扎著改進。別的社交平台不敢這麼幹。」

image

這話有兩層意思。

這是 X 第二次開源算法。 2023 年那版代碼三年沒更新,早就和實際系統脫節了。 這次完全重寫,核心模型從傳統機器學習換成了 GROK transformer,官方說法是「徹底消除了手工特徵工程」。

翻譯成人話:以前的算法靠工程師手動調參數,現在讓 AI 直接看你的互動歷史來決定推不推你的內容。

對內容創作者來說,這意味著以前那套「幾點發帖最好」「帶什麼 tag 漲粉」的玄學可能不靈了。

我們也翻了翻開源的 Github 倉庫,在 AI 的輔助下,發現代碼裡確實藏著一些硬邏輯,值得扒一扒。

算法邏輯變化​​:從手工定義,到 AI 自動判斷

先說清楚新舊版本的區別,不然後面的討論容易混。

2023 年,推特開源的那版叫 Heavy Ranker,本質就是傳統機器學習。 工程師要手動定義幾百個「特徵」:這條帖子有沒有圖、發帖人粉絲多少、發佈時間離現在多久、帖子裡有沒有鏈接...

然後給每個特徵配權重,調來調去,看哪個組合效果好。

這次開源的新版叫 Phoenix,架構完全不同,你可以理解成一個更加依賴 AI 大模型的算法,核心是用 Grok 的 transFORMer 模型,和 ChatGPT、Claude 用的是同一類技術。

官方 README 文檔裡寫得很直白:「We have eliminated every single hand-engineered feature。」

傳統那種靠手工提取內容特徵的規則,一個不剩,全砍了。

那現在,這個算法靠什麼判斷一個內容到底好不好?

答案是靠你的。 你過去點贊過什麼、回復過誰、在哪些帖子上停留超過兩分鐘、屏蔽過過哪類賬號。 Phoenix 把這些行為餵給 transformer,讓模型自己學出規律並進行總結。

image

打個比方:舊算法像一張人工編寫的評分錶,每項打勾算分;

新算法像一個看過你所有瀏覽記錄的 AI,你下一秒想看什麼。

對創作者來說,這意味著兩件事:

因為模型不再看這些固定特徵,它看的是每個用戶的個人偏好。

這個反應被量化成了 15 種行為預測,我們下一章細說。

算法在預測你的 15 種反應

Phoenix 拿到一條待推薦的帖子後,會預測當前用戶看到這條內容可能產生的 15 種行為:

  • 正向行為:如點贊、回复、轉發、引用轉發、點擊帖子、點擊作者主頁、看完一半以上視頻、展開圖片、分享、停留超過一定時長、關注作者
  • 負向行為:如點「不感興趣」、Block 作者、Mute 作者、舉報
  • 每種行為對應一個預測概率。 比如模型判斷你有 60% 概率點贊這條帖子、5% 概率屏蔽這個作者等等。

    然後算法做一件簡單的事:把這些概率乘以各自的權重,加起來,得到一個總分。

    image

    公式長這樣:

    正向行為的權重是正數,負向行為的權重是負數。

    總分高的帖子排前面,低的沉下去。

    跳出公式,其實說白了就是:

    按這個思路想,極端情況下一條低俗但讓人忍不住回复吐槽的帖子,得分可能比一條優質但沒人互動的帖子更高。 這套系統的底層邏輯或許就是如此。

    不過,新開源版本的算法沒公開具體行為權重的數值,但 2023 年那版公開過。

    舊版參考:一次舉報 = 738 次點贊

    接下來我們可以扒一下 23 年的那組數據,雖然是舊的,但能幫你理解各種行為在算法眼裡的「價值」差多少。

    2023 年 4 月 5 日,X 確實在 GitHub 上公開過一組權重數據。

    直接上數字:

    image

    翻譯的再直白一些:

    數據來源:舊版 GitHub twitter/the-algorithm-ml 倉庫,點擊可以查看原算法

    幾個數字值得細看。

    權重只有 0.5,是所有正向行為裡最低的。 算法眼裡,一個點讚的價值約等於零。

    「你回复,作者又回复你」的權重是 75,是點讚的 150 倍。 算法最想看到的不是單向的讚,而是來回的對話。

    一次 Block 或 Mute(-74)需要 148 次點贊才能抵消。 一次舉報(-369)需要 738 次點贊。 而且這些負分會累積到你的賬號信譽分裡,影響後續所有帖子的分發。

    只有 0.005,幾乎可以忽略。 這和抖音、TikTok 形成鮮明對比,那兩個平台把完播率當核心指標。

    官方在同一份文件裡也寫了:「The exact weights in the file can be adjusted at any time... Since then, we have PEriodically adjusted the weights to optimize for platform metrics.」

    權重隨時可能調,而且確實調過。

    新版本沒公開具體數值,但 README 裡寫的邏輯框架一樣:正向加分,負向扣分,加權求和。

    具體數字可能變了,但量級關係大概率還在。 你回复別人的評論,比收到 100 個贊更有用。 讓人想 Block 你,比沒人互動更糟糕。

    知道這些後,我們創作者能做什麼

    扒完推特的新舊算法代碼,結合來看,提煉幾條可操作的結論。

    權重表裡「作者回複評論者」是最高分項(+75),比用戶單方麵點贊高 150 倍。 不是讓你去求評論,而是有人評論了就回。 哪怕回一句「謝謝」,算法也會記一筆。

    一次 block 的負面影響需要 148 次點贊才能抵消。 爭議內容確實容易引發互動,但如果互動方式是「這人煩死了,block」,你的賬號信譽分會持續受損,影響後續所有帖子的分發。 爭議流量是雙刃劍,砍別人之前先砍自己。

    ,這點 Musk 自己公開說過。 想導流的話,正文寫內容,鏈接扔第一條評論。

    新版代碼裡有個 Author Diversity SCorer,作用是給同一作者連續出現的帖子降權。 設計意圖是讓用戶的 feed 更多樣,副作用是你連發十條不如精發一條。

    舊版算法有「發佈時間」這個人工特徵,新版說砍就砍了。 Phoenix 只看用戶行為序列,不看帖子是幾點發的。 那些「週二下午三點發帖效果最好」的攻略,參考價值越來越低。

    以上是代碼層面能讀出來的東西。

    還有一些加分減分項來自 X 的公開文檔,不在這次開源的倉庫裡:藍標認證有加成、全大寫會被降權、敏感內容觸發 80% 觸達率削減。 這些規則沒開源,就不展開了。

    總結來看,這次開源的東西挺實在。

    完整的系統架構、候選內容的召回邏輯、排序打分的流程、各種過濾器的實現。 代碼主要是 Rust 和 PYTHon,結構清晰,README 寫得比很多商業項目都詳細。

    但有幾樣關鍵的東西沒放出來。

    代碼裡只寫了「正向行為加分,負向行為扣分」,具體點贊值多少分、block 扣多少分,沒說。 2023 年那版至少把數字亮出來了,這次只給了公式框架。

    Phoenix 用的是 Grok transformer,但模型本身的參數沒放。 你能看到模型怎麼被調用,看不到模型內部怎麼算的。

    模型是用什麼數據訓出來的、用戶行為怎麼採樣、正負樣本怎麼構造,都沒說。

    打個比方,這次開源相當於告訴你「我們用加權求和算總分」,但沒告訴你權重是多少;告訴你「我們用 transformer 預測行為概率」,但沒告訴你 transformer 裡面長什麼樣。

    橫向比較的話,TikTok 和 Instagram 連這些都沒公開過。 X 這次開源的信息量,確實比其他主流平台多。 只是離「完全透明」還有距離。

    這不是說開源沒有價值。 對創作者和研究者來說,能看到代碼總比看不到強。

    |Square

    下載BTCC APP,您的加密之旅從這啟程

    立即行動 掃描 加入我們的 100M+ 用戶行列

    本站轉載文章均源自公開網絡平台,僅為傳遞行業信息之目的,不代表BTCC任何官方立場。原創權益均歸屬原作者所有。如發現內容存在版權爭議或侵權嫌疑,請透過[email protected]與我們聯絡,我們將依法及時處理。BTCC不對轉載信息的準確性、時效性或完整性提供任何明示或暗示的保證,亦不承擔因依賴這些信息所產生的任何直接或間接責任。所有內容僅供行業研究參考,不構成任何投資、法律或商業決策建議,BTCC不對任何基於本文內容採取的行為承擔法律責任。