BTCC / BTCC Square / TechFlowPost /
人物雜誌臥底 Kimi 100 小時:一家故意把自己「折」成二維的 AI 公司

人物雜誌臥底 Kimi 100 小時:一家故意把自己「折」成二維的 AI 公司

Published:
2026-04-02 05:00:02
18
1

作者:Liu Mo(人物雜誌)

編譯:深潮 TechFlow

這是人物雜誌有史以來最深入的 AI 公司內部報道之一,記者獲准在 Moonshot AI 內部待了 100 小時,近距離記錄了這家估值 1200 億超幣 1200 億多 從 DeepSeek 衝擊後的集體震盪,到「沒有部門、沒有 KPI、沒有職級」的極致扁平管理,再到「天才蜂群」式的組織進化——這篇特稿揭開了中國最受關注的 AI 創業公司的真實內核。

2026 年的春天,對 Kimi 格外友善。

短短幾個月內,Kimi 背後的公司似乎接連突破里程碑——收入、融資、估值紛紛刷新紀錄。 一篇由 17 歲高中實習生參與的研究論文收到了來自矽谷的讚譽,其中包括 Elon Musk。 美國估值約 500 億美元的程式設計工具 Cursor,被中國觀察者指出在產品體驗上大量依賴 Kimi 的模型。 換句話說,Kimi 似乎同時在資本、技術和商業化三條戰線上贏了。

這家公司成立才三年,估值已突破 1,200 億人民幣,約 160 億美元。 在全球 AI 敘事中,它已經無法被忽視。

但月之暗面(Moonshot AI)依然深度神秘。

我獲準進入公司內部觀察 100 小時。 身為獨立撰稿人,我可以採訪任何願意交談的員工,旁聽任何不涉及商業機密的會議,寫完後沒有人會審稿,也沒有人付我稿費。 這很符合這家公司的風格。

走進辦公室,像站在風暴眼裡。

中心地帶異常安靜。 工位只有零星的鍵盤聲,偶爾有人笑一下。 但外面的噪音——傳言、爭論、炒作、模仿、無休止的評論——在這裡似乎不留痕跡。

公司只有 300 多人,平均年齡不到 30 歲。 以估值除以人頭算,每個人肩上扛著將近 4 億人民幣的企業價值。

大約 80% 的員工是網路脈絡下的「I 人」-內向型,借用 MBTI 的說法。 人們坐在一起,但打字比說話更自在。 在這裡,內向不是缺陷,幾乎是一種運作協定。

我回想起 2024 年第一次來訪的那個晚上,當時風暴才剛開始醞釀。 那次,我並沒有留下特別好的第一印象。

「DeepSeek 救了我們」

image

2024 年 12 月 24 日,平安夜。 對中國大多數人來說,這不算什麼節日。 但對 Julian 來說,這成了她人生中最黑暗的夜晚之一。

她 26 歲,從北大畢業才兩年,沒有任何行業經驗,卻已經是 Kimi 最早的員工之一。 那天晚上,這個非常年輕卻已算「資深」的員工,在一間叫「Radiohead」的會議室裡,坐在長桌前,面對 30 多個同事,哭了。

她還沒能交出一份讓共同創辦人滿意的節慶行銷方案。

距離春節只剩一個月。 最新方案已經改了六遍,現在又要升級,甚至可能推翻重來。 從零開始重建方案,再協調產品和工程團隊執行,時間幾乎不夠。 但公司對 2025 年春節的成長寄予厚望。

這很重要,因為上一年春節正是 Kimi 的爆發節點。 以「200 萬字長文字輸入」的品牌定位,Kimi 在中國一度刷屏。 C 端用戶激增,A 股市場甚至出現了「Kimi 概念股」的說法。

那次週會又長又殘酷。

大約 20 個年輕員工輪流報告所有事:社群媒體投放、使用者營運、國內公關、海外行銷,事無鉅細。 所有人集體討論,共同創辦人拍板。

那時的 Kimi 像個青春期少年:有天賦,有潛力,但還不能完全掌控自己。 即使每月廣告預算高達數千萬人民幣,面對快速崛起的競爭對手,依然顯得笨拙。

會議在凌晨 4 點左右結束。

沒人知道 Julian 最終的方案會不會成功。 一個月後,這已經不重要了。

那一刻,全世界第一次聽到了 DeepSeek 的名字。

負責成長的 Hayley 回溫州過年,發現親戚朋友都在問同一個問題:「你聽說過 DeepSeek 嗎?」Kimi 彷彿一夜之間變成了舊聞。

她說那是她人生中最難熬的春節。 公司內部的沉默震耳欲聾。

年度全員大會通常在年後三月舉行,員工可以直接向管理階層提問。 那一年,幾乎每個問題都圍繞著 DeepSeek。

最尖銳的問題來自 HR 團隊。 他們帶著完全的真誠,把那句不舒服的話說了出來:

「候選人問我們:DeepSeek 也給了我 offer,為什麼要來 Kimi?—我們怎麼回答?」

但並不是所有人的反應都一樣。

演算法團隊的 Alex 說,如果在「DeepSeek 時刻」他感受到了什麼強烈的情緒,那不是恐懼,而是興奮。

這種感覺不只是他個人的。 它反映了演算法團隊中許多人的心態。 DeepSeek 證明了另一條路可能存在:更低成本的策略、開源路徑,以及一個很多人之前不敢相信的事實——一家不知名的中國新創公司,只要技術夠強、模型夠好,依然能贏得全球尊重。

產品團隊也沒有特別焦慮。 最早期的產品員工 Kevin 認為,DeepSeek 的爆發靠的是模型。 一旦 Kimi 自己的模型能力跟上來,產品團隊反而會有更大的空間建立有價值的功能。

沒有外人知道共同創辦人之間到底討論了什麼。 但公司行動很快。 調整策略、收窄焦點,在內部達成了接近完全的共識。

現在去問公司裡幾乎任何一個人,最重要的是什麼,他們會毫不猶豫地回答:模型。

從那以後,Kimi 內部對 DeepSeek 的尊重感越來越強。 一部分是專業上的敬佩,另一部分是別的東西。

Alex 這樣說:

「某種意義上,DeepSeek 救了我們。」

品味就是一切

「你怎麼穿這種鞋?」

Ezra 問完我之後,我比她更吃驚。 在她那層辦公區,幾乎所有人桌下都放著一雙拖鞋。 舒適的衣服和鞋子,大家相信,能讓人更放鬆、更專注、更有創意。

這就是聰明人的穿著準則。

我這輩子看過很多學霸。 但這裡的「好學生」是完全不同的物種。

Ezra 小學時試圖破解家裡電腦的密碼,因為父母不肯告訴她。 國中時她開始關注比特幣,當時一枚只要幾百塊人民幣。 她問媽媽要零用錢去投資,媽媽說那是騙局。 高中時,她第一次搭計程車,就在腦中畫出了一個叫車產品的原型。 她說如果當時有今天的 AI 工具,也許她真的能做出來。 上了大學終於有了自己的錢,她投進 A 股,虧了 90%。

那次慘痛的經歷讓她認識到人類判斷的局限性,並將她推向了 AI。

她對 AGI(通用人工智慧)的理解很簡單:創造出「N 個愛因斯坦」,用他們去解決人類最難的問題。 從那以後,她下定決心要找到一家真正在推動 AGI 極限的公司。 儘管那時她已經在股市把虧損的錢賺回來了。

因為學術背景出色,她收到了許多公司的 offer。 她選擇 Kimi 只有一個原因:面試時,創辦人楊植麟對科技的理解和對細節的認真程度深深打動了她。 她覺得他是真正在乎模型的人。 他身上沒有聰明人常見的浮躁,也沒有商人常有的功利。 事實上,面試結束時她還不知道他就是創辦人。

Karen 的性格不同,但走向了同一個地方。

他從小就叛逆。 跟老師吵架,不聽父母的話。 讀書時堅持要出國,畢業後堅持創業。 大廠提供的安穩舒適生活讓他絕望——他不想過一種從開頭就能看到結尾的人生。

我問他:如果讓你選,一個是確定拿到 60 分(滿分 100),另一個是 1% 的機率拿到 100 分,你選哪一個?

他毫不猶豫選了後者。

不是他不能接受 60 分,而是他受不了那條 100% 確定性的路。

這種「創始人式 DNA」構成了公司的底層質地。 根據內部粗略統計,月之暗面至少有 50 人先前曾創業或加入創業公司。

有人說,Kimi 喜歡招 CEO。

更準確地說,這家公司收容了一群流動中的天才漂泊者。 天才不一定是頂尖學生或模範員工。 重要的是,在某個維度上,他們能看穿時間。

在一家約 80% 員工來自 985、211 大專院校的公司裡,Yannis 的履歷不算特別亮眼。 但早在 2023 年,他就在工程社群裡預判了 DeepSeek 和 Kimi 都會崛起——那時模型公司連產品都沒有。 另一位 00 後員工注意到了他的判斷力,把他內推進了公司。

Karen 說,太多聰明人被系統困住了。 先是家庭,然後是學校,再然後是職場。 他們不自覺地服從群體期待,忘記了自己真正想要什麼。 只有少數人試圖逃脫,而他們往往不被看見。

Kimi 的使命之一,他說,就是看見他們。

如果沒有這種直覺,一個 17 歲的高中生不可能被引進來當 Kimi 的實習生,和團隊合作發表論文,後來還得到 Elon Musk 的稱讚。 把那個學生的名字放在論文第一作者位置的人是 Bob,他的導師,也是最早發現他的人。

天才與瘋子之間只有一線之隔。 當一個「不被理解的瘋子」來到月之暗面,他可能突然變成一個改變世界的天才。 又或者,某些尚未顯露的天才,只有在這樣的地方才能真正綻放。

Bob 告訴我,在某種程度上,自我(ego)大不是問題,甚至可能是好事。 如果那個自我是一種內在驅力,如果一個人相信自己必須參與一項偉大使命,那他可能正是公司不能錯過的人。

天才是偏執的。

在這個團隊裡,訓練頂級 AI 模型被戲稱為「煉丹」——這是中國技術圈的常見說法,形容模型訓練那種半科學、半玄學的過程。 但在實際操作中,煉丹意味著不停地修 bug。

每次旗艦訓練跑起來,Bob 和隊友們就進入同一套儀式。 每天早上第一件事是刷新公司龐大的內部監控面板。 數十萬條指標。 就算一條曲線異常跳動,腦中就響起警報:優化出了問題? 架構有缺陷? 數值精度不符?

他們的反應近乎動物等級的敏感。

有人甚至逐 token 檢查訓練數據,把產生極端梯度的 token 打印出來,像審問嫌犯一樣拷問:你為什麼跳得這麼劇烈?

每個真正參與「交付」一個模型的人,都經歷過這種無眠的緊張。 這不是焦慮,是好奇心驅動的執念。 正是這種偏執的警覺,把模型推向了頂級水平。

天才會聚集。

過去一年,Kimi 有超過 100 名員工是透過內推加入的-朋友的朋友,朋友的朋友的朋友。 公司內部戲稱為「人傳人」。

信任,因為這些密集的網絡,變成了一種天然的組織資產。

本質上,Kimi 把管理中最困難的部分轉移到了招募環節。 如果人是被信任的同事推薦進來的,他們更有可能擁有相同的直覺。 這就是為什麼一個詞在公司內部反覆出現:

2025 年 9 月的一個晚上,幾個工程師隨手啟動了一個內部小項目,命名為 Ensoul。 他們想讓沉睡在文件裡的程式碼「活過來」,變成命令列裡的對話助手。

這種對命名的敏感不是偶然的。

他們曾經有個框架叫 YAMAHA,全名為「Yet Another Moonshot Agent」。 最底層的基礎設施叫 Kosong,馬來語裡「空」的意思,靈感來自佛教的「色即是空」。 暗示一張白紙,沒有預設功能,但有無限可能。

品味,換句話說,塑造了產品本身。

當很多公司把聊天視窗塞進命令列時,Kimi 的工程師覺得那很醜。 真正的程式設計師打開終端機是為了下命令,不是為了聊天。 所以 Kimi CLI 被設計得更像一個智慧 shell,而不是聊天介面。 它理解命令,但不強迫自己變成對話框的樣子。

這種簡潔在程式碼裡也可見。 核心邏輯只有大約 400 行 Python,剝掉了所有不必要的裝飾。 模組之間乾淨解耦。 使用者可以自行自訂功能,或是把 Kimi 拆開重組成自己的應用程式。

Kimi Agent 曾經在內部和「OK Computer」這個短語關聯——又一個 Radiohead 的引用——後來改了名,因為對更廣泛的用戶來說太晦澀。 選這些名字的人,似乎對最大化流量不太感興趣。 他們遵從的是自己的音樂品味和語言標準。

有人開玩笑說,如果以會樂器的員工比例來衡量 AI 公司,Kimi 可能排第一。

品味已成為最高的招募標準,也是最難定義的。

它無法量化,但無所不在。

先泛化,再進化

你可能永遠搞不清楚 Kimi 每個人到底在做什麼。

公司喜歡用「團隊」而不是「部門」。 從高層看,主要方向夠清晰:演算法、產品與工程、成長、策略、營運。 但一旦你試著放大去看實際的部門劃分或固定職責,一切就開始模糊了。

因為這是一個沒有正式部門、沒有層級、沒有 title、沒有 OKR、也沒有 KPI 的組織。 報告關係簡單到像假的。

對 Brandon 來說,這完全不合理。

他畢業於清華,在矽谷巨頭和中國大廠做過管理階層,幫助過一家價值約 10 億美元的新創公司。 他在業界摸爬滾打多年,擅長技術管理,帶過將近 1000 人的團隊。 他希望進入 AI 領域,大展拳腳。

結果共同創辦人張宇韜告訴他,這家公司不是這樣運作的。 他如果加入,直接管理的人大概有兩個。

但某種關於未來的東西拉住了他,他想再談一次。

於是 2025 年 1 月,在公司內部瀰漫著懷疑和不安的時期,Brandon 見到了楊植麟——他的清華校友。

當時 Brandon 還不知道楊植麟的名字日後會和 Elon Musk、黃仁勳出現在同一篇報道裡。 他記得最清楚的是,楊植麟在基本寒暄之後說的第一句話:

「強化學習是未來。」

接下來的對話幾乎像楊植麟在自言自語。 他沉浸在自己的思緒裡,Brandon 根本聽不太懂他在說什麼,儘管全程講的都是中文。

但有一件事無比清晰:這是 Brandon 人生中第一次感覺到自己過去 20 年建構的知識體系和思考模式開始崩塌。 一起坍塌的,還有他的自負。

我問他為什麼最終加入,他語氣有點玄:楊植麟可能會成為一個偉大的預言家,因為他既有遠見,又足夠純粹。

後來,公司在這種幾乎沒有 title 的體系裡不知道怎麼定義他的角色時猶豫了,Brandon 堅定地回答:

「就算讓我去掃廁所我也來,而且我會掃得比誰都乾淨。」

不是所有前大廠管理者或專家都能在這種環境裡存活。

00 後 Phoebe 從成長團隊轉到了產品和工程團隊。 她自嘲是「一個啥也不懂的小女孩」,但她說了一件重要的事:在這家公司,深厚的經驗和光鮮的履歷反而可能成為負擔。

AI 太新了,變化太快。 一個經驗豐富的專家,學習和適應的速度未必比一個假設更少的年輕人快。

她曾看過至少三個從大廠來的中高層空降失敗。 其中一個最後選擇了離開這個行業,說身邊的人太年輕、太聰明了。 被反覆超越之後,他放棄了。 他認定,這不再是他的時代,也不再是他的行業。

DeepSeek 衝擊之後,Phoebe 也感受到了深深的危機感。 她決定放棄買量工作,轉而透過產品和工程幫助公司。 她開始高強度自學,甚至在 B 站上直播自己學習的過程,並累積數百小時。

最讓她驚訝的是,公司從一開始就毫不猶豫地給了她換崗的機會。

事實上,我訪談的 30 位員工中,超過一半都換過多次職責。 和之前的工作相比,大約 80% 的人現在做的事情完全不同。

Kimi 喜歡有「泛化能力」的人。

在 AI 領域,泛化意味著模型能在訓練資料以外的新場景中表現良好。 它不是死記硬背了答案,而是學會了底層結構。

公司把這個理念也用在了人身上。

大廠來的中高層可能在某一套 KPI 體系、某一種匯報語言、某一種內部政治遊戲裡優化太久了。 他們的「演算法」過度擬合到了一個局部最優。 當環境徹底改變時,他們可能無法適應。

如果說傳統大廠員工像專用模型,那月之暗面要的人比較像基座模型。 先透過監督微調學習基本規則,然後透過強化學習和跨任務的反覆自我博弈,獲得跨領域遷移的能力。

從矽谷回來的 James 今年 26 歲,說自己的夢想是「把錢給年輕人」。

身為 AI 的虔誠信徒,他把自己的身體視為 Agent 收集資訊的感應器。 打《英雄聯盟》時,他錄音並收集心率、脈搏等生理數據,然後分析哪個隊友的發言影響了他的情緒狀態和遊戲表現。

他的觀點尖銳到近乎極端。 他說:一個人如果在 14 歲之後才開始學一門真正的新語言,永遠不可能達到母語程度。 他認為 AI 也是類似的道理。

畢業就加入公司的 Dan 說,他人生中第一次感受到了真正的知識焦慮。

在學校,他只訓練過「玩具模型」——大約 70 億參數,32 張 GPU 跑幾天就完。 現在他要處理數百億參數的 MoE(混合專家)模型,訓練資料以萬億 token 計。 感覺像是直接從一個小水塘跳進太平洋了。

為了跟上節奏,他幾乎進入了自虐式的學習狀態。 作息完全崩潰,北京的白天變成矽谷的夜晚,然後又反過來。 他盯著訓練面板看了幾百個小時,像股票交易員盯盤一樣,眨眼的空間都沒有。

真正的挑戰不只是工作量,而是他必須同時做三份工作。

他得當演算法架構師,在一堆模型選擇的迷宮中設計最優方案。 他得當系統工程師,像維修一條橫跨全球的管道一樣調試分散式運算問題。 他得當資料煉丹師,對巨型資料集施展「煉金術」,讓模型在 benchmark 上跑分好看,同時在實際對話中又自然、柔和。

有時候這意味著在訓練過程中做緊急手術。 有一次,儲存在 bf16 精確度中的關鍵參數開始出現危險行為。 團隊當機立斷,在訓練跑到一半時切換到 fp32 精度,就為了穩住這輪訓練。 Dan 說,如果你只會寫演算法,或只會搞系統,或只會清洗數據,你永遠做不出頂級模型。 這裡沒有「我只負責這一塊」的藉口。

公司期望你把演算法、工程和數據的工作整合在一起,同時穿梭於多個世界。 這像是同時打幾份工。 但這種高強度的交叉訓練,能在很短的時間內為你帶來數年的成長。

所以,任何想加入 Ki​​mi 的人都面臨著殘酷的考驗。

沒有 OKR,沒有 KPI,沒有辦公室政治,沒有 PUA 式管理,甚至沒有打卡。 但如果你不是 AI 原生的,如果你無法泛化,如果你不能持續強化和適應,那你可能很難在這裡找到自己存在的意義。

「這裡沒有官味兒」

多數品牌都想要一個故事。

但幾乎每個 Kimi 員工都溫和地提醒我:別寫 Pink Floyd 的事,也別寫辦公室門口那架鋼琴。

他們的看法是,懂的人自然懂,不懂的人不需要懂。 Moonshot 和 Kimi 這兩個名字跟 AI 或技術沒有直接關係。 但如果公司太多談論自己和搖滾樂、藝術的關聯,就會開始顯得自我意識過剩、矯揉造作。 他們似乎覺得,美就該是不需要解釋的。

從大廠「逃」出來的 00 後 Win 告訴我,這個地方很奇怪,因為人們真的可以不開會就把事做完。

在他前東家,白天開會,晚上工作。 他學到了一個簡單的道理:如果你的精力主要花在協調生產關係上,那麼提升實際生產力的空間就所剩無幾。

這就是 AI 原生組織的一部分。

超過十個員工明確告訴我,他們越來越偏好和 AI 打交道,而不是和人。 AI 更可靠,更簡單。 這種傾向也契合公司整體內向的氣質。 有人用了一個比較溫和的字眼:害羞。

在群組聊天裡,每個人都可以很活潑、很有表達欲。 見了面,很多人卻很安靜。 Kimi 不怎麼組織文化活動。 除了年會,最近一次團體活動是在辦公室做按摩。

內向不代表缺乏溝通或活力。

雖然沒有人要求他們跟我說話,但沒有一個人拒絕。 在群組聊天裡,訊息不停飛來飛去,夾雜著各種抽象表情包。 沒有人的消息會被晾乾。

如果你需要別人配合才能完成工作,流程很簡單:直接找他。

不用通過主管,不用審批,不用開協調會,不用打通部門牆。

Kimi 沒有部門牆。 某種意義上,它甚至沒有部門。

楊植麟的簽章檔只有四個字:

儘管如此,所有人都承認,公司自成立以來一直在不斷變化。

有些變化是主動的,有些是被動的,有些甚至看起來像是反轉。 公司從大量投放轉向聚焦模型,從堅持閉源到擁抱開源,從聊天機器人產品到 Kimi Agent、Kimi Code 和 Kimi Claw,從 C 端到 B 端再到 C 端。 不是每次轉向都經得起完美推敲。

但在 Ezra 看來,有一件事始終沒變:尊重事實。

她認為,所有那些變化,都只有一個原因和一個目的:讓公司更好地對齊客觀現實。

公司容忍自負,但不喜歡招那種把自己放在事實之上的人。

從共同創辦人往下,人們相對容易被說服-只要事實夠清楚。 員工們說,這種意願來自對真相、現實、和「什麼是真實的」的極度執著。 真正聰明的人不會被誠實的回饋傷害。

這種坦誠還有一個條件:公司沒有賽馬製,沒有零和競爭,沒有大的內部利益衝突。 人們願意無償分享研究發現和技術細節,不期待回報或署名。 公司早期有自己的社區,今天依然倡導社區文化。 共享資訊和知識加速了每個人的學習,最終對所有人都有好處。

Win 說,有毒的文化會傳染,好的文化也會傳染。

有人用「團結」來形容這裡的氛圍--這個詞用在新創公司聽起來幾乎有些老派。 但公司所處的環境很嚴酷:外面是巨頭級競爭對手,內部是被大廠擠壓的壓力,算力資源有限。 這些約束,如果說有什麼作用的話,似乎反而增強了凝聚力。

歸根究底,人是組織中唯一真正重要的資產。

最近,Florence 被一家競爭對手以雙倍薪資挖角。 她當即拒絕。 理由很簡單:

「這裡沒有官味兒。」

公司的新辦公室。

image

「我不知道她怎麼撐過來的」

在訪談開始前,我非常緊張。 我即將採訪一些世界上最聰明的 AI 從業者,而我是文科出身,從沒在科技業工作過,對 AI 的了解有限。

但當我真正開始和演算法及產品工程團隊的年輕專家交談時,我發現緊張的是他們。 他們擔心如果我聽不懂這個術語會尷尬。

所以他們先把英文翻譯成中文,然後再把那個中文翻譯成一個更簡單的、我能聽懂的中文。

那種保護的本能令人感動。

採訪開始前,公司只給了我一條指示:保護每一個人。

所以我盡量避免問太敏感或可能傷害人的問題。

即便如此,Ty 在電話訪談中還是沒能完全隱藏住一絲情緒的顫抖。 剛加入公司經歷艱難的適應期時,曾一度覺得撐不下去,甚至想過離職。

然後某一週的全員會上,他看到 Annie——一個才畢業兩年的女生——在經歷無數次挫折和內心懷疑之後,終於把一個艱難的項目推動了下去。 看到這一幕,他覺得自己不能放棄。 他比她年長,經歷更多,但在純粹的耐力和意志力上,他覺得自己更弱。

他說:

「我不知道她怎麼撐過來的。」

其實,想過離開的不只是 Ty。

Annie 也想過。

很長一段時間裡,她在從零到一搭建海外業務線,但始終沒有真正突破。 更糟的是,其他團隊的同事出於好意,直接告訴她放棄這項他們認為毫無意義的努力。

她說在 Kimi 哭的次數比在任何公司都多,也比為任何一個前任哭的都多。

並不是她沒有退路。 她已經拿到了薪資更高的 offer。 但她說,她就是沒辦法說服自己去打工。 她想再跟張宇韜談一次。

之後,她決定留下來。

她沒有告訴我那次對話的內容。 她只說:宇韜是我見過的最強的老闆,迭代最快,上限最高。 跟著她走,是我提高自己上限的方式。

然後 Annie 重複了同一句話:

「我不知道她怎麼撐過來的。」

當你累積了足夠多的素材,你會發現某些句子反覆出現。 而最常被重複的話,往往揭示了一個團隊最深層的共同特質。

Bob,被楊植麟從美國拉回中國、放棄了在美國讀博的機會,在公司成立第一天就加入了。 如果有人深度理解這家公司,那就是他。

當我問他那個問所有人都問的問題——這個團隊最重要的特質是什麼——他想了大約兩分鐘,回答了一個字:

對一家只有三年歷史的公司來說,談韌性聽起來有點奢侈。 但他是認真的。 他說,聰明和勇敢有時候是對立的。 越聰明的人,看到的風險越清楚,越容易選擇離開。 盲目的堅持也不會成功。 所以只有那些看清了真相、算出了失敗機率、但依然繼續的人,才配被稱為有韌性。

公司內部流傳著一個故事,叫做「三上絕壁」。

2023 年 5 月,Freddie 和同事接到了一個看似不可能的任務:讓 AI 一次性讀取和理解 128K 上下文——相當於數百頁書——而當時業界標準還在 4K 左右。

他很快就設計了一個叫 MoBA v0.5 的方案,但這需要在主模型訓練到一半時重寫底層訓練框架。 成本太高,方案被擱置。 這是第一次「上絕壁」。

半年後他帶著 v1 回來,這一版設計為可以從現有模型繼續訓練。 小模型上跑通了,但在大模型上測試時遭遇了 loss spike,反覆失敗。 項目被迫第二次退回,又是六個月。 甚至錯過了公司 20 萬字產品里程碑的節點。 但團隊沒有被解散,公司反而發動了「飽和救援」──從各處調集技術專家集中攻關。 他們重寫了核心邏輯,v2 終於通過了經典的長文本“大海撈針”測試。

就在看似即將上線時,第​​三次打擊來了。 在監督微調階段,模型在長文摘要任務上表現很差,因為訓練訊號太稀疏。 此時已經投入了大量資源。 工程師們再次回到「絕壁」,尋找解決方案,最終透過修改最後幾層的注意力機制解決了問題。

三次退回,三次回來。

採訪結束時,我問 Freddie 那個終極問題:你會怎麼形容這家公司?

他回答了兩個字:

為什麼是登月?

他引用了甘迺迪那句名言:

「我們選擇在這十年內登月,不是因為它容易,而是因為它難。」

公司所有會議室都以樂團命名。

天才蜂群

最終,我沒有打擾或試圖深挖聯合創始人本人。

對外,他們幾乎隱形。 他們不喜歡接受採訪,對個人名聲毫無興趣。 但在內部,他們無所不在。

在一個極度扁平的組織裡,你需要中心有超級大腦。 否則活力會變成混亂。 因為幾乎沒有中階管理,每位共同創辦人直接對接約 40 到 50 名員工,並保持在技術和業務前線。 公司就是這樣讓決策和執行保持對齊的。

五位共同創辦人都來自清華。 但生理極限依然存在。 人的注意力頻寬有限,管理半徑有限。 當公司估值突破 1,200 億、員工超過 300 人之後,即使是這些超級大腦也開始承壓。

不僅是創始人。

這是一場由自動驅動力驅動的無限遊戲。 如果每個人實際上扛著 4 億估值,那麼每個人被期望創造的價值也是超常的。

革命性變數是工具。

Kimi 其實不靠極端加班運轉。 員工可以自然醒,也不要求每晚在辦公室待到天亮。 產品團隊的 Leo 說,他現在指揮著「一支軍隊」—AI Agent。

想像這樣一個場景:

Leo 早上 10 點醒來走進辦公室。 他的任務是分析過去 24 小時來自五個全球市場的用戶回饋,並決定本週的產品優先順序。 過去,這需要三個人花兩天。

現在他啟動三個 Agent。

一個策略 Agent 掃描 3000 個回饋,篩選出與長文本中斷相關的高優先需求。 一個翻譯 Agent 即時解讀日語方言和韓語敬語,並標註真實的情緒強度。 一個競品 Agent 監控 Cursor 和 ChatGPT 的更新,產生技術對比。

Leo 自己只做三件事:否決一則被系統誤判為真誠的諷刺評論;標記一張包含未發布 UI 的截圖;確認 Agent 推薦的前三項需求。

到上午 11:30,產品需求文件已經完成。 同時,一個程式設計 Agent 已經產生了大約 70% 的基礎實現,只留下更有創意的設計部分給下午跟人類工程師討論。

人類定規則,矽基系統執行。 組織變成了演算法的容器。

在一家 AI 原生公司,熟練使用 Agent 並將其深度嵌入工作流程,不是加分項,而是基本要求。

模型不僅是目標,也是工具。

無論是直接提升生產力,或是從根本上改變管理結構,AI 的邏輯已經進入了這家公司的骨頭。 正如公司正在建構 Agent Swarm(智能體蜂群),團隊本身也開始像一個 Genius Swarm(天才蜂群):許多獨立的天才並行運作,無縫協同。

不過,這種扁平結構有內在的脆弱性。

當我問如果公司從 300 人擴大到 3000 人,這種模式還能持續嗎? 大多數人的回答都很謹慎。 歷史不太樂觀。 類似的極致扁平化實驗——如合弄制(holacracy)或海爾的人單合一——往往在超過 500 人左右時遭遇決策瓶頸。 資訊節點太多,「直接溝通」就會變成資訊過載。

更切近的痛點是個人的失重感。

沒有層級來緩衝不確定性,方向上的困惑直接傳導到每個人。 一位最終回到大廠的前員工直言:沒有自上而下的 OKR 和 KPI,有些早上你走進辦公室不知道該做什麼。 沒有人一定會告訴你你做得好不好。 這種缺乏回饋的狀態製造了不安全感。 它會讓人懷念大廠裡清晰的匯報線、考核節點和可量化的產出。

那些繁瑣的結構,畢竟提供了一樣東西:確定性的底線。

目標在哪裡? 什麼算完成? 績效怎麼評判? 在大公司,這些都是可見的。

那個人說,這不是斯德哥爾摩綜合徵,這是基本的組織物理學。

如果說阿里像一條精密校準的晉升傳送帶,字節像一支目標兇猛的戰鬥軍團,騰訊像一所更寬容的職業學院,那月之暗面就像一片原始森林。

天才也許能找到狩獵的路。 普通人可能只是在霧裡徘徊。

必要的「二向箔」

沒有部門,沒有 title,沒有考評。

這種 AI 原生的組織模式是反官僚的、刻意去結構化的。 大公司已經很難轉向這種模式,小公司往往因為過早擴張為傳統架構而錯過窗口。 這是一場不對稱戰爭。

這裡作者引用了《三體》中的經典概念。 在那個故事裡,高等文明隨手使用一種叫做「二向箔」的武器,將太陽系從三維坍縮為二維。 行星、恆星、人類全部變成一張沒有厚度的平面影像。

作者認為,月之暗面主動向自己投擲這樣一塊「二向箔」。

不是為了消滅對手,而是為了把組織壓扁,追求最大效率。

沒有層級的縱深,沒有部門的橫牆,沒有辦公室政治的三維糾纏。 只有「模型」和「智慧」以最簡潔的形式直接面對彼此。

在 AI 時代,每一家新創公司都在被迫丟出這樣一塊二向箔給自己。 一人公司的崛起反映了同樣的 AI 原生人才的世代爆發。 如果技術能把組織能力壓縮到個體身上,那管理的中間層就會大量蒸發。 組織被壓扁。 沒有繞彎的縱深。 每個人都被迫直面問題本身。

這或許是商業世界中組織進化的硬規律。

每個人,最後都會被折疊。

一旦人們暴露在同一個平面上,一個人對五十個人產生輻射影響就不再是管理奇蹟,而成為常態。 從中心到邊緣的距離被重新定義。 依賴 title 和 OKR 作為座標的人可能會瞬間窒息。 但天才們在這個暴露的平面上,可以猛烈地拆解智能本身;而「守護者」們則清除噪音和熵增,以並非沒有謙遜的姿態,將自己視為拓寬人類文明邊界的先鋒。

然而從三維到二維的轉變不可逆。

這意味著 Kimi 不能走回頭路。

每一次戰略調整都變成了高風險的混沌迭代。 競爭對手還可以在迷宮裡慢慢轉彎,但如果月之暗面試圖魯莽擴張規模,可能會在結構上撕裂自己。 這種自我降維之所以可以接受,只是因為它服務於更激進的目標。

降低組織維度的終點,是升高智能的維度。

只有當模型智慧跨越臨界閾值,高到足以逃脫一切碳基組織的引力井,月之暗面才能真正碾碎競爭對手的組織優勢,證明這場不可逆的賭注是正確的。

屆時,關於管理半徑或組織架構的爭論都不再重要。 那就像問三體文明到底處於哪個維度——真正的重點是,它的降維武器已經改寫了戰爭的規則。

屆時,「月之暗面」將不再是一個隱喻。

它將成為一個高維光源,照亮智慧宇宙的暗面。 先前所有的組織陣痛,不過是登月艙穿越大氣層時燒掉的隔熱層。

要麼在上升中封神,

要麼在坍縮中封印。

沒有第三條路。

文中所有英文名均為化名。

|Square

下載BTCC APP,您的加密之旅從這啟程

立即行動 掃描 加入我們的 100M+ 用戶行列

本站轉載文章均源自公開網絡平台,僅為傳遞行業信息之目的,不代表BTCC任何官方立場。原創權益均歸屬原作者所有。如發現內容存在版權爭議或侵權嫌疑,請透過[email protected]與我們聯絡,我們將依法及時處理。BTCC不對轉載信息的準確性、時效性或完整性提供任何明示或暗示的保證,亦不承擔因依賴這些信息所產生的任何直接或間接責任。所有內容僅供行業研究參考,不構成任何投資、法律或商業決策建議,BTCC不對任何基於本文內容採取的行為承擔法律責任。