雲廠商競逐AI底座
作者 | 周智宇
編輯 | 張曉玲
當全世界還在爭論大模型是否只是一個昂貴的“泡沫”時,金山雲高級副總裁劉濤表示,這不是泡沫。
支持他論斷的,是正在發生的“Vibe Coding(沉浸式開發)”熱潮——當Claude Code已經可以熟練地用自己寫的代碼來迭代自身時,機器人造機器人、代碼寫代碼的“奇點”已經真實地觸碰到了產業界的脊梁。
面對這個變化,金山雲出招了。 1月21日,金山雲宣布智算平台“金山雲星流”全面升級,其不僅包含了覆蓋模型全生命週期的訓推平台,還正式發布了機器人平台和模型API服務。
這家老牌雲服務商正試圖通過身份的自我重塑,積極投身這場關於未來生產力主導權的角逐。
過去一年,智算需求持續增長,主要推手已從頭部企業的訓練需求,悄然轉向了推理側的爆發。
數據非常直觀,火山引擎日均token調用量已衝上50萬億大關;豆包、千問、元寶等模型的外溢需求正以不可思議的速度擴張。 這種爆發式的Token消耗,本質上是AI落地現實場景的過程。 對於企業而言,大模型不再是PPT裡的點綴,而是實打實的降本增效工具。
“我們一直在關注推理什麼時候爆發,這種增速超過了過去所有IT基礎設施的認知。”金山雲助理總裁孫曉感慨道。
在這種背景下,金山雲將自己定位為工程化的陪伴者,其邏輯非常純粹:既然大模型正成為萬物互聯的“大腦”,那麼雲廠商就需要提供配套的“循環系統”——穩定、高效且具備極致性價比的Token服務。
金山雲走的是一條“任務驅動”的邏輯演進路線。 2023年,行業主題是“大規模智算網基礎設施建設”,比拼的是對底層異構資源的管理能力。 2024年,重點演進為“平台化和Serverless(無服務器計算)”,核心是將資源交付轉變為任務交付。 而到了2026年,升級後的“金山雲星流平台”則錨定了三個核心主題:追求效率提升、構建行業平台、加速推理落地。
這種轉變在於,智算時代的訓練任務極其脆弱,在大規模算力集群下,任何一點硬件波動都可能導致整個訓練任務的中斷。 為了解決這個“釘子”,金山云自研了一套基於故障感知的自愈技術。
這套系統能針對硬件故障和軟硬結合故障進行分級處理。 有些故障重啟即可,有些則需立即啟動替換策略。 孫曉透露,這套機制可以實現“秒級感知”和快速處理。 這意味著,即便底層硬件出現波動,客戶的一輪訓練任務也能在不中斷的情況下平穩度過。
具身智能,是金山雲眼中智算雲的“下半場”,也是金山雲重點關注的未來。
無論是自動駕駛還是人形機器人,行業目前仍處於一個“混沌場景”中,百花齊放但痛點固化。 不同廠商有的關注大腦,有的關注小腦,有的則卡在數據仿真上。
金山雲發布的“金山雲星流機器人平台”,試圖打通從數據採集、存儲、標註到模型訓練、部署與仿真的全鏈路閉環。 孫曉認為,機器人場景需要解決的是“從算法研發到真實場景部署”的落地難題。
以自動駕駛為例,模型在車端,但訓練在雲端,這對算力密度的要求或許沒那麼高,但對顯存和多模態點雲數據的處理能力要求極高。 金山云通過構造閉環的數據平台,讓客戶能更便捷地接收、處理這些海量數據。
劉濤在展望未來時描繪了一個畫面:2026年起,家庭場景機器人將逐步落地。 從最初幫老人撿襪子、撿毛巾,到最終輔助生活,這是一個跨度長達5到10年的萬億賽道。 而金山雲要做的,就是成為這個萬億賽道的“底座”和“引擎”。
隨著傳統公有云市場進入存量博弈,智算雲正帶來全新的增長機會。 金山雲能夠在去年三季度實現120%的同比增速,本質上是因為它抓住了這一波生產力重構的機會。
堅持“不做大模型”的承諾,反而讓金山雲在生態建設上變得極度開放。 孫曉坦言,他們的職責是基於開源模型,依托自研技術,提供最穩定、最高性價比的Token服務。 業內熱門模型一發布,金山雲當天就能上線推理服務,這種響應速度在行業內也處前列。
在智算時代,配套產品正在發生劇變。 過去是計算、存儲、網絡,現在則是以推理加速為核心的技術棧(包括引擎、算子優化),以及圍繞Agent(智能體)構建的生態。 金山雲正通過PD分離(預填充和解碼分離)以及量化技術,極致壓低推理時延,提升吞吐性能。
甚至在某些爆款遊戲的背後,金山雲也在提供全棧雲服務。 在重負載、高並發的開服階段,金山云通過平台化+工程師重保的機制,平穩支撐了海量玩家的湧入。 這種從遊戲重保中沉澱下來的極限壓測經驗,正被移植到大模型推理的戰場上。
過去十年的雲市場,是一場關於資源規模的博弈,雲廠商扮演的是類似水電煤的“公用事業”角色。 到了2026年,技術端的“內捲”仍將繼續。 從更大的參數量到更先進的計算方式(如MLA或線性Attention),國內的大模型廠商依然在瘋狂追求效率的極限。
但真正的分水嶺在於“應用”。 視頻生成的實用化、VLA模型在車端與機器人端的泛化、以及Agent在老百姓日常生活中的滲透,將讓推理需求呈現指數級增長。
智算雲的紅利期不會永遠持續,只有那些能解決極限工程難題、能打通行業數據閉環、能提供極致性價比Token的廠商,才能在潮水退去後依然立於潮頭。
“我們已經打下了良好的客戶基礎,未來3到5年,金山雲會有一個顯著的變化。”劉濤信心滿滿。
當智算的齒輪加速轉動,這場關乎生產力主導權的競賽,才剛剛進入最殘酷、也最精彩的深水區。