市場消息:DeepSeek V4 和騰訊新混元模型或將於 4 月發布
深潮 TechFlow 消息,3 月 14 日,根據《白鯨實驗室》爆料,DeepSeek V4 和姚順雨領銜操刀的混元新模型,均預計將於 4 月發布。
爆料稱,作為梁文鋒打磨已久的多模態大模型,DeepSeek-V4 除了在 Coding 能力上躍升之外,還將在 LTM(long term memory 長期記憶)上取得突破。
日前,OpenRouter 新上線了兩個神秘模型:Healer Alpha 與 Hunter Alpha,被猜測是 DeepSeek V4 的,國內 IP 可以直接訪問這兩個大模型。
根據模型的自我介紹,Hunter Alpha 為 1 兆參數和 100 萬個 token 上下文的大模型,專為智能體工作流程、長週期複雜任務和深度工具呼叫設計。
Healer Alpha 為全模態互動模型,上下文視窗為 26 萬 tokens,能夠原生感知視覺和音訊輸入,跨模態進行推理,並以精確和可靠的方式執行複雜的多步驟任務。
截至發稿,尚無官方認領這兩個大模型。
另據《白鯨實驗室》爆料,騰訊首席 AI 科學家姚順雨也將於 4 月發布混元新模型(30B 參數等級)。 這也是自去年 12 月加入騰訊後,要發表的第一款重磅產品,備受期待。