BTCC / BTCC Square / TechFlowPost /
DeepSeek新模型MODEL1曝光,代碼預示新架構

DeepSeek新模型MODEL1曝光,代碼預示新架構

Published:
2026-01-20 23:58:44
13
2

深潮 TechFlow 消息,1 月 21 日,據金十數據報導,DEEPSeek-R1發布一周年之際,新模型“MODEL1”曝光。 DeepSeek在GitHub更新FlashMLA代碼,橫跨114個文件中有28處提到MODEL1,與V32作為不同的模型出現。 已知V32是DeepSeek-V3.2,MODEL1很可能是新的架構。 代碼中的具體差異體現在KV緩存佈局、稀疏性處理和FP8解碼方面,在內存優化上有多處不同。 (量子位)

|Square

下載BTCC APP,您的加密之旅從這啟程

立即行動 掃描 加入我們的 100M+ 用戶行列

本站轉載文章均源自公開網絡平台,僅為傳遞行業信息之目的,不代表BTCC任何官方立場。原創權益均歸屬原作者所有。如發現內容存在版權爭議或侵權嫌疑,請透過[email protected]與我們聯絡,我們將依法及時處理。BTCC不對轉載信息的準確性、時效性或完整性提供任何明示或暗示的保證,亦不承擔因依賴這些信息所產生的任何直接或間接責任。所有內容僅供行業研究參考,不構成任何投資、法律或商業決策建議,BTCC不對任何基於本文內容採取的行為承擔法律責任。