DeepSeek新模型發布百萬上下文成標配

首頁 -> 財經 ->財經

DeepSeek新模型發布百萬上下文成標配

分享到：

2026-04-24 17:40 | 稿件來源：香港新聞網

【字號：大中小】

香港新聞網4月24日電中國人工智能公司DeepSeek（深度求索）24日宣布，其全新系列模型DeepSeek-V4預覽版正式上線並同步開源。該模型擁有百萬字超長上下文，在 Agent（智能體）能力、世界知識和推理性能上均實現中國國內與開源領域的領先。

圖源：“DeepSeek”微信公眾號

按照DeepSeek官方披露信息，V4模型按參數大小分為Pro和Flash兩個版本。其中，Pro總參數達1.6萬億，激活參數49B，主要面向尖端任務，性能比肩頂級閉源模型；Flash總參數2840億，激活參數13B，定位為更快捷高效的經濟之選。兩者均支持1M（一百萬）超長上下文。

“從現在開始，IM上下文將是DeepSeek所有官方服務的標配。”DeepSeek表示，V4採用創新注意力機制，在token維度進行壓縮，結合DSA稀疏注意力（DeepSeek Sparse Attention）技術，實現了全球領先的長上下文能力，大幅降低對計算和顯存需求。

據介紹，目前V4已成為DeepSeek內部員工使用的Agentic Coding（智能體編程）模型。據測評，其使用體驗優於Anthropic的Sonnet 4.5，交付質量接近Opus 4.6的非思考模式，但仍與Opus 4.6思考模式存在一定差距。

API定價方面，DeepSeek繼續延續高性價比策略。以每百萬tokens計：Flash版輸入（緩存命中）是0.2元、輸入（緩存未命中）1元、輸出2元；Pro版則分別為1元、12元、24元。而官網聊天與App端仍保持免費。

值得一提的是，DeepSeek在小字中提到，受限於高端算力，目前Pro服務吞吐有限，預計下半年華為昇騰950超節點批量上市後，Pro價格會大幅下調。此前在4月初，有報道指出，DeepSeek-V4已首次實現與華為昇騰等中國國產芯片的深度適配。

香港中通社資料圖

DeepSeek-V4發布後，“華為計算”微信公眾號發文表示，昇騰一直同步支持DeepSeek系列模型，本次通過雙方芯模技術緊密協同，實現昇騰超節點全系列產品支持DeepSeek V4系列模型。

昇騰950通過融合kernel和多流並行技術降低Attention計算和訪存開銷，大幅提升推理性能，結合多種量化算法，實現了高吞吐、低時延的DeepSeek V4模型推理部署。昇騰A3超節點系列產品也全面適配，同時為便於用戶快速微調，提供了基於昇騰A3超節點的訓練參考實現。

昇騰芯片是華為AI算力戰略的基礎。其發展歷程顯示，2018年發布首款昇騰310芯片，2019年推出昇騰910芯片；2025年，昇騰910C芯片隨Atlas900超節點規模部署，逐漸被外界熟知。去年9月，華為副董事長、輪值董事長徐直軍在華為全聯接大會2025上首次介紹昇騰950系列芯片，官宣昇騰950PR將於2026年第一季度推出，首度支持標卡和超節點服務器形態。

另據財聯社報道，DeepSeek-4罕見地將華為昇騰和英偉達共同寫進DeepSeek-V4技術報告：“我們在英偉達GPU和華為昇騰NPU平台上驗證了細粒度EP（專家並行）方案。”這是DeepSeek官方第一次在正式文檔中把華為昇騰和英偉達並列寫進硬件驗證清單。

報告同時披露，V4的MoE專家權重和稀疏注意力索引器都採用FP4精度，FP4（mxFP4）恰好是華為3月發布的昇騰950PR芯片的原生支持精度。

就在數天前，英偉達CEO黃仁勛在接受外媒採訪時表示，假設DeepSeek-V4是針對華為優化的，那將使美國處於劣勢。他直言，如果建立兩個生態系統——一個是只能運行在外國技術棧上的開源生態系統，另一個是運行在美國技術棧上的封閉生態系統——那將是極其愚蠢的。（完）

【編輯：石歡歡】