DeepSeek 創辦人梁文鋒在內部溝通中親口確認,新一代旗艦模型 V4 將於 4 月下旬正式發布。洩露規格顯示總引數量逼近 1 兆、支援 100 萬 tokens 上下文,更將完全執行於華為昇騰晶片,被視為中國 AI 突破輝達依賴的關鍵一步。
(前情提要:DeepSeek V4 拒絕輝達 找華為!阿里、位元組跳動、騰訊搶買昇騰950PR晶片)
(背景補充:DeepSeek 上線「專家模式」和「視覺模式」,V4 正式推出前最後暖身?)
據《新浪財經》引述知情人士消息,DeepSeek 創辦人梁文鋒已透露新一代旗艦大模型 DeepSeek V4 將於 4 月下旬正式亮相。官方雖尚未公布確切日期,但開發者社群已率先感受到暖身訊號:V4-Lite 變體正在 API 節點測試中,推理速度較上一代提升 30%,128K tokens 的上下文召回率達到 94%。
千億引數、百萬 token 視窗
根據目前流出的未官方確認資訊,V4 架構沿用 Mixture-of-Experts(MoE)設計,總引數量約 1 兆,但每個 token 實際啟用的引數僅約 370 億,在算力效率上維持 DeepSeek 一貫的「精算師」風格。
上下文視窗部分:V4 透過全新的 Engram 模組,有望支援 100 萬 tokens 的超長上下文,與當前頂尖模型較勁。Engram 的核心概念是條件記憶查詢,讓模型能以 O(1) 的複雜度存取知識,而非隨序列長度線性膨脹。
在能力面,洩露的基準測試顯示 HumanEval 達 90%、SWE-bench Verified 超過 80%,若資料屬實,也直逼現有主流旗艦模型。模態方面,V4 原生支援文字、圖片與影片輸入,定價則約 $0.30/MTok(輸入),延續 DeepSeek 低價策略。
完全跑在華為晶片上:最大的地緣政治訊號
技術規格之外,V4 最受外界關注的一點是硬體策略的徹底轉向:官方稱整個模型將完全執行於華為昇騰 950 PR 晶片,不依賴任何輝達 GPU。
這個決定的影響遠超 DeepSeek 本身。阿里巴巴、位元組跳動、騰訊已陸續大量採購華為次世代晶片,若 V4 成功驗證昇騰可以撐起頂級旗艦模型的訓練與推理需求,將是中國 AI 產業鏈在晶片自主化上迄今最具說服力的實戰案例。
美國對輝達出口的管制措施在這個脈絡下,反而可能成為加速中國自主生態系成熟的催化劑。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
AI 金融平台 Rogo 在不到 3 個月內完成 B 輪融資,由 Kleiner Perkins 領投
根據 Beating 的說法,為高頻金融情境而設計的 AI 平台 Rogo 於 2026 年 4 月完成了一輪 $160 百萬美元的 B 輪融資,由 Kleiner Perkins 領投,並有 Sequoia、Thrive Capital、Khosla Ventures 以及 J.P. Morgan 參與。本輪融資在該公司於 1 月下旬完成 百萬美元的 C 輪融資後不到三個月,使總融資額超過 百萬美元。
Rogo 同步推出 Felix,這是一個面向金融專業人士的 AI 代理平台。該平台使投資銀行家與分析師能夠將金融建模、報表分析與簡報製作等多步任務委派給 Felix,從而騰出時間投入高槓桿的客戶工作。目前,該平台已被超過 35,000 名專業人士使用,覆蓋超過 250 家頂級投資銀行、資產管理公司以及私募股權公司。
GateNews3小時前
China Blocks Meta-Backed Manus AI Acquisition on April 29, Citing Tech and Data Security Concerns
According to PANews, on April 29, China's National Development and Reform Commission investment security review office banned a foreign acquisition of the Manus project and required the transaction be terminated. Manus, billed as the world's first general artificial intelligence agent, had
GateNews4小時前
阿里雲將 DeepSeek-V4-Pro 隱式快取定價調降至 4 月 29 日起每 100 萬個 tokens 1 元
根據阿里雲的說明,其百炼平台將把 DeepSeek-V4-Pro 模型的隱式快取 (Implicit Cache) 的定價降低至自 2026 年 4 月 29 日 23:59:59(北京時間)起,每 100 萬個 tokens 收費 1 元。僅當請求命中快取時才適用隱式快取;快取中的輸入 tokens 將按快取的 cached_token 費率計費,而未命中快取的輸入 tokens 則按標準 input_token 費率收費。此調整僅影響隱式快取的定價;基礎模型推論費率維持不變。
GateNews4小時前
AI 平台 Certifyde 以 $2M 種子輪融資邀請 Ripple 執行長 Brad Garlinghouse 入局
根據 ChainCatcher 報道,AI 應用平台 Certifyde 宣布完成一輪 $2 百萬美元種子輪融資。投資方包括 K5 Global、Flamingo Capital,以及天使投資人,例如 Ripple 執行長 Brad Garlinghouse、Honey 聯合創始人 George Ruan,以及 Nutra 聯合創始人 Roland Peralta。
GateNews7小時前
DeepSeek 於測試版中推出影像辨識功能
根據 PANews,DeepSeek 於今天 (April 29) 推出了其影像辨識功能,目前處於測試版。網頁版與行動應用程式的使用者都有可能被選中參與測試版推送。
GateNews8小時前
Anthropic 為 Claude 推出 8 個創意工具連接器,包含 Blender、Adobe、Autodesk
Anthropic 已宣布一系列創意工具連接器,讓 Claude 能夠直接控制供設計師與音樂人使用的專業軟體。最初的八個連接器涵蓋 3D 建模、視覺設計、音樂製作與現場表演,合作夥伴包括 Blender、Adobe、Autodesk、Ableton、Splice、Canva 的 Affinity、Resolume 以及 SketchUp。Blender 連接器由 Blender 官方團隊使用 MCP 協定開發,讓其他 AI 模型也能存取它。
GateNews8小時前