DeepSeek V4-Flash 登上 Ollama Cloud、美國主機:Claude Code、OpenClaw 一鍵串接

本地 AI 模型運行工具 Ollama 於 4/24 在 X 平台公開宣布,將中國 AI 新創 DeepSeek 前一日釋出的 V4-Flash 模型納入 Ollama Cloud 服務。推論主機位於美國,並提供三組一鍵指令讓開發者直接把 V4-Flash 接到 Claude Code、OpenClaw 與 Hermes 等主流 AI 程式開發工作流中。

deepseek-v4-flash is now available on Ollama’s cloud! Hosted in the US. Try it with Claude Code: ollama launch claude –model deepseek-v4-flash:cloud Try it with OpenClaw: ollama launch openclaw –model deepseek-v4-flash:cloud Try it with Hermes: ollama launch hermes…

— ollama (@ollama) April 24, 2026

DeepSeek V4 Preview:兩款尺寸、1M 脈絡

根據 DeepSeek 官方 API 文件 4/24 發布公告,DeepSeek-V4 Preview 分兩款尺寸同步開源釋出:

型號 總參數 活躍參數 定位 DeepSeek-V4-Pro 1.6 兆 490 億 目標對標閉源旗艦 DeepSeek-V4-Flash 2,840 億 130 億 快速、高效、低成本

兩款均採 Mixture-of-Experts(MoE)架構,原生支援 100 萬 tokens 長脈絡。DeepSeek 在公告中宣告:「1M 脈絡現在是所有 DeepSeek 官方服務的預設值。」

架構創新:DSA 稀疏注意力+Token-wise 壓縮

V4 系列核心的架構改進包含:

Token-wise 壓縮搭配 DSA(DeepSeek Sparse Attention)——針對超長脈絡下的推論運算與 KV 快取記憶體大幅削減成本

相較 V3.2,V4-Pro 在 100 萬 tokens 脈絡情境下,單 token 推論僅需 27% 的 FLOPs、KV cache 僅需 10%

支援 Thinking 與 Non-Thinking 雙模式切換,對應不同任務的深度推理需求

API 層面同時相容 OpenAI ChatCompletions 與 Anthropic APIs 規格,降低既有 Claude/GPT 客戶端的遷移成本。

Ollama Cloud 的三組一鍵啟動指令

Ollama 官方模型頁以模型識別符 deepseek-v4-flash:cloud 提供雲端推論服務,開發者可用以下三組指令直接把 V4-Flash 串到既有 AI 程式開發工作流:

工作流 指令 Claude Code ollama launch claude --model deepseek-v4-flash:cloud OpenClaw ollama launch openclaw --model deepseek-v4-flash:cloud Hermes ollama launch hermes

值得留意的是「美國主機」這個訊號。對企業與歐美開發者而言,使用中國開源模型時最大疑慮是資料回傳中國;Ollama 選擇把 V4-Flash 的推論層放在美國,意味著 prompt 與程式碼內容不離開美國司法管轄,降低合規與資料主權層面的摩擦。

為什麼這件事對 AI 產業重要

把 DeepSeek V4-Flash、Ollama Cloud、Claude Code 三個原本各自獨立的生態接起來,產生三層意義:

成本路線:V4-Flash 的 130 億活躍參數遠小於 GPT-5.5(輸入 5 美元、輸出 30 美元/百萬 tokens)與 Claude Opus 4.7 等旗艦,對於中小型代理任務、批次摘要、測試自動化等用途,單位成本可望顯著下降

地緣風險的中介層:Ollama 作為美國註冊的中介推論層,讓中國原生模型的企業用戶得以繞開「資料直接送 DeepSeek 北京伺服器」的疑慮,是開源模型在國際擴散的實務解法

開發者即時切換:Claude Code 與 OpenClaw 的用戶可在命令列一行切模型,不必改 prompt 結構或 IDE 設定,對於「多模型回歸測試」「成本敏感的批次任務」使用場景是真正的生產力釋放

與先前 DeepSeek 新聞的連動

這次 V4 釋出與 Ollama Cloud 快速整合,發生在 DeepSeek 正在洽談首輪外部融資、估值 200 億美元的背景下。V4 是 DeepSeek 公司資本化過程中的關鍵產品證明;以開源策略+國際主機合作夥伴快速擴散,則是其建立開發者生態壟斷前的速度戰。對 OpenAI 與 Anthropic 而言,一個可以在 Claude Code 內部一行切換的開源替代模型,是 agent 工作流主導權爭奪的新變量。

這篇文章 DeepSeek V4-Flash 登上 Ollama Cloud、美國主機:Claude Code、OpenClaw 一鍵串接 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Anthropic 在品質下降後回滾 Claude Code 變更;所有修復已完成

Gate News 訊息,4 月 24 日——Anthropic 已承認近期 Claude Code 的品質下降,並確認所有相關問題已透過回滾與修復解決。這些問題源於 4 月初至 4 月中之間所進行的三項產品與提示詞調整。 在 3 月 4 日,

GateNews32分鐘前

NeoSoul 联合创始人 Kaelan:AI 行业应当允许“玩具”存在,创新往往从实验性产品开始

Gate News 消息,4 月 24 日——在近期香港一场关于智能加密金融的论坛上,NeoSoul 联合创始人 Kaelan 分享了其对如何在早期、快速演进的 AI 行业中评估 AI 项目的见解。除了评估现有产品之外,团队还必须展现出能够跟上底层模型能力变化的能力,他表示。

GateNews58分鐘前

Meta 與 Amazon 就數十億美元協議達成共識:供應 Graviton 晶片以推動 AI 開發

Gate News 訊息,4 月 24 日——根據《華爾街日報》報導,Meta 平台與亞馬遜網路服務 (AWS) 已達成一項價值數十億美元的協議,將在未來幾年支持 Meta 的人工智慧(AI)計畫。依據該協議,Meta 將使用數千萬顆 AWS Graviton 晶片核心來為其 AI 代理與其他 AI 專案提供動力。

GateNews1小時前

Web3 AI 基礎設施 AIW3 完成由 Buffalo Capital 領投的 $2M 種子輪融資

Gate 新聞訊息,4 月 24 日——Web3 AI 基礎設施平台 AIW3 宣布完成一筆 $2 百萬種子輪融資。該輪由 Buffalo Capital 領投,並由 GalaXin Capital 與 Three-stones Ventures 作為共同投資方參與。 AIW3 正在轉向「代理即服務」(Agent-as-a-Service)

GateNews2小時前

Cohere 收購德國 AI 公司 Aleph Alpha,為歐洲擴張獲得 $600M 投資

Gate News 訊息,4 月 24 日——加拿大 AI 公司 Cohere 宣布計劃收購德國 AI 公司 Aleph Alpha,以強化其在歐洲的佈局。Aleph Alpha 的支持者 Schwarz Group 計劃在 Cohere 的 E 輪融資中投資 $600 百萬美元。 預計該輪融資將在 202

GateNews3小時前

小鵬、Xiaomi 引領車載AI浪潮亮相北京車展

Gate News 訊息,4月24日——隨著中國加速其「AI Plus」策略,並努力在外國半導體方面取得更大自主性,中國汽車製造商在4月24日的北京車展上展示了先進的車載AI系統。 小鵬展示了可進行語音控制停車的功能,讓駕駛能夠「發出語音指令,而不是手動選擇停車位置。」

GateNews4小時前
留言
0/400
暫無留言