DeepSeekは、V4モデルを2月中旬頃にリリースする計画であると報じられており、内部テストの結果から見て、シリコンバレーのAI大手企業は警戒すべき状況にある。杭州を拠点とするAIスタートアップは、_The Information_によると、自然な形で旧正月の2月17日頃にリリースを目指しており、コーディングタスクに特化したモデルを開発しているという。プロジェクトに直接関わる人物は、V4はAnthropicのClaudeやOpenAIのGPTシリーズを内部ベンチマークで上回り、特に非常に長いコードプロンプトの処理において優れていると主張している。ただし、モデルに関するベンチマークや情報は公開されていないため、これらの主張を直接検証することは不可能である。DeepSeekも噂を確認していない。
それでも、開発者コミュニティは公式発表を待たずに動き出している。Redditのr/DeepSeekやr/LocalLLaMAではすでに盛り上がりを見せており、ユーザーはAPIクレジットを備蓄し、Xの愛好者たちはV4がDeepSeekの地位を確固たるものにし、シリコンバレーの数十億ドルルールに従わない小さな挑戦者としての立場を築くと予測を共有している。
AnthropicはClaudeのサブスクリプションをOpenCodeなどのサードパーティアプリでブロックし、xAIやOpenAIへのアクセスも遮断したと報じられている。
ClaudeとClaude Codeは素晴らしいが、まだ10倍優れているわけではない。これにより、他の研究所もコーディングモデルやエージェントの開発をより迅速に進める動きが加速するだろう。
DeepSeek V4のリリースが噂されている…
— Yuchen Jin (@Yuchenj_UW) 2026年1月9日
これはDeepSeekにとって初めての破壊的な動きではない。2025年1月に同社がR1推論モデルをリリースした際、世界市場で1兆円規模の売りが引き起こされた。理由は?DeepSeekのR1は、OpenAIのo1モデルと数学や推論のベンチマークで一致し、開発コストはわずか$1 百万ドルと報告されており、競合他社の約68分の1のコストで済んだとされる。その後、V3モデルはMATH-500ベンチマークで90.2%を記録し、Claudeの78.3%を大きく上回り、「V3.2 Speciale」アップデートではさらに性能が向上した。
![]$6 https://img-cdn.gateio.im/social/moments-d34ca73e1b-7d2ed0c669-8b7abd-e2c905(
画像:DeepSeek
V4のコーディング重視は戦略的な転換となるだろう。R1は純粋な推論—論理、数学、形式的証明—に重点を置いていたのに対し、V4は推論と非推論タスクを組み合わせたハイブリッドモデルであり、高精度のコード生成が直接収益につながる企業向け開発者市場をターゲットにしている。支配的地位を獲得するには、V4は現在80.9%のSWE-bench Verified記録を持つClaude Opus 4.5を上回る必要がある。しかし、過去のリリース実績から見ても、中国のAI研究所が直面する制約があっても達成不可能ではない可能性がある。
秘密の要素 噂が本当だとすれば、どうやってこの小さな研究所がそんな偉業を成し遂げられるのか?その秘密兵器は、2024年1月1日に発表された研究論文「Manifold-Constrained Hyper-Connections(mHC)」にあるかもしれない。創設者の梁文峰と共著者によるこの新しいトレーニング手法は、大規模言語モデルのスケーリングにおける根本的な問題—モデルの容量を拡大しつつ、訓練中の不安定や爆発を防ぐ方法—に対処している。従来のAIアーキテクチャはすべての情報を狭い一つの経路を通じて処理するが、mHCはその経路を複数のストリームに拡張し、情報交換を可能にしながら訓練崩壊を防ぐ。
![])https://img-cdn.gateio.im/social/moments-294ba9b00f-74ce165a3f-8b7abd-e2c905(
画像:DeepSeek
Counterpoint ResearchのAI主任アナリスト、Wei Sunは、mHCを「衝撃的なブレークスルー」と呼び、_Business Insider_へのコメントで、「計算ボトルネックを回避し、知能の飛躍を実現できる」と述べた。彼女は、米国の輸出規制により高度なチップへのアクセスが制限されている中でも、DeepSeekは「計算能力のボトルネックを回避し、知性の飛躍を解き放つことができる」と指摘した。Omdiaのチーフアナリスト、李哲は、DeepSeekが方法論を公開する意欲は、「中国のAI産業に新たな自信を示している」と述べている。同社のオープンソース戦略は、かつてOpenAIがそうだったように、クローズドモデルや数十億ドルの資金調達ラウンドに移行する前の、開発者からの支持を集めている。
すべての人が納得しているわけではない。Redditの一部開発者は、DeepSeekの推論モデルは単純なタスクに過剰な計算リソースを浪費していると不満を漏らし、一方で批評家は、同社のベンチマークは実世界の複雑さを反映していないと指摘している。2025年4月にバイラルになったMediumの投稿「DeepSeekはダメだ—もう我慢できない」では、モデルが「定型文のナンセンスとバグ」を生成し、「幻のライブラリ」を作り出すと非難された。DeepSeekには負の側面もある。プライバシー問題がつきまとい、一部政府はDeepSeekのネイティブアプリを禁止している。中国との関係やモデルの検閲に関する疑問も、技術的議論に地政学的な緊張をもたらしている。それでも、勢いは止まらない。DeepSeekはアジアで広く採用されており、V4がコーディングの約束を果たせば、西洋でも企業導入が進む可能性が高い。
![])https://img-cdn.gateio.im/social/moments-b8d6dfc0dd-0a974bede7-8b7abd-e2c905(
画像:Microsoft
また、タイミングも重要だ。_Reuters_によると、DeepSeekは当初2025年5月にR2モデルをリリースする予定だったが、創設者の梁氏がその性能に不満を抱き、計画を延長した。現在、V4は2月を目標にしており、R2は8月に続く可能性もあるため、同社は緊急性または自信を持って動いていることがうかがえる。おそらく、その両方だ。