証券日報網記者 王鏡茹生成型人工知能技術が「モデル訓練」から段階的に大規模な商業展開へと進む中、訓練を中心とした計算能力の消費は、推論を主導とする継続的な計算需要へと徐々にシフトしている。3月17日、NVIDIAのCEO黄仁勋はGTCカンファレンスで、AI推論市場の転換点が到来し、AIは訓練段階から推論と実行段階へ全面的に移行し、推論の計算能力需要が指数関数的に爆発していると述べた。「生成型人工知能の応用規模が拡大するにつれ、推論の計算能力需要の増加速度は訓練のそれをはるかに超える可能性がある。一方で、応用需要の爆発、生成型AIやインテリジェントエージェントの導入促進により、ユーザーの高頻度インタラクションが指数関数的な推論リクエストをもたらしている。もう一つは、専用推論チップ、液冷冷却、光インターコネクトなどの技術革新が継続し、計算効率と並列処理能力を大幅に向上させ、大規模展開の基盤を築いている」と、深圳市前海排排網基金販売有限責任公司の研究員張鵬遠は『証券日報』の記者に語った。業界機関の予測によると、推論計算能力の重要性は引き続き高まっている。IDC(国際データ公司)は、2027年までに中国の推論計算能力が全体の70%を超えると予測している。中国IDC圈の創設者兼CEO黄超は、2026年には産業インテリジェントエージェントが多様な発展段階に入り、計算能力の応用は「訓練主導」から「推論駆動」へと移行し、推論計算能力の爆発的需要のサイクルが全面的に到来すると述べている。推論計算能力の需要増加に直面し、国内の産業チェーンの上流・下流企業は技術開発と製品展開を加速させている。チップ面では、多くのメーカーが推論シナリオに最適化されたチップを次々に投入している。従来の訓練用チップと比較して、推論用チップは消費電力制御、コスト効率、展開の柔軟性を重視しており、クラウドとエッジの両方で広範な応用空間を持つ。例として、深圳の云天励飛科技股份有限公司(以下「云天励飛」)は、NPUを核とし、クラウド推論シナリオ向けの大規模計算チップにGPNPU技術路線を確立し、行列演算、ベクトルユニット、記憶階層、帯域利用の深度最適化を行い、トークンコストを指数関数的に削減し、大規模モデルの応用の規模拡大と普及を加速させることを目指している。2025年、云天励飛は売上高を13.08億元に達し、前年比42.57%増を記録した。云天励飛の関係者は『証券日報』の記者に対し、「企業にとって、業界競争が訓練規模から推論効率や納入コスト、システムの収益性にシフトする中、ハードウェア、ストレージ、ソフトウェアの連携をいち早く整えることが、推論時代において優位に立つ鍵となる」と述べた。サーバーやシステムの面では、主要メーカーも推論シナリオに最適化された計算プラットフォームを継続的に展開している。例えば、浪潮電子情報産業股份有限公司は、元脳R1推論サーバーをリリースし、1台で16枚の標準PCIeデュアルスロットカードをサポートし、DeepSeek-671Bモデルを展開可能にした。また、元脳CPU推論サーバーも迅速に展開でき、DeepSeek-R132BやQwQ-32Bなどの新世代推論モデルを効率的に運用できる。同時に、計算基盤のインフラ整備も加速している。過去には、多くの国内知能計算センターが訓練と推論を一体化した構築方式を採用していた。3月12日、云天励飛は広東省湛江市のAI浸透支援による新たな生産力基盤整備プロジェクトに入札し、推論タスクに特化したAI推論クラスターを構築、各種産業応用シナリオに対応し、国内伝統産業のAI化の実現例を提供している。北京止于至善投資管理有限公司の総経理何理は、この変革の中で、高性能推論チップ、HBM、全スタックソフトウェアが最初に恩恵を受けると考えている。推論シナリオは低遅延、高スループット、エネルギー効率の要求が非常に高いため、LPUやASICなどの専用アーキテクチャが汎用計算ユニットに取って代わる速度を加速させる。HBM4などの記憶技術は帯域幅のボトルネック突破の鍵となるだろう。同時に、計算能力はデータセンターからエッジ側へと下り、密度の高い推論マシンと先進的な冷却技術の需要が高まる。モデルの量子化やパラメータ圧縮などのコンパイル最適化も、ハードウェアの積み重ねからソフトウェアとハードウェアの協調へと産業を推進している。
推論算力の需要が急増、産業チェーン企業が展開を加速
証券日報網記者 王鏡茹
生成型人工知能技術が「モデル訓練」から段階的に大規模な商業展開へと進む中、訓練を中心とした計算能力の消費は、推論を主導とする継続的な計算需要へと徐々にシフトしている。3月17日、NVIDIAのCEO黄仁勋はGTCカンファレンスで、AI推論市場の転換点が到来し、AIは訓練段階から推論と実行段階へ全面的に移行し、推論の計算能力需要が指数関数的に爆発していると述べた。
「生成型人工知能の応用規模が拡大するにつれ、推論の計算能力需要の増加速度は訓練のそれをはるかに超える可能性がある。一方で、応用需要の爆発、生成型AIやインテリジェントエージェントの導入促進により、ユーザーの高頻度インタラクションが指数関数的な推論リクエストをもたらしている。もう一つは、専用推論チップ、液冷冷却、光インターコネクトなどの技術革新が継続し、計算効率と並列処理能力を大幅に向上させ、大規模展開の基盤を築いている」と、深圳市前海排排網基金販売有限責任公司の研究員張鵬遠は『証券日報』の記者に語った。
業界機関の予測によると、推論計算能力の重要性は引き続き高まっている。IDC(国際データ公司)は、2027年までに中国の推論計算能力が全体の70%を超えると予測している。中国IDC圈の創設者兼CEO黄超は、2026年には産業インテリジェントエージェントが多様な発展段階に入り、計算能力の応用は「訓練主導」から「推論駆動」へと移行し、推論計算能力の爆発的需要のサイクルが全面的に到来すると述べている。
推論計算能力の需要増加に直面し、国内の産業チェーンの上流・下流企業は技術開発と製品展開を加速させている。チップ面では、多くのメーカーが推論シナリオに最適化されたチップを次々に投入している。従来の訓練用チップと比較して、推論用チップは消費電力制御、コスト効率、展開の柔軟性を重視しており、クラウドとエッジの両方で広範な応用空間を持つ。
例として、深圳の云天励飛科技股份有限公司(以下「云天励飛」)は、NPUを核とし、クラウド推論シナリオ向けの大規模計算チップにGPNPU技術路線を確立し、行列演算、ベクトルユニット、記憶階層、帯域利用の深度最適化を行い、トークンコストを指数関数的に削減し、大規模モデルの応用の規模拡大と普及を加速させることを目指している。
2025年、云天励飛は売上高を13.08億元に達し、前年比42.57%増を記録した。云天励飛の関係者は『証券日報』の記者に対し、「企業にとって、業界競争が訓練規模から推論効率や納入コスト、システムの収益性にシフトする中、ハードウェア、ストレージ、ソフトウェアの連携をいち早く整えることが、推論時代において優位に立つ鍵となる」と述べた。
サーバーやシステムの面では、主要メーカーも推論シナリオに最適化された計算プラットフォームを継続的に展開している。例えば、浪潮電子情報産業股份有限公司は、元脳R1推論サーバーをリリースし、1台で16枚の標準PCIeデュアルスロットカードをサポートし、DeepSeek-671Bモデルを展開可能にした。また、元脳CPU推論サーバーも迅速に展開でき、DeepSeek-R132BやQwQ-32Bなどの新世代推論モデルを効率的に運用できる。
同時に、計算基盤のインフラ整備も加速している。過去には、多くの国内知能計算センターが訓練と推論を一体化した構築方式を採用していた。3月12日、云天励飛は広東省湛江市のAI浸透支援による新たな生産力基盤整備プロジェクトに入札し、推論タスクに特化したAI推論クラスターを構築、各種産業応用シナリオに対応し、国内伝統産業のAI化の実現例を提供している。
北京止于至善投資管理有限公司の総経理何理は、この変革の中で、高性能推論チップ、HBM、全スタックソフトウェアが最初に恩恵を受けると考えている。推論シナリオは低遅延、高スループット、エネルギー効率の要求が非常に高いため、LPUやASICなどの専用アーキテクチャが汎用計算ユニットに取って代わる速度を加速させる。HBM4などの記憶技術は帯域幅のボトルネック突破の鍵となるだろう。同時に、計算能力はデータセンターからエッジ側へと下り、密度の高い推論マシンと先進的な冷却技術の需要が高まる。モデルの量子化やパラメータ圧縮などのコンパイル最適化も、ハードウェアの積み重ねからソフトウェアとハードウェアの協調へと産業を推進している。