中国の人工知能企業Z.AIは水曜日、Huaweiのプロセッサ上で完全に訓練されたオープンソースの画像生成モデルをリリースしました。これは、主要なAIモデルが米国のハードウェアに頼らずに完全な訓練サイクルを完了した初めての事例です。
この動きは、NvidiaのAIチップにおける支配に対する長期的な潜在的挑戦を浮き彫りにしています。中国のトップAI企業の一つが、米国製GPUに依存せずに大規模モデルを訓練できることを示しているからです。
このモデルはすでにHugging Faceでダウンロード可能で、美的感覚や一貫したテキストの点では今日の基準から見て良好ですが、印象的ではありません。最初の簡単なテストに基づくと、優れた空間認識も示しています。
Z.AIの新モデルで生成された画像。
北京を拠点とする同社は、先週の香港IPOで$558 百万を調達し、モデル名はGLM-Imageと呼ばれ、MindSporeフレームワークを使用してHuaweiのAscend Atlas 800T A2サーバー上で訓練しました。 「これが国内の計算能力の潜在力を探求するコミュニティの参考になれば幸いです」と、Z.AIは_サウスチャイナ・モーニングポスト_に共有した声明で述べました。
GLM-Imageの紹介:オープンソース画像生成の新たなマイルストーン。
GLM-Imageは、ハイブリッドの自己回帰と拡散アーキテクチャを採用し、強力なグローバルセマンティック理解と高忠実度の視覚的詳細を融合しています。全体的な品質では主流の拡散モデルに匹敵します… pic.twitter.com/cjtUYRkge5
— Z.ai (@Zai_org) 2026年1月14日
GLM-Imageは、自己回帰と拡散技術を16億のパラメータを持つハイブリッドアーキテクチャに組み合わせています。自己回帰コンポーネントは、Z.AIのGLM-4言語モデルに基づき、指示理解と画像構成を担当し、拡散デコーダーは細部を洗練します。このアプローチは、OpenAIの最新画像生成モデルgpt-image-1.5が示すように、純粋な拡散モデルと比べて優れたテキストレンダリングとプロンプト遵守を実現しています。 拡散モデルは、ランダムな視覚ノイズから始めて徐々に画像に仕上げていきます。一方、自己回帰モデルは、前の部分に基づいて一歩ずつ画像を構築します。拡散は全体的なリアリズムに優れていますが、テキストやレイアウトのような正確な詳細には苦労することがあります。自己回帰モデルは、構造と指示の従順さに優れています。現在、オープンソースのAI画像生成器の中では拡散が主流の技術です。
新しいハイブリッドシステムは、両方のアプローチを組み合わせ、自己回帰生成で画像を計画し、拡散で最終結果を磨きます。
画像:Z.AI
このリリースは、2025年に中国の軍事との関係を理由に米国にブラックリスト入りしたZ.AIにとって重要です。その指定により、同社はNvidiaのH100およびA100プロセッサから切り離されていました。今や、Z.AIは、ブラックリスト入りの企業でも国内ハードウェアを使って競争力のあるAIシステムを作れることを証明しました。これは北京が長らく示したいと望んでいた進展です。 Z.AIの発表直後、ロイター_は、中国の税関当局がエージェントに対し、NvidiaのH200チップの入国を阻止するよう指示したと報じました。政府関係者は、必要に応じてチップを購入しないようにと技術企業を会議に招集しました。情報筋によると、その表現は「今のところほぼ禁止に等しい」とのことです。 北京は、中国のAI研究所が米国のシリコンなしでも有能なモデルを構築できることを示すシグナルを送っているようです。これにより、中国企業がNvidiaハードウェアを蓄積する必要性が低下します。H200は、北京が昨年8月にブロックしたH20チップの約6倍の性能を提供し、中国企業から200万台以上の注文を受けており、1台あたり27,000ドルで販売されました。 ジョージタウン大学の安全保障と新興技術センターのアナリストは、中国のチップ戦略はHuaweiのプロセッサの巨大クラスターによるパフォーマンス低下を補うことに依存していると指摘しています。このアプローチは機能しますが、より多くのハードウェア、電力、エンジニアリング努力を必要とします。 「この戦略の主要な制約の一つは、中国が国内で十分なチップを生産できる能力であり、そのギャップを埋め、追いつくことです」と、シニアリサーチアナリストのハンナ・ドーメンは CNBC_に11月に語っています。 Huaweiのロードマップによると、2026年の次世代チップは、実際には現行のフラッグシップよりも性能が劣るとされています。しかし、そのような評価は、中国の研究所がアルゴリズムの効率性を通じて達成できることを過小評価している可能性があります。DeepSeekは、GPUのアセンブリレベルの最適化を通じて、より少ないチップで競争力のあるモデルを訓練したことを示しています。
出典:外交評議会
Z.AIのGLM-Imageは、テキストレンダリングと中国文字生成において、オープンソースモデルの中で業界トップのベンチマークスコアを達成したと、同社の技術報告書は述べています。適切なハードウェアを持たない人も、APIアクセス(1画像あたり0.014ドル)や、Z.AIが運営する無料のHugging Face Spaceを通じてオンラインで試すことができます。 Z.AIは、中国の「AIタイガース」と呼ばれるスタートアップグループの中で、OpenAIやAnthropicに匹敵する大規模言語モデルを構築し、上場した最初の企業です。上場以来、株価は約80%上昇しており、中国のAI企業(DeepSeekやAlibabaなど)への投資家の熱狂を背景に、国内チップの野望も追い風となっています。 一方、Huaweiは今年、Ascendプロセッサの生産を大幅に増やす準備を進めています。同社のブースは中国各地のAI会議でより目立つようになり、サンタクララに依存しない国家的なAIインフラの基盤としての位置付けを強化しています。