NVIDIAはGTCカンファレンスで、Physical AI Data Factory Blueprint(実体人工知能データ工場ブループリント)を発表しました。これはオープンなリファレンスアーキテクチャであり、データ生成の自動化や評価プロセスの強化を目的としています。モジュール化されたワークフローを通じて、開発者が生のデータを高品質なトレーニングセットに変換するのを支援し、大規模なロボット、ビジョンAIエージェント、自動運転車の開発コストと技術的ハードルを低減します。
実体人工知能データ工場ブループリントとは何か?
Physical AIはデータ量とモデル容量の同期的な成長に高度に依存しています。「実体人工知能データ工場ブループリント」は、従来バラバラだったデータ処理プロセスを標準化された自動化パイプラインに統合するための共通基準を提供します。Cosmos Curatorを用いて、実世界と合成データの大規模な処理、抽出、アノテーションを行い、その後、Cosmos Transfer技術を利用して選別されたデータを指数関数的に拡張・多様化します。これにより、異なる環境や照明条件、現実では捉えにくい稀なエッジケースをシミュレーションします。最後に、Cosmos Reason駆動の評価器が自動的に生成されたデータのスコアリングと検証を行い、物理的な正確性とトレーニング基準を満たすことを保証します。これにより、従来の手作業によるデータ選別の効率低下の問題を解決します。
大規模な計算需要を支えるため、NVIDIAはMicrosoft AzureやNebiusなどのクラウドサービス事業者と連携し、このブループリントを既存のクラウドインフラに統合しています。Microsoft AzureはこのアーキテクチャをGitHub上のオープンな実体人工知能ツールチェーンに組み込み、IoT操作やリアルタイムインテリジェンスサービスと連携させ、企業向けのエージェント駆動ワークフローを提供します。Nebiusは、AIクラウドプラットフォームにOSMOオーケストレーションフレームワークを統合し、RTX PRO 6000 BlackwellサーバーGPUをサポート。データ管理、アノテーション、サーバーレス実行、推論ホスティングまでのエンドツーエンドのスタックを開発者に提供します。このアーキテクチャにより、開発者は高速化された計算能力を大量のトレーニングデータに直接変換し、自律システムの構築を加速させます。
NVIDIA OSMOオープンソースオーケストレーションフレーム管理ソフトウェア:エージェントの管理とコーディング
大規模なAIインフラ管理能力に乏しい開発チーム向けに、「実体AIデータ工場ブループリント」はNVIDIA OSMOオープンソースオーケストレーションフレームワークを導入しています。OSMOのコア機能は、計算環境間の複雑なワークフローを管理し、手動作業の介入を減らすことにあります。これにより、技術チームはモデルの最適化により集中できるようになります。現在、OSMOはClaude、OpenAI Codex、Cursorなどのコーディングエージェントと連携し、AIネイティブな操作を実現しています。このモードでは、エージェントが計算リソースを自動管理し、システムのボトルネックを識別・排除し、モデルの開発から納品までのサイクルを短縮します。
既に複数の実体人工知能開発企業がこのブループリントを導入し、多様な分野で応用しています。Skild AIはこのアーキテクチャを用いて汎用ロボット基礎モデルの開発を推進し、Uberは自動運転車の研究と検証に活用しています。さらに、FieldAI、Hexagon Robotics、BMW、Linker Vision、Milestone Systems、Teradyne Roboticsなども、このブループリントを通じて知覚、移動、強化学習のパイプラインにおけるデータ生成能力を強化しています。
この記事はGTC 2026:NVIDIAが実体AIデータ工場ブループリントを発表し、ロボットや自動運転車の開発を加速させる、最初にABMediaに掲載されました。