NVIDIA、フィジカルAIデータツールとCosmos世界基盤モデルを発表
この記事の内容をまとめると…
- NVIDIA が Cosmos 世界基盤モデルのメジャーリリースを発表
- フィジカル AI 向け合成データ生成ツール群を提供
- 初期採用企業には1X、Agility Robotics、Skild AI などが名を連ねる
新しい Cosmos 世界基盤モデルやフィジカル AI ツールの発表により、合成データ生成や物理的世界の推論を強化し、ロボティクスや自動運転などへの展開が進む。
Cosmos詳細
NVIDIA は、新たに Cosmos 世界基盤モデル(Cosmos WFM)とフィジカル AI 開発向けの複数のデータツール群を発表した。Cosmos WFM は、オープンで完全にカスタマイズ可能な推論モデルであり、開発者が仮想世界の生成を完全に制御可能とする。併せて公開された Cosmos Transfer や Cosmos Predict は、フォトリアルな合成データ生成と世界状態の予測に対応し、Omniverse を通じた 3D シミュレーションとも連携する。
Cosmos Transfer は、セグメンテーションマップや深度マップ、LiDAR スキャンなど構造化ビデオの出力を可能とし、認識 AI のトレーニングを効率化する。自動運転車やロボティクス分野では、Foretellix や Parallel Domain などがこのツールを活用している。
また、Cosmos Predict はマルチモーダル入力により、仮想世界の状態や中間モーションの軌跡を予測可能とし、特に事後トレーニング用に設計されている。加えて、Cosmos Reason では、自然言語で相互作用の影響を予測できるマルチモーダル推論機能が搭載されている。
さらに、NVIDIA NeMo Curator を用いたデータキュレーションと高速な事後トレーニングも可能とし、Visual Agent 向けモデル開発や動画検索・要約といったタスクに対応している。
Cosmos WFM は、Hugging Face や GitHub を通じて一般公開されており、Cosmos Reason は早期アクセスとして提供されている。