アイキャッチ

NVIDIAが示すAIエージェントの現在地と「仮想空間での物理実験」が切り拓く未来とは

ITニュース

AIエージェントという概念が、単なるバズワードではなく、業務の中に静かに浸透しはじめた。全世界で約3万人の従業員を有する半導体メーカー・NVIDIAも、AIエージェントそのものや各種ツールの提供に注力している。

従業員のうち約8割がエンジニア、そのうち約6割はソフトウエアエンジニアという人員構成からも、新たな価値の創出に対する本気度が伺える。

近年、最も注目されている企業の一つと言っても過言ではないNVIDIA。そして最もホットなキーワードの一つであるAIエージェント。その二つの現在地と訪れるであろう未来とは?

生成AI技術を活用したAIエージェントの社会実装を推進する一般社団法人AICX協会が主催した『AI Agent Day 2025 Summer』で行われたセッション「AIエージェントを支えるNVIDIAの技術とその未来像」でエヌビディア合同会社のエンタープライズ事業本部 事業本部長・井﨑武士さんが語った内容より、一部抜粋して紹介しよう。

AIエージェント活用は、企業成長に直結する時代

生成AIが世界にもたらす経済効果は、年間約4.4兆ドルと言われています。日本の昨年のGDPが約4.3兆ドル、ドイツが約4.5兆ドルなので、この規模の大きさをお分かりいただけるのではないでしょうか。

あるコンサルティングファームの調査によると、生成AIを活用している企業は、活用していない企業に比べて20倍以上の確率で収益増加が見込まれるという見通しも出ています。また、ガートナーの資料では、2026年までに、顧客サービスおよびサポート組織の約半分が生成AIを用いたバーチャルアシスントやエージェントを利用するであろうと予測されているほどです。

そして2028年には、企業向けソフトウエアの約3割にエージェントが組み込まれるともささやかれています。現在、エンタープライズソフトウエア業界は約1兆ドルの産業です。これまで、ソフトウエアは「従業員が使用するツール」でした。しかし今後は、従業員が複雑な業務を迅速に遂行するための「支援ツール」へと変革していくでしょう。

『AI Agent Day 2025』で行われたセッション「AIエージェントを支えるNVIDIAの技術とその未来像」より

そうなるとどのような人々が恩恵を受けるのか。それは、世界中に約10億人いるといわれている知的労働者にほかなりません。彼らの仕事の自動化がみるみる進んでいくのです。

従来のLLMとの圧倒的差の正体

AIエージェントは、一つのエージェントが全ての能力を持つわけではありません。専門分野を持つ複数のエージェントが連携しながら問題を解決していくのですが、このエージェントの構築はなかなか複雑です。例えば、異なるフレームワークを使用して制作されたエージェントが上手く相互作用するとは限りませんから。

さらに、エージェントは一度制作して終わりではなく、継続的に学習して賢くなっていかなければなりません。その学習と適用も重要なポイントです。

他にも見過ごせないポイントは多々ありますが、エージェントで最も大切なのは「思考」を司る部分でしょう。入力されたプロンプトデータを解釈した上でタスクを細分化し、適切なツールを自動的に選択してアクションへとつなげていく必要があるため、リーズニングモデル(思考過程)が重要となります。

『AI Agent Day 2025』で行われたセッション「AIエージェントを支えるNVIDIAの技術とその未来像」より

情報が提供される前にその正確性を検証する役割も持ち、曖昧なものはユーザーの意図を汲み取って明確化することができます。さまざまなデータを収集・取得するにつれて、推論プロセスを精緻化し、時間の経過とともに回答の精度を向上させることも、リーズニングモデルを用いれば可能です。

従来のLLMは、知識問題に特化している傾向がありました。「NVIDIAとは何ですか?」とChatGPTなどに尋ねると、Wikipediaに記載されているような内容がすぐに出てくる。こういった問題に強いのです。

一方、リーズニングモデルは、さまざまな要素を細分化しながら論理的に組み立てることができます。例えば、「8人家族で食事をする際の席順を決めたい」というテーマを与えるとします。「自分の妻と子ども、自分の両親、妻の両親がいる」「この二人はあまり仲が良くない」「食事の手伝いができるように子ども同士は隣に座らせたい」など、複数の制約条件がある中で、論理的に席順を決めることは、従来のモデルは不得意でしたが、リーズニングモデルの進化によって可能になってきているのです。

【NVIDIAの例】
あらゆる専門性に特化したAIエージェントに加えさまざまなツールや仕組みを提供している

・NeMo Agent Toolkit
複数のエージェントの連携、エージェントが利用するツールの登録やそれらを統合的に評価するための仕組みなどが含まれている

・Nemotron Reasoning LLM
NVIDIAで独自に開発しているリーズニングモデル

・NeMo Retriever RAG
高速で精度の高いRAG(検索拡張生成)システムの構築が重要となるエージェント向けに提供されているモデル

・AI‐Q エージェントAI Blueprint
エージェントのBlueprint、すなわち実装例や設計図

フィジカルAIの分野で、日本が世界をリードする未来へ

NVIDIAで行っている取り組みの中で個人的にも面白いと思っているのは、ビデオサーチのサマライゼーション、つまり画像分析や動画分析のエージェントも作成している点です。

動画分析のエージェントは、映像、画像、ストリーミングデータを利用しながら、それに対して要約、Q&A、あるいは異常検知といったアラートを出すといった指示をさまざまなツールを用いて実現するもの。テキストベースのエージェントだけでなく、マルチモーダルな入力を利用することで、アプリケーションがより一層広がる可能性を秘めているのです。

すでにビデオサーチサマライゼーションを利用する企業は増えてきています。今後は、工場内のカメラで状況を正確に理解し、不具合検知があった場合は過去の不具合ログから対応策をアクションとして取らせたり、プロセスフローを見ながらサプライチェーンをマネジメントして材料を調達したり、広範囲に影響を及ぼすことが可能になるでしょう。

『AI Agent Day 2025』で行われたセッション「AIエージェントを支えるNVIDIAの技術とその未来像」より

このように、進歩し続けているエージェントですが、NVIDIAが見据えているのは、エージェントが自律化していった先にあるフィジカルAI、すなわちロボティクスの進展です。

ロボティクスにおいては、通常の生成AIだけでなく、画像や音声といった入力トークンとテキストトークンを組み合わせて利用します。その先にロボットを動かすためのアクションを生成するアクショントークンを作成するのですが、ここでは物理現象を正確に理解するモデルが必要です。

ただしロボットの場合、学習用のデータを取得するためには時間もコストもかかります。また、ロボット自体の製造にも多額の費用がかかる。破損してしまうと大きな損失になるので、物理実験も容易ではありません。

そのためNVIDIAが進めているのが、このような物理的な環境を、まずは仮想環境の中で実現すること。モデルを構築するための学習環境と、実際にロボットに搭載するエンベディング環境の提供に加え、仮想環境、すなわちメタバース環境を構築しています。

ジェンスン・フアン イベント登壇時の様子

NVIDIAが目指すロボットの最終形態は「ヒューマノイド」です。そのため、自動運転に匹敵するようなワークロードを処理できる組み込み用GPUなども開発しています。

4月にCEOのジェンスン・フアンが来日し、総理大臣にお会いした際にも、リアルフィジカルAIについてお話しさせていただきました。日本はメカトロニクスが非常に強い国である一方で、AI化という点では少し遅れている部分があります。しかし、メカトロニクスにおけるロボットの制御技術は非常に重要であり、日本には高い技術があることは紛れもない事実です。

そこにAIを適切に活用することで、フィジカルAIの分野で日本が主導権を握る可能性は十分にある。AIロボット協会(AIRoA/アイロア)も設立された今、日本独自の基盤モデルを構築し、それを世界に展開していくような未来が訪れると信じています。

Xをフォローしよう

この記事をシェア

RELATED関連記事

JOB BOARD編集部オススメ求人特集

RANKING人気記事ランキング





サイトマップ