NVIDIA は10日、インタラクティブな AI アバターを生成するためのテクノロジ プラットフォームである、NVIDIA Omniverse Avatarを発表した。
Omniverse Avatarは、音声 AI、自然言語理解、レコメンデーション エンジンおよびシミュレーションといった領域における、NVIDIA のテクノロジが組み合わされたもの。このプラットフォームで作成されたアバターは、レイトレーシングされた 3D グラフィックスによる、インタラクティブなキャラクターで、見ること、話すこと、多様な話題について会話することができ、自然に話された意図を理解することができる。
Omniverse Avatar は、ほぼすべての業界向けに簡単にカスタマイズできる AI アシスタントの創造への扉を開く。この AI アシスタントは、レストランでの注文や銀行取引、個人的なアポイントメントと予約といった、日々の数十億のカスタマー サービスのやり取りで使用することができるため、ビジネス機会の拡大と顧客満足度の向上につながるという。
Omniverse Avatar は、音声 AI、コンピューター ビジョン、自然言語理解、レコメンデーション エンジン、フェイシャル アニメーションおよびグラフィックスの要素を使用している。それらの要素は、以下のようなテクノロジによって実現している。
・音声認識は、複数言語の音声を認識するソフトウェア開発キットである NVIDIA Riva がベースとなっている。Riva は、テキストから音声に変換する機能を使って、人間と同じような会話応対を生成するためにも使用されている。
・自然言語理解は、人間の言語を認識、理解および生成することのできる、NVIDIA の Megatron 530B Large Language Model がベースとなっている。Megatron 530B は、ほとんど、あるいは全く学習することなく、複雑な文の作成、幅広い分野の質問への回答、長くて複雑なストーリーの要約、他の言語への翻訳、特別に学習されていない多くの分野への対応が可能な、事前に学習されたモデル。
レコメンデーション エンジンでは、大量のデータを処理して、賢明な提案をするのを可能にするディープラーニング レコメンデーション システムを構築するためのフレームワークである、NVIDIA Merlin が使用されている。