NVIDIA、対話型 AI フレームワークJarvisの提供開始を発表
- 2021/4/13
- ものづくり
- AI, フレームワーク, 対話型 AI サービス
NVIDIA は13日、 NVIDIA Jarvis フレームワークの提供を開始したと発表した。
開発者は、NVIDIA Jarvis フレームワークが提供する最先端のトレーニング済みディープラーニング モデルとソフトウェア ツールを活用し、あらゆる業界と分野に簡単に応用できる対話型 AI サービスを構築することが可能になる。
人々の生活では、数十億時間分もの電話通話、Web ミーティング、ストリーミング配信による動画コンテンツが毎日生み出されている。こうした中 NVIDIA Jarvisは、高精度な自動音声認識、人間の能力を超えた言語理解、複数言語へのリアルタイム翻訳、新しいテキスト読み上げ機能を提供し、表現力に優れた対話型 AI エージェントの開発を可能にする。
GPU アクセラレーションを活用するエンドツーエンドの音声パイプラインは 100 ミリ秒未満で実行可能であり、聴き取り、理解、応答の生成を人間のまばたきよりも速く処理する。音声パイプラインはクラウド、データ センター、エッジに展開し、瞬時にスケーリングして数百万ユーザーに対応できる。
NVIDIA Jarvis は、これまで実現できなかった新しい言語ベース アプリケーションを可能にし、人間やマシンとの間に質の高いインタラクションを提供します。24 時間、患者をモニタリングすることで医療従事者の厳しい負担を和らげるデジタル ナース、消費者が求めている商品を理解し最適な候補を提案するオンライン アシスタント、国境を越えた質の高い共同作業や母国語でのライブ コンテンツ視聴を可能にするリアルタイム翻訳など、さまざまなサービスの可能性が開かれるという。
Jarvis は、異なる言語、発音、環境、専門用語で構成された 10 億ページ以上のテキストおよび6万時間分の音声データで、数百万 GPU 時間かけてトレーニングされたさまざまなモデルを使って構築されており、世界最高水準の精度を達成している。開発者は、NVIDIA TAO と呼ばれるフレームワークを使ってトレーニング、適応、最適化することにより、あらゆるタスク、業界、システムにこれらのモデルを簡単に対応させることが初めて可能になった。
開発者は、Jarvis のトレーニング済みモデルを NVIDIA の NGC カタログから選択し、自社データと Transfer Learning Toolkit を使ってファインチューニングを行い、リアルタイム音声サービスにおけるスループット最大化とレイテンシ最小化のために最適化を実施して、わずか数行のコードで簡単に展開できる。つまり、この過程を通して AI の高度な専門知識は必要ない。
新たに発表された機能は、継続的な NVIDIA Jarvis オープン ベータ プログラムの一環として第 2 四半期に提供開始予定。開発者は NGCから今すぐダウンロードできる。