NTT-AT、AI音声認識エンジンを活用した「DiscussVisionNetライブ字幕サービス」提供開始
- 2021/7/14
- 暮らし
- AI音声認識エンジン, ライブ字幕サービス, 議会映像配信システム
NTTアドバンステクノロジ(NTT-AT)は14日、議会映像配信システム「DiscussVisionNet」の新たなオプションサービスとして、AI音声認識エンジンを活用しライブ映像に字幕を付与する、「DiscussVisionNetライブ字幕サービス」を6月から提供開始したと発表した。
2001年(クラウド版は2005年)にサービス開始した「DiscussVisionNet」は、情報公開法制定以降、自治体の情報公開を促進するサービスとして300を超えるユーザーをサポートしてきた。近年、「障害者差別解消法に関連する条例」や「手話言語条例」を制定する動きが広がっていることを背景に議会では、手話や字幕表示の導入、およびその設備導入コストが課題となっている。
今回提供を開始する「DiscussVisionNetライブ字幕サービス」は、既存設備を活かしながらも高機能かつ低コストでの導入を可能とするなど、議会運営側のメリットがある一方で、音声なしの環境で視聴する人々にとっても大変役立つサービスだという。
サービスの特長
(1)低コストで導入可能
議会向けインターネット映像配信に手話通訳や音声認識を導入するには、手話通訳者の派遣、カメラ、映像合成機などを新たに準備する必要があり、コスト面が課題となる。一方、本字幕サービスでは、既設設備に簡易的な機材を追加するだけで低コストに導入可能。特にDiscussVisionNet導入済みのユーザーは、オプションサービスの契約と字幕表示用機材の導入だけで字幕表示が実現できる。
(2)用語登録に対応
ユーザー毎に用語の登録が可能。「3密」や「ソーシャルディスタンス」など、新用語や、自治体・地方独自の単語を登録することでさらに認識精度の向上が可能。
(3)視聴者側でアプリのインストールが不要
視聴者側でアプリのインストールなど字幕表示に必要な準備は不要。ブラウザで議会向けインターネット映像配信にアクセスし、字幕表示をONにするだけ。
(4)言い淀みを自動で削除
「えーと」「そのー」「あの」などの言い淀みを自動削除し、簡潔でわかりやすい字幕を表示。
(5)国内シェアNo.1音声認識エンジンを採用
音声認識には「日本語」や「専門用語」に強い国内シェアNo.1の音声認識エンジンを採用している。ディープラーニング技術により、エンジンは精度向上に向け常に進化し、クラウドサービスのため常に最新の状態で利用可能。
コロナ禍により、議会向けインターネット映像配信が普及拡大するにつれ、障がい者への配慮がますます重要となる。NTT-ATは、議会における「オンライン化の促進」に向けビジネス拡大を目指すとともに、ICTサービス提供時における「障がい者の方のための合理的配慮」にも対応していくとしている。