アドバンスト・メディアは20日、同社の音声認識クラウド型文字起こしサービス「ProVoXT(プロボクスト)」に、新たに医療カンファレンス向けエンジンと、双方向型のディープラーニング(深層学習)技術「Bi-LSTM(Bidirectional Long Short-Term Memory)」を搭載したと発表した。
「ProVoXT」は、音声認識により議事録作成を半自動化し、素早く効率的に議事録作成を行うクラウド型文字起こしサービス。月額利用料で利用者数の制限なく運用が可能な為、機関全体での働き方改革を推進し、業務効率化・生産性向上を実現する。
今回、通常の会議用エンジンに加え、医療カンファレンス用の音声認識エンジンを搭載した。医療用語に特化したエンジンを用いている為、「飛沫感染」「急性期梗塞」「リンパ節腫大」等の専門用語もスムーズに文字化できるという。
「Bi-LSTM」は、過去だけでなく未来の情報を予測し加える事で、双方向の時間軸から処理を行う。従来の音声認識エンジンAmiVoiceに実装していたリカレントニューラルネットワーク技術の「LSTM(Long Short-Term Memory)」と比較し、最大25%のエラー改善率を実現し、認識率が大幅に向上。「ProVoXT」で搭載している、エンジンに実装している。