日本マイクロソフト、アイシンの生成AI活用した「音声・文字変換アプリ」の事例を公開

日本マイクロソフトは5日、アイシンによる同社テクノロジの活用事例ストーリーを公開した。

マイクロソフトでは、「地球上のすべての個人とすべての組織が、より多くのことを達成できるようにする」というミッションのもと、あらゆる人々をテクノロジの力で支援している。

アイシンが開発した「YYSystem」は、音声を認識し、文字などに変換するアプリシリーズ。聴覚に障碍のある方をはじめ、コミュニケーションに困難を抱えるあらゆる人々に利用されているが、特に 生成AIを活用したMicrosoft Azure OpenAI Serviceの要約機能が LiD/APD(聞き取り困難症/聴覚情報処理障碍)のある人々に役立っているという。

添田洋美さんは幼少の頃から人の話を聞き取ることが苦手だった。家庭内でも、換気扇の音や流水音などの生活音があると、子供たちの声を聞き取るのに苦労した。医師による検査を受けても耳に異常は見つからず、耳で聞いた言葉を脳で処理することができない状態の「LiD/APD (聞き取り困難症/聴覚情報処理障碍)」があると診断されたのは、わずか 3 年前のこと。

LiD/APD は日本での認知度が低いため、当事者は孤独感や疎外感を感じやすく、仕事を続けたり、日常的な会話に参加したりするのが困難だという。
「ただ頷いて、理解しているふりをします。ときどき待ち合わせの時間を間違え、友達から『聞いてなかったの?』と言われます。そして、約束を守れない人だと思われて、疎遠になってしまうのです」と、添田さんはよくある事として打ち明けた。

添田さんは、今年初めから、アイシンが開発した音声認識アプリ「YYProbe」を使い始めた。YYProbe は、聴覚に障碍がある人々のコミュニティで広く使われているが、LiD/APD のある人にとっては、マイクロソフトの Azure OpenAI Service が提供する新しい生成 AI を活用した要約機能が特に役立つという。

生成 AI ツールは、大量のデータを合成してテキスト、コード、画像などを生成する大規模言語モデル (LLM) を基盤として構築されている。そうしたツールは、テキストを生成するだけでなく、要約することも可能。

たとえば、添田さんは、母親が新型コロナウイルス感染症で入院した際に、医師の話を理解するために YYProbe を使用しました。添田さんはタブレットで YYProbe を使って医師が話す内容を理解し、情報を要約して、文章化したものを妹に送った。

「(文字を) 読む方がついて行きやすく、話が分かるようになります。それに、もし間違って聞き取っていても、読み直して確認できます」と添田さんは言う。

アイシンの研究開発チームは、当初、業務記録の作成を目的とした従業員用の音声文字化ツールとして YYProbe をコロナ禍に開発していた。ある時、社内の聴覚障碍のある従業員にアプリを使用してもらったところ、とても評判が良かったため、聴覚障碍者だけでなく、高齢者や外国人、その他コミュニケーションに困難を抱えているあらゆる人々が使用できるツールとして、YYProbe をはじめとする音声認識システム「YYSystem」の開発に乗り出した。

アイシンがアプリの構築にマイクロソフトの Azure AI 音声を採用した決め手は、「音声認識の精度が高いため」だと、研究開発チームを率いる中村正樹さんは説明する。マイクロソフトの Azure OpenAI Service を通して OpenAI の ChatGPT テクノロジを利用し、Azure AI 翻訳と組み合わせることで、要約機能と翻訳機能を実現した。

YYSystem は、官公庁や小売店のカウンターに設置されたモニターでも運用されており、東京で開催されるデフリンピック 2025 では観客に利用される予定。また、さまざまなコミュニティの活動や個人の生活でも活用されている。

現在、添田さんは、医師や同業界で働くメンバーを含むオンラインの LiD/APD 親支援グループを運営しており、たとえば、子供の学習支援として教室への機器の持ち込みを認めてもらうための活動等を行っている。

また、アプリ開発者とも協力している。今年 5 月、添田さんの親支援グループはアイシンの研究開発オフィスを訪れ、開発者である中村さんとミーティングを行った。中村さんは、ユーザーと継続的に連絡を取りながら、要望に応じて定期的に機能を追加している。

添田さんの LiD/APD 親支援グループは、行間を広げて文章を短くすることや、発話者ごとに文字を違う色に変えることを提案し、その変更はアプリに反映された。

中村さんによると、アプリは将来的に、テキストや音声だけでなく、画像、動画、グラフも入力や生成をして、コミュニケーションができるようになる予定だという。生成 AI によって、すでにそれが実現可能になっている。

ストーリーの全文

関連URL

「YYSystem」
「Microsoft Azure OpenAI Service」
「Azure AI 音声」
日本マイクロソフト

関連記事

注目記事

  1. 2024-11-13

    手術室の主役は「人」から「AI・ロボット」へ 病院に於ける「AI・ロボット」の利用状況

    AIホスピタルは、医療分野における革新的な取り組みとして注目されている。特に「AI・ロボット」は、病…
  2. 2024-11-2

    「AI博覧会 Osaka 2025」2025年1月22日~1月23日開催

    AIポータルメディア「AIsmiley」を運営するアイスマイリーは、2025年1月22日(水)~1月…
  3. 2024-9-27

    アイスマイリー、AI検索システムカオスマップ 2024を公開

    AIポータルメディア「AIsmiley」を運営するアイスマイリーは26日、各業界のDX推進の支援の一…
  4. 2024-9-19

    小学校の授業における生成AIの活用と文科省ガイドライン

    小学校の授業における生成AIの活用は、教育の質を向上させる新たな可能性を秘めている。生成AIを活用す…
  5. 2024-9-13

    「生成AI大賞2024」エントリーの受付を開始

    Generative AI Japan(GenAI:ジェナイ〉」)は12日、日経BPが発行・運営する…

カテゴリー

最近の投稿

ページ上部へ戻る