CAC、音声感情解析AI「Empath」活用した3Dゲームの表情生成支援サービス「DeepEmo」提供開始
シーエーシー(CAC)は10日、音声感情解析AI「Empath」を搭載し、3Dゲームのキャラクターの表情生成を支援するサービス「DeepEmo(ディープエモ)」の提供を開始した。
現在、ハイエンドゲーム制作における3Dキャラクターの表情アニメーションは、アニメーターが1つのキャラクターごとに手作業で表情を作成するのが一般的。そのため、ゲーム内に登場するキャラクターや台詞が多くなるほど、アニメーターの工数が増加し、コストが高くなる傾向がある。
DeepEmoは3Dキャラクターの感情を台詞音声から解析する技術で、スクウェア・エニックスが2023年1月24日に発売した『FORSPOKEN(フォースポークン)』の開発に利用された。事前収録された台詞音声から感情値を時系列データで出力し、3Dアニメーションソフトに読み込ませてキャラクターの表情の自動生成を行った結果、約95%の制作時間を削減することができた。
本サービスは、この『FORSPOKEN』開発時の技術とノウハウをもとに感情解析のモデル生成方法を再検討して、一般の3Dゲーム開発にもDeepEmoによる感情解析の結果を利用できるようサービス化したもの。
DeepEmoは、音声感情解析AI「Empath」をもとに0.32秒ごとに変化する感情値を生成し、ディープラーニングを用いて、平常、怒り、恐怖、嫌悪、喜び、悲嘆、信頼、興味、驚きの9つの感情を推定する。
本サービスは、顧客がCACに台詞音声データを送付し、CAC側でDeepEmoによる解析を実行し、表情生成に活用できる感情値をCSVファイルで顧客に納品する。納期は、音声データがCACに届いてから2~4営業日。
■本サービスの価格
本サービスの価格は下記のとおり税別表記)。
初期費用: 80万円(モデルのチューニングを含む)
基本利用料: 5万円(500ファイルまで解析可能)
従量課金: 100円/1ファイル