富士通は26日、対話型生成AIから出力される回答の信頼性を向上する2つのAIトラスト技術である幻覚検出技術とフィッシングURL検出技術を開発したと発表した。
これらの技術を、「Fujitsu Kozuchi (code name) – Fujitsu AI Platform」の対話型生成AIコアエンジンに搭載し、9月28日から順次、日本国内に法人向けの実証実験環境として提供を開始し、個人向けにも同社ポータルサイト上からトライアル環境を提供する。今後は、グローバルにも展開予定しているという。
1つ目のAIトラスト技術は、対話型生成AIがデータに基づかないもっともらしい誤りを回答してしまう幻覚(ハルシネーション)を検出する技術で、対話型生成AIの回答文をAIが意味解析し、且つ幻覚が生じやすい固有表現部分を特定して重点的に確認することで、既存手法よりも幻覚を高精度に検出する。
2つ目は、対話型生成AIが、悪意ある情報を覚え込ませる攻撃を受けてフィッシングサイトURLを回答出力してしまう問題に対応できる技術で、対話型生成AIに本技術を搭載することで、AIを騙す既存の敵対的攻撃を含むフィッシングサイトを高度に検出し、利用者に危険なURLであることを伝える。
同社は今後も、対話型生成AIをはじめとするAIの品質やセキュリティ、倫理などのAIトラストを向上させる技術を世界に先駆けて研究開発し、実証実験や有効性検証を進めることで、顧客が安心してAIを利用できる社会づくりに貢献していくろしている。