NABLAS、AI生成文章の検出モデルを開発 GPTシリーズで生成された日本語の文章を高精度に検出
- 2024/7/6
- 暮らし
- ChatGPT, 検出, 生成AI, 生成AIによって生成された文章
AI総合研究所として活動するNABLASは2日、ChatGPT, GPT-4, GPT-4oなどのGPTシリーズの生成AIによって生成された文章を検出するAI生成文章検出モデルを開発したと発表した。
当検出モデルは日本語文章において、AIで生成された文章を高精度に検出可能で、AIによって作成された虚偽のニュース、フィッシングメール等の検出や、学術機関における論文等の学術基準維持、教育機関における提出課題の生成判定など、様々な分野での文章の信頼性に関わる問題解決に貢献する。
当検出モデルは、OpenAIが提供するGPTシリーズ(ChatGPT、GPT-4、 GPT-4oなど)によって生成された日本語の文章を検出するモデル。350文字以上の文章であれば、AIによって生成された文章中に、人間が書いた文章が混ざっている場合でも生成された箇所を検出可能。また、AI生成の文章を検出する機能を持つツール「GPTZero」との検出精度比較でも、GPTZeroの検出精度71%に対し当検出モデルでは88%の検出精度を記録し、GPTZeroを上回る結果となっている。
〈検証条件〉
●検出に使用したテキストは、以下の方法で生成されたデータで検証
・GPT-3.5:CausalLM/GPT-4-Self-Instruct-Japaneseのインストラクションを活用して生成
・GPT-4:CausalLM/GPT-4-Self-Instruct-Japaneseから出力
・GPT-4o:CausalLM/GPT-4-Self-Instruct-Japaneseのインストラクションを活用して生成
【判定ラベルの内容】
緑…人間が書いた可能性が高い文章(AI生成の可能性:30%以下)
黄…AI(GPTモデル)が生成した可能性が高い文章(AI生成の可能性:70%以上)
白…予測困難な文章(AI生成の可能性:30%~70%未満)
■考えられる活用分野
AI生成文章検出の技術は生成AIを使って文章を作成する、あらゆるシーンでの活用が可能で、学術・教育分野、メディア領域、犯罪対策、クリエイティブなど幅広い分野での活用が期待される。
●学術・教育分野
論文やエッセイ、課題提出物における生成AIの活用を検出
●メディア
生成AIで作成されたフェイクニュースやネガティブキャンペーンの検出
●犯罪対策・防犯
生成AIで作成された詐欺やフィッシングメールを検出し、個人や組織を保護
●クリエイティブ
コンテンツクリエイターが書いた文章と生成AIによる文章の判別
今後は、GPT以外の主要な文章生成AIの検出にも対応させることで、生成されたAIに限らず検出が可能となるようモデル性能の一般化を進めていく。また、同社では引き続き、フェイク検出に関する技術開発や新たなフェイク生成手法への対応も進めていくという。