NABLAS、AI生成文章の検出モデルを開発 GPTシリーズで生成された日本語の文章を高精度に検出

AI総合研究所として活動するNABLASは2日、ChatGPT, GPT-4, GPT-4oなどのGPTシリーズの生成AIによって生成された文章を検出するAI生成文章検出モデルを開発したと発表した。

当検出モデルは日本語文章において、AIで生成された文章を高精度に検出可能で、AIによって作成された虚偽のニュース、フィッシングメール等の検出や、学術機関における論文等の学術基準維持、教育機関における提出課題の生成判定など、様々な分野での文章の信頼性に関わる問題解決に貢献する。

当検出モデルは、OpenAIが提供するGPTシリーズ(ChatGPT、GPT-4、 GPT-4oなど)によって生成された日本語の文章を検出するモデル。350文字以上の文章であれば、AIによって生成された文章中に、人間が書いた文章が混ざっている場合でも生成された箇所を検出可能。また、AI生成の文章を検出する機能を持つツール「GPTZero」との検出精度比較でも、GPTZeroの検出精度71%に対し当検出モデルでは88%の検出精度を記録し、GPTZeroを上回る結果となっている。

〈検証条件〉
●検出に使用したテキストは、以下の方法で生成されたデータで検証
・GPT-3.5:CausalLM/GPT-4-Self-Instruct-Japaneseのインストラクションを活用して生成
・GPT-4:CausalLM/GPT-4-Self-Instruct-Japaneseから出力
・GPT-4o:CausalLM/GPT-4-Self-Instruct-Japaneseのインストラクションを活用して生成

【判定ラベルの内容】
緑…人間が書いた可能性が高い文章(AI生成の可能性:30%以下)
黄…AI(GPTモデル)が生成した可能性が高い文章(AI生成の可能性:70%以上)
白…予測困難な文章(AI生成の可能性:30%~70%未満)

■考えられる活用分野
AI生成文章検出の技術は生成AIを使って文章を作成する、あらゆるシーンでの活用が可能で、学術・教育分野、メディア領域、犯罪対策、クリエイティブなど幅広い分野での活用が期待される。
●学術・教育分野
論文やエッセイ、課題提出物における生成AIの活用を検出
●メディア
生成AIで作成されたフェイクニュースやネガティブキャンペーンの検出
●犯罪対策・防犯
生成AIで作成された詐欺やフィッシングメールを検出し、個人や組織を保護
●クリエイティブ
コンテンツクリエイターが書いた文章と生成AIによる文章の判別

今後は、GPT以外の主要な文章生成AIの検出にも対応させることで、生成されたAIに限らず検出が可能となるようモデル性能の一般化を進めていく。また、同社では引き続き、フェイク検出に関する技術開発や新たなフェイク生成手法への対応も進めていくという。

問い合わせ

関連URL

NABLAS

関連記事

注目記事

  1. 2024-11-13

    手術室の主役は「人」から「AI・ロボット」へ 病院に於ける「AI・ロボット」の利用状況

    AIホスピタルは、医療分野における革新的な取り組みとして注目されている。特に「AI・ロボット」は、病…
  2. 2024-11-2

    「AI博覧会 Osaka 2025」2025年1月22日~1月23日開催

    AIポータルメディア「AIsmiley」を運営するアイスマイリーは、2025年1月22日(水)~1月…
  3. 2024-9-27

    アイスマイリー、AI検索システムカオスマップ 2024を公開

    AIポータルメディア「AIsmiley」を運営するアイスマイリーは26日、各業界のDX推進の支援の一…
  4. 2024-9-19

    小学校の授業における生成AIの活用と文科省ガイドライン

    小学校の授業における生成AIの活用は、教育の質を向上させる新たな可能性を秘めている。生成AIを活用す…
  5. 2024-9-13

    「生成AI大賞2024」エントリーの受付を開始

    Generative AI Japan(GenAI:ジェナイ〉」)は12日、日経BPが発行・運営する…

カテゴリー

最近の投稿

ページ上部へ戻る