NABLAS、AI生成文章の検出モデルを開発 GPTシリーズで生成された日本語の文章を高精度に検出

AI総合研究所として活動するNABLASは2日、ChatGPT, GPT-4, GPT-4oなどのGPTシリーズの生成AIによって生成された文章を検出するAI生成文章検出モデルを開発したと発表した。

当検出モデルは日本語文章において、AIで生成された文章を高精度に検出可能で、AIによって作成された虚偽のニュース、フィッシングメール等の検出や、学術機関における論文等の学術基準維持、教育機関における提出課題の生成判定など、様々な分野での文章の信頼性に関わる問題解決に貢献する。

当検出モデルは、OpenAIが提供するGPTシリーズ(ChatGPT、GPT-4、 GPT-4oなど)によって生成された日本語の文章を検出するモデル。350文字以上の文章であれば、AIによって生成された文章中に、人間が書いた文章が混ざっている場合でも生成された箇所を検出可能。また、AI生成の文章を検出する機能を持つツール「GPTZero」との検出精度比較でも、GPTZeroの検出精度71%に対し当検出モデルでは88%の検出精度を記録し、GPTZeroを上回る結果となっている。

〈検証条件〉
●検出に使用したテキストは、以下の方法で生成されたデータで検証
・GPT-3.5:CausalLM/GPT-4-Self-Instruct-Japaneseのインストラクションを活用して生成
・GPT-4:CausalLM/GPT-4-Self-Instruct-Japaneseから出力
・GPT-4o:CausalLM/GPT-4-Self-Instruct-Japaneseのインストラクションを活用して生成

【判定ラベルの内容】
緑…人間が書いた可能性が高い文章(AI生成の可能性:30%以下)
黄…AI(GPTモデル)が生成した可能性が高い文章(AI生成の可能性:70%以上)
白…予測困難な文章(AI生成の可能性:30%~70%未満)

■考えられる活用分野
AI生成文章検出の技術は生成AIを使って文章を作成する、あらゆるシーンでの活用が可能で、学術・教育分野、メディア領域、犯罪対策、クリエイティブなど幅広い分野での活用が期待される。
●学術・教育分野
論文やエッセイ、課題提出物における生成AIの活用を検出
●メディア
生成AIで作成されたフェイクニュースやネガティブキャンペーンの検出
●犯罪対策・防犯
生成AIで作成された詐欺やフィッシングメールを検出し、個人や組織を保護
●クリエイティブ
コンテンツクリエイターが書いた文章と生成AIによる文章の判別

今後は、GPT以外の主要な文章生成AIの検出にも対応させることで、生成されたAIに限らず検出が可能となるようモデル性能の一般化を進めていく。また、同社では引き続き、フェイク検出に関する技術開発や新たなフェイク生成手法への対応も進めていくという。

問い合わせ

関連URL

NABLAS

関連記事

注目記事

  1. 2024-7-19

    人機一体、直感的な操作システム搭載人型重機が JR西日本の鉄道設備メンテナンスに導入

    人機一体は17日、同社のロボット工学技術が搭載された初めての製品となる「多機能鉄道重機」が、7 月か…
  2. 2024-7-17

    順天堂大学、AIを用いた脳容積解析ソフトウェアを開発

    順天堂は16日、順天堂大学保健医療学部診療放射線学科の後藤政実 先任准教授、京極伸介 教授、代田浩之…
  3. 2024-7-12

    生成AIによるオススメフォントのアドバイスサービス「DynaGPT」リリース記念キャンペーン

    主に文字フォント開発、およびその関連製品の開発・販売・保守を行う、ダイナコムウェアは、生成AIによる…
  4. 2024-7-6

    WITCRAFT、生成AIを活用した動画サービスDO/AI(ドゥ・エーアイ)を提供開始

    WITCRAFTは2日、生成AIを活用した動画サービスDO/AI(ドゥ・エーアイ)を提供開始した。 …
  5. 2024-7-3

    AI英語アプリ「マグナとふしぎの少女」、GIGAスクール端末向けにアップデート

    昨年夏、学校内で流行りすぎて公開停止となったミントフラッグの英語学習アプリ「マグナとふしぎの少女」は…

カテゴリー

最近の投稿

ページ上部へ戻る