NABLAS、AI生成文章の検出モデルを開発 GPTシリーズで生成された日本語の文章を高精度に検出

AI総合研究所として活動するNABLASは2日、ChatGPT, GPT-4, GPT-4oなどのGPTシリーズの生成AIによって生成された文章を検出するAI生成文章検出モデルを開発したと発表した。

当検出モデルは日本語文章において、AIで生成された文章を高精度に検出可能で、AIによって作成された虚偽のニュース、フィッシングメール等の検出や、学術機関における論文等の学術基準維持、教育機関における提出課題の生成判定など、様々な分野での文章の信頼性に関わる問題解決に貢献する。

当検出モデルは、OpenAIが提供するGPTシリーズ（ChatGPT、GPT-4、 GPT-4oなど）によって生成された日本語の文章を検出するモデル。350文字以上の文章であれば、AIによって生成された文章中に、人間が書いた文章が混ざっている場合でも生成された箇所を検出可能。また、AI生成の文章を検出する機能を持つツール「GPTZero」との検出精度比較でも、GPTZeroの検出精度71%に対し当検出モデルでは88％の検出精度を記録し、GPTZeroを上回る結果となっている。

〈検証条件〉
●検出に使用したテキストは、以下の方法で生成されたデータで検証
・GPT-3.5：CausalLM/GPT-4-Self-Instruct-Japaneseのインストラクションを活用して生成
・GPT-4：CausalLM/GPT-4-Self-Instruct-Japaneseから出力
・GPT-4o：CausalLM/GPT-4-Self-Instruct-Japaneseのインストラクションを活用して生成

【判定ラベルの内容】
緑…人間が書いた可能性が高い文章（AI生成の可能性：30％以下）
黄…AI（GPTモデル）が生成した可能性が高い文章（AI生成の可能性：70％以上）
白…予測困難な文章（AI生成の可能性：30％～70％未満）

■考えられる活用分野
AI生成文章検出の技術は生成AIを使って文章を作成する、あらゆるシーンでの活用が可能で、学術・教育分野、メディア領域、犯罪対策、クリエイティブなど幅広い分野での活用が期待される。
●学術・教育分野
論文やエッセイ、課題提出物における生成AIの活用を検出
●メディア
生成AIで作成されたフェイクニュースやネガティブキャンペーンの検出
●犯罪対策・防犯
生成AIで作成された詐欺やフィッシングメールを検出し、個人や組織を保護
●クリエイティブ
コンテンツクリエイターが書いた文章と生成AIによる文章の判別

今後は、GPT以外の主要な文章生成AIの検出にも対応させることで、生成されたAIに限らず検出が可能となるようモデル性能の一般化を進めていく。また、同社では引き続き、フェイク検出に関する技術開発や新たなフェイク生成手法への対応も進めていくという。

問い合わせ

NABLAS、AI生成文章の検出モデルを開発　GPTシリーズで生成された日本語の文章を高精度に検出

関連URL

関連記事

小田急不動産、ＡＩを活用したマンション管理サービスを開始

G-Place、AI・高性能チャットボット『スグレス』世田谷区の…

AssistMotion、ロボットとアプリによる歩行トレーニング…

AI身体計測アプリ「Bodygram」とTrueDepthカメラ…

シーマン人工知能研究所、高齢者向けおしゃべりAI見守りスピーカー…

注目記事

企業の45%が生成AIを利用、日常業務では80%超の企業が利用成果を認識 =JIPDECとITR調べ=

BizTech、『今さら聞けない！ChatGPT基本のキ』ホワイトペーパー公開

アイスマイリー、「AIエージェントカオスマップ 2025」を公開

ベクトル、人材業界向け「ChatGPTを活用した顧客体験の進化と収益向上方法をまとめたレポート」

「AI博覧会 Spring 2025」3月27日・28日開催

カテゴリー

最近の投稿

サイト情報

アーカイブ

カテゴリー

AIRobot-NEWS

Society5.0時代のAI・Rboto情報

NABLAS、AI生成文章の検出モデルを開発 GPTシリーズで生成された日本語の文章を高精度に検出

関連URL

関連記事

注目記事

カテゴリー

最近の投稿

タグ

サイト情報

アーカイブ

カテゴリー

Society5.0時代のAI・Rboto情報

NABLAS、AI生成文章の検出モデルを開発　GPTシリーズで生成された日本語の文章を高精度に検出