エクサウィザーズ、画像の着目点を対話型で説明する生成AIモデル「exaBase Visual QA」開発

エクサウィザーズは20日、画像の内容を基に、その状況を対話型で説明する生成AIモデル「exaBase Visual QA」を開発したことを発表した。

一般的な生成AIモデルに比べて、画像内の危険性などの状況を高精度に解釈して説明文を生成できるのが特徴。消費者向けのサービスなどの商用にも利用可能。

画像を認識する一般的な生成AIモデルでは、特に複雑な画像についてその危険性などの内容を的確に文字情報として出力するのが難しいとされている。そこでエクサウィザーズは、人が画像を見た時にどこに注目するのかを生成AIモデルに学習させることに取り組んだ。

結果として、人が直感的に認識可能な、画像内の危険性や違和感といった状況を高精度で解釈することが可能になった。exaBase Visual QAを実装したシステムとチャットボットのように対話することで、状況を説明する文章を生成する。

具体的には以下のような画像に対して「潜在的な危険性はありますか」と入力することで、「作業員がバランスを崩したり足場が崩れたりすると落下につながる。作業員は金属棒を接続するために電動工具を使用しており、工具が滑ると負傷する可能性がある。適切な安全予防措置を講じるべきである」といった文章を生成する。

システムの実装時には長文を出力するが、それらをChatGPTを用いて必要な部分にフォーカスした要約が可能。

なお同社での評価実験において、他の商用利用可能なモデルより最大で1割弱高い解釈の精度を持っていることを確認している。同様の精度のモデルと比べてモデルのサイズも小さく、推論の実行や生成の速度も高速。

exaBase Visual QAはオープンソースの生成AIモデルをベースに開発しており、同社が追加学習を実施しているためすぐに利用が可能。さらに個別の分野のデータを学習し、設定を調節する「ファインチューニング」を同社側で行うことで、特定の分野での精度を向上させることも可能だという。

関連URL

エクサウィザーズ

関連記事

注目記事

  1. 2024-7-25

    ロボットバンク、【追従機能付き】自律走行搬送ロボットを発表

    ロボットバンクは24日、追従機能付きの自律走行搬送ロボットの販売開始を発表致した。 本製品は、…
  2. 2024-7-25

    DNP、全国の自治体が共同で利用可能な「メタバース役所」の提供を開始

    大日本印刷(DNP)は24日、生活者が自治体の各種サービスをインターネット上の仮想空間・メタバースで…
  3. 2024-7-19

    人機一体、直感的な操作システム搭載人型重機が JR西日本の鉄道設備メンテナンスに導入

    人機一体は17日、同社のロボット工学技術が搭載された初めての製品となる「多機能鉄道重機」が、7 月か…
  4. 2024-7-17

    順天堂大学、AIを用いた脳容積解析ソフトウェアを開発

    順天堂は16日、順天堂大学保健医療学部診療放射線学科の後藤政実 先任准教授、京極伸介 教授、代田浩之…
  5. 2024-7-12

    生成AIによるオススメフォントのアドバイスサービス「DynaGPT」リリース記念キャンペーン

    主に文字フォント開発、およびその関連製品の開発・販売・保守を行う、ダイナコムウェアは、生成AIによる…

カテゴリー

最近の投稿

ページ上部へ戻る