AI開発に必要なデータ収集・生成からアノテーション、モデル開発、MLOps構築までの全工程をサポートしているFastLabelは8月31日、AI開発用途に被写体から利用承諾を得ている権利クリアな日本人顔画像のデータセット2万2800枚の販売を開始したことを発表した。
同社は、2020年1月の創業以来、教師データ作成代行やアノテーションツールの提供を主力事業として展開。現在ではAI開発プロセス全体を包括的に支援するサービス(業務代行及びコンサルティング)およびシステム(各種ツール)を提供している。大手企業を中心とした100社以上の支援をする中で、AI開発プロセスにおける「データ収集」に関する課題が多く寄せられてきた。
米OpenAI社の「GPT-4」他、大規模言語モデルが公開されたことを受け、コンテンツを生成することが可能な生成AI(Generative AI)技術が急速に発展している。併せて、英Sutability AI社の「Stable Diffusion」を代表として画像に関する生成AIも登場し、活用の可能性が期待されると同時に、AI倫理の観点から被写体からAI開発への利用承諾を得ていることがAIに使用するデータとしての利用条件となるケースが増えている。
これらを背景として、既存の人物顔画像データセットの権利の透明性を見直す動きが大手企業を中心として進んでいるが、AI開発に必要となる数千から数万といったデータを権利クリアに収集することは容易ではない。そこで、AI倫理を遵守しながら、AI開発の高速化も実現できる短納期でのデータ提供を可能とするため、今回の権利クリアな日本人画像のデータセットの販売にったという。
同社が販売するデータセットの特徴は以下の2点。
・権利クリアであること
同社の販売するデータセットは、データ取得およびAI開発への利用に関する同意書を「すべての被写体」から取得している。
・データの利用用途に合わせて、データを加工した上で納品が可能であること
これまで同社が支援してきた実績とAI開発への深い知見を活かし、利用用途に合わせたトリミング処理や印象分類、アノテーション等のオプションも提案可能。
購入または見積り・問合せ
info@fastlabel.ai