ピクスタが運営する、写真・イラスト・動画・音楽素材のマーケットプレイス「PIXTA(ピクスタ)」は14日、人物認証・顔認証等のAI開発における精度向上に最適な機械学習用素材データセット「モデル500人分画像」を発売すると発表した。
同一モデルが含まれていない500人分の日本人画像に、それぞれ性別・年代の属性情報を付与したデータセットを提供する。
PIXTAは、これまでもマスクを着用した日本人画像のデータセットを用意するなど、豊富な日本人や日本固有のシーンの画像を豊富に取り揃える日本最大級のストックフォトサイトの強みを活かし、人物・顔の認証精度向上に貢献する機械学習用画像データセットを提供してきた。
顔認証分野では、自動車のドライバー認証システムをはじめ、防犯カメラ、スマートホーム、スマートロック、生体認証によるセキュリティ強化など、様々な産業に取り入れられ市場は拡大傾向にある。
しかし、顔認証の精度を向上させるには、肖像権を含めプライバシー侵害に値しない、個人識別可能な写真が多数必要になる。また無料で入手可能なオープンデータは、日本人以外の人種の画像が多いという難点があり、より精度の高い識別・認証ができるよう学習させるには、教師データとなる日本人画像の確保がネックになっていた。
そこで、PIXTAが保有する権利がクリアになった多数の個人識別可能な日本人画像素材に対する機械学習用途の需要が年々増加。1月〜5月の前年同期比で、PIXTAの機械学習案件の売上高は約2倍に増加。さらに、ユニークモデルの需要は、昨年1年間と比較して今年5月時点ですでに2.5倍に急増しており、クライアント企業からも「認証開発におけるさらなる精度向上」を望む声が聞こえたことから、同一モデルを含まない500人の日本人画像素材を集めたデータセットを提供することにした。
【データセット内容】
同一モデルが含まれていない500人の日本人画像(性別・年代の属性情報付与済)500点
【価格】
アノテーションなし 9万9000円(税込)
アノテーションあり 16万5000円(税込)
【購入方法/お問い合わせ】
PIXTA事業本部 機械学習用画像・映像データ提供サービス担当
machine-learning@pixta.co.jp