AI/機械学習を活用し企業ビジネスを支援するアクティブコアは8日、AIモデルの作成・運用・管理を自動化する独自開発のAIプラットフォーム「ピタゴラス AI クラウド」に、データをAIで利用可能な形に整える「データ前処理」機能を新たに追加したと発表した。
精度の高いAIモデル作成には、「データの前処理」が欠かせない。ただ、この前処理作業には多くの知識や労力が必要であり、作業自体にも大変時間がかかっていた。そこで今回、担当者がAI・データ活用に欠かせない「データ前処理」からAIモデル作成までを画面上で一貫して実施できるよう、新機能としてリリースすしたという。
データの前処理とは、何らかの機械学習アルゴリズムに入れる前に、得られたデータに手を加えることを指す。用意した“生”のデータを、アルゴリズムが学習できる、あるいは学習しやすいように“きれいな”データに整える。
AIを実装するには、データがAI/機械学習で使える状態になっていなくてはならない。ただAI利用のために取り込む生のデータは、きれいで完璧な状態のものは少なく、エラーやノイズ、欠損値などが含まれていることがほとんどだという。継続的にデータをとりこむ際は特に、データが加工された状態でないと難しくなる。前処理の工程を実施しないと、AIモデルが構築できない、AIモデルの精度が低くて使えないといった状況につながる。
前処理には、「データクレンジング」、「データ結合」、「データ変換」、「特徴量エンジニアリング」などがある。この前処理を行うには、ある程度のデータ知識や実装するためのスキル、また分析対象への理解などが求められる。例えスキルを持ったエンジニアが処理をするにしても、地道な作業かつ作業量が膨大であり、毎回この作業を行うには時間とコストがかかっていた。
データの前処理はAIモデルの成功を左右するとも言われる。知見のない業務担当者が何万件、何十万件とあるデータを処理するのはハードルの高いもの。そこで今回、画面上でドラッグ&ドロップなどの簡単操作で、手のかかる前処理作業から、モデル作成まで一貫してプラットフォーム上で行えるように設計した。専門家でなくても比較的容易にデータをきれいに整え、成果につなげることが可能となり、AIモデルにかかる工数・時間・コストが削減。効率よく精度の高いモデル生成が可能となったという。