新エネルギー・産業技術総合開発機構(NEDO)と沖電気工業(OKI)は21日、「高効率・高速処理を可能とするAIチップ・次世代コンピューティングの技術開発」において、AIの学習時に量子化値を最適に割り当てる低ビット量子化技術「LCQ(Learnable Companding Quantization)」を開発したと発表した。
本技術は、ディープニューラルネットワークの高精度モデルで、ビット数を32ビットから2ビットへと16分の1に圧縮しても画像認識精度の劣化を世界トップクラスの1.7%に抑えることに成功し、エッジ領域での演算負荷低減を実現する。
今後、本技術を活用することで、エッジ領域での高精細な画像認識、さらには工場のインフラ管理や機器の異常検知など、演算リソースの限られたデバイスでのAI実装を目指すという。
本成果はコンピュータービジョン業界トップカンファレンスの国際学会である「CVPR(IEEE/CVF Computer Vision and Pattern Recognition、期間:2021年6月19日~25日、オンライン開催)」に採択され、OKIが発表する予定。
NEDOとOKIは音声符号化分野でよく扱われる非線形量子化技術Compandingを応用したLCQにより、DNNの学習での量子化値を柔軟に割り当てることに成功。
LCQではDNNの誤差勾配に基づいて圧縮関数と伸張関数を学習し、これを反映した量子化処理を行うことで、非線形な量子化関数が構築され、最適な量子化値を割り当てることが可能となる。低ビット量子化時の課題となっていた認識精度の劣化を抑制できるだけでなく、2ビットなど超低ビット量子化で高い効果を発揮することが確認でき、演算リソースが限られるエッジデバイスへのAI搭載が可能になるという。
OKIは本成果と本NEDO事業でOKIが開発したDNN演算数の削減が可能なAI軽量化技術PCASを組み合わせ、演算負荷低減と演算数削減の両方の効果を得る技術の開発に取り組み、エッジ領域での高精細な画像認識、さらには工場のインフラ管理や機器の異常検知など、演算リソースの限られたデバイスでのAI実装を目指すとしている。