三井情報は21日、創薬において「薬物が作用する対象となるタンパク質(標的タンパク質)」が結合する位置を予測するソフトウェア「DeepSeeker(ディープシーカー)」と、新薬候補化合物と標的タンパク質との結合親和性を予測するソフトウェア「KASSAY(カッセイ)」を開発し、提供を開始したと発表した。
両ソフトウェアはタンパク質の構造データや過去の実験データを深層学習させたAIを活用し、有望な新薬候補化合物の絞り込み精度と速度を高度化して創薬プロセスの迅速化を支援するもの。どちらもコンテナ仮想化環境またはMKI-DryLab for Microsoft Azure上で実行可能で、それぞれ1ライセンス99万円/年(税込)で提供する。
三井情報は2017年から「創薬AI(人工知能)」の開発を進めている産学連携プロジェクト「ライフインテリジェンスコンソーシアム(LINC)」内の「WG4.分子シミュレーション」に参画している。WG4で創薬におけるタンパク質の原子座標の深層学習に対するニーズから「AIによるドッキング計算高度化」に取り組み、リガンド結合サイト予測の論文を実装した「DeepSeeker」とリガンド活性値予測の論文を実装した「KASSAY」を開発した。
低分子化合物をモダリティとする創薬プロセスでは標的タンパク質に効く新薬候補化合物の探索があり、数千万種類以上ある新薬候補化合物から医薬品への展開が見込めそうな化合物(リード化合物)を絞り込む作業がある。そこでリード化合物が標的タンパク質のどこに結合し、そのリード化合物と標的タンパク質の結合親和性と活性化能力を評価する。
両ソフトウェアはタンパク質の構造情報の公的データベース「Protein Data Bank(PDB)」に蓄積されたタンパク質の構造データや過去の実験データを学習させ、画像認識技術を利用したAIを活用することにより、有望なリード化合物の絞り込みの精度と速度を向上させ、創薬プロセスの迅速化が期待できるという。