深層学習による化合物潜在空間の統合解析

榊原 康文

研究代表者
所属:慶應義塾大学理工学部 教授

研究概要

巨大な分子構造の天然化合物を含む多様な化合物ライブラリーから、生成型AIを適用して化合物潜在空間を構築する。天然化合物を扱うための深層学習自己符号化器(NP-VAE)を既に開発し、分子構造を光学異性体も含めて射影した化合物潜在空間を獲得することに成功している。化合物群の構造情報はA01班からの供与を受け、C01班による有機合成と生物機能解析と合わせて統合解析を行なう。高スケール化高速化したNP-VAE2.0を開発し、天然物の生物活性データを深層学習することによって、第3のリソースとしての化合物潜在空間を構築する。化合物潜在空間のベイズ最適化探索により新規の化合物構造を設計する。

研究成果

  1. Uehara, M.; Inoue, T.; Kominato, M.; Hase, S.; Sasaki, E.;, Toyoda, A.; Sakakibara, Y. mSystems. 2022, 25, e0052022.
  2. Kishi, K.; Satoh, T.; Raymond, R.; Yamamoto, N.; Sakakibara, Y., IEEE Journal on Emerging and Selected Topics in Circuits and Systems, 2022, 12, 602-613.
  3. Akiyama, M.; Sakakibara, Y. NAR Genom. Bioinform. 2022, 4, lqac012.
  4. Yoshimura, Y.; Hamada, A.; Augey, Y.; Akiyama, M.; Sakakibara, Y. Bioinformatics Advances. 2021, 1(1), vbab039.
  5. Watanabe, N.; Ohnuki, Y.; Sakakibara, Y. J Cheminform. 2021, 13(1), 36.
  6. Hirohara M, Saito Y, Koda Y, Sato K, Sakakibara Y. “Convolutional neural network based on SMILES representation of compounds for detecting chemical motif”, BMC Bioinformatics. 2018, 19(Suppl 19), 526.

研究分担者

  • 長田 裕之 理化学研究所 環境資源科学研究センター/静岡県立大学 薬学部
  • 齋藤 裕 産業技術総合研究所