2024年5月28~31日の4日間、静岡県浜松市で開催される2024年度 人工知能学会全国大会(第38回)にてData Science & Informatics 柴原研究員(Principal Scientist)が口頭発表を行います。本学会への参加を予定されている方は、是非発表をご覧ください。
【学会概要】
2024年度人工知能学会全国大会(第38回)
【口頭発表】
日時:2024年5月28日(火)15:00 〜 16:40
場所: アクトシティ浜松 F会場 (イベントホール仮設4) + オンライン
タイトル:「化学合成における構造生成のための大規模言語モデルの追加事前学習」
【発表概要】
創薬の分野では、薬の発見を目指して、Deep Learningを用いた化合物の構造生成モデルに関する研究が進んでいます。構造生成モデルには、化合物の構造式を文字列として扱うもの、原子間の結合をグラフ構造として扱うもの、さらには原子の位置や結合を3次元的な構造として扱うものなど、多様なアプローチがあります。これらのモデルはいずれも、特定の条件を元に化合物の構造を生成することができます。
近年のLarge Language Model(LLM)の成功により、文字列ベースの手法では、自然言語を使った柔軟な指示に基づいて、化合物の生成や編集が可能になることが期待されています。本研究では、LLMに追加の事前学習を行うことで、LLMを構造生成モデルとして機能させ、創薬への応用が期待できることを示しました。今回、LLaMA-2-7Bというベースモデルに、低分子化合物を追加事前学習させることで、構造生成モデルを構築しました。本研究の提案モデルは、言語モデルとしての機能を保持しつつ、構造生成に特化したグラフベースのモデルであるJT-VAEに匹敵する性能を示すことができました。この研究の成果は、創薬プロセスにおける化合物設計の効率化や多様化に寄与する可能性があります。今後、こうした技術がさらなる発展を遂げることで、より効果的な医薬品の発見や開発が期待されます。
柴原 琢磨 Data Science & Informatics(Principal Scientist, Machine Learning)
博士(情報科学)、博士(医学)。2008~2023年 (株) 日立製作所 研究開発グループ 主任研究員。2015~18年 東京医科歯科大学 医歯学総合研究科 データサイエンス特論 非常勤講師。2021年~2023年 慶應義塾大学 医学部 呼吸器内科 共同研究員 (コロナ制圧タスクフォース) 。2023年9月より現職。