IoT、BigDate、AIといったデジタル技術は急速に発達しており、私たちの暮らしをより快適なものとしています。
近年はAIを用いたデータ解析やデジタル活用による効率化といった、デジタルトランスフォーメーション(DX)と呼ばれる市場の変革が起きているのです。
化学業界においても、スマートファクトリやマテリアルズ・インフォマティクス(MI)、プロセス・インフォマティクス(PI)など、様々な分野にAIの活用が検討されています。
研究者がAIに置き換わる未来は来るのか、今回はそんなMIについて、住友化学の事例も踏まえて考察します。
1.MIってなに?
近年のデジタル技術の発達の中でも、特に注目を集めているのがAIではないでしょうか。
すでにAIは囲碁やチェスにおいて人類を凌駕しており、世界中に驚きを与えました。
このAI発達を支えたのが機械学習なのですが、機械学習を材料開発に活用しようという試みがMI(マテリアルズ・インフォマティクス)なのです。
機械学習では膨大な量のデータをAIに学習させることで、データの中に自然なパターンを見つけ出します。この得られたパターンをもとに、未学習のデータについても予測することができるのです。
デジタル技術の発達により膨大な量の情報を操れるスーパーコンピューターなども台頭したことで、素材分野ではこうしたデジタル技術の応用が検討されています。
素材分野は材料のデータベースが比較的整備しやすいこと(インプット)や、所望特性(アウトプット)を数値化できることなどがAIと相性が良いようです。
近年はデータ科学と材料知識の両方を持つ人材の育成が必要とされています。
2.MIによる材料開発
材料開発では、目的とする性能を有する化合物の設計が求められます。
化合物の性能は、その分子構造や結晶構造、材料組成などで変わるため、目的の化合物の構造を予測しながら開発を進めます。
従来の材料開発では、研究者の専門的知見に基づき目的の化合物の構造を予測し、設計が進められます。
一方でMIでは、材料データを機械学習したAIが設計を行います。
MIの適用範囲は広く、超高速のバーチャルスクリーニング、合成経路逆探索、ベイズ最適化による高効率な実験計画などが挙げられます。
メリットとして、膨大な量のデータを高速で取り扱えるため、材料開発の効率化や人知では辿り着けない新規な発見などが期待されています。
AIは膨大な数のデータを先入観がない状態で学習するため、人では思いつかない予測が得られる可能性もあります。
3.具体的なプロセス
具体的にMIによる設計プロセスを見ていきましょう。
まずはじめに、材料のデータを用意します。化学構造と物性値の相関から、科学論文・特許・社内文書といった文献情報まで、様々な情報をコンピューターが取り扱える形で準備する必要があります。
そうして得られたデータを用い、より精度の高い機械学習モデルを構築します。
こうして得られた予測モデルに対して、目的とした化合物の情報を入力することで、その構造が予測されます。
しかし実際のMIによる材料開発では、AIの予測が百発百中するようなことはなく、機械学習だけで目的化合物の構造を予測することは困難な場合が多いようです。
精度の高い予測が得られるほど、データが多くないことが一つの原因です。
また材料開発においては、今までのデータにない新規な性能を有する化合物が求められることが多く、AIはこうした既存のデータ外の予測を苦手としています。
したがって、人がAIにより予測された化合物を合成・評価し、得られたデータを元の材料データに追加するサイクルを回すことで、より精度が高まるのです。
MIで研究員が不要になることはありませんが、データ科学を扱える人材が重宝されるでしょう。
4.住友化学の取り組み
住友化学は次世代事業の創出加速を掲げており、そのアプローチの一つとしてデジタル化による生産性の向上をあげています。
MIの活用推進も行っており、二つの事例が紹介されていました。
ベイズ最適化を用いたデータ科学的実験計画
ある耐熱ポリマーを合成する際に、材料となるモノマー候補が13種類あったそうです。その組み合わせはなんと100万通り以上あったため、いかに少ない実験条件で目的の組成を見いだせるかが問われていました。
こういった材料開発にMIの導入が期待されますが、当時のデータ数は50程度しかなく、高精度の予測モデルを構築することは現実的ではありませんでした。
そこで用いられたのがベイズ最適化という機械学習手法です。
ベイズ最適化より得られた予測モデルを用いて、有望な実験ポイントの提案、実際に実験して得られたデータを予測モデルにフィードバックするサイクルを回すアプローチを取ったのです。
ベイズ最適化では、獲得関数を設定することで探索(ざっくりとあたりをつける)と、活用(精度の高い領域で予測)のどちらに重点を置くかを変更できるようです。
住友化学では開発期間に応じてこれを使い分けることで、なんと4サイクル目の実験で目的とする化合物の合成を達成したようです。
VHTSによる分子設計
VHST(バーチャルハイスループットスクリーニング)は、低分子化合物を中心に活用され始めています。
部分構造の組み合わせ等により作成した大規模な分子構造のバーチャルライブラリから、シミュレーション・機械学習を用いたスクリーニングにより目的とする化合物を絞り込む方法のようです。
このVHSTは昔から実施されてきましたが、機械学習が数億程度の分子構造を高速でスクリーニングすることを可能としています。
機械学習により構造予測をするには、分子記述子と呼ばれる分子の特徴を表現する数値データが必要となりますが、近年はオープンソースパッケージも展開されており、VHSTのハードルは下がりつつあります。
一方で高精度化には新規の記述子が必要となり、これが企業間の競争の源泉となっているようです。
住友化学は古くから計算科学に取り組んでおり、その知見が生かされているようです。