近年、材料科学の分野で急速に注目を集めているのがマテリアルインフォマティクス(Material Informatics:MI)です。
研究職を目指している人はもちろん、既に研究職として働いている人の中にも「マテリアルインフォマティクスって何?」と思う人も多いと思います。
この記事では、マテリアルインフォマティクス(Material Informatics:MI)ついて初心者でもわかるように簡単に解説します。
マテリアルインフォマティクスとは?
マテリアルインフォマティクス(MI)を一言で説明すると次のようになります。
「機械学習」などの情報科学を活用して、新材料の探索を加速する取り組み
マテリアルインフォマティクス(MI)は「材料データ・統計解析・機械学習の力を使って従来より効率的に新規材料を開発しよう!」という取り組みです。
従来の材料開発は、下記のようなものでした。
- 実験条件を1つずつ変えて評価
- 試行錯誤が多く、時間とコストがかかる
- 研究者の経験に依存しやすい
一方、マテリアルインフォマティクスを活用した材料開発は下記のような特徴があります。
- 「機械学習」を活用して目的特性の材料を得る方法を予測
- 研究者の経験に依存しにくい
- 予測をもとに開発するため短時間で開発完了
マテリアルインフォマティクスを活用することで、短時間・省エネで新規材料開発ができるようになります。
その結果、従来型の材料開発を行っている人に比べ、マテリアルインフォマティクスを活用できる人は、短時間でより多くの成果を上げることができるようになります。
マテリアルインフォマティクスはどんなことをやるのか?
マテリアルインフォマティクスでは、「機械学習」などを使って、従来より短時間で新しい材料を開発していきます。
「機械学習とは?」と思う方もいると思います。「機械学習」とは、簡単に説明すると以下のようになります。
既存データを解析し、その解析結果に基づいて未知の材料の物性を予測する技術
既存データから、新しい材料の特性を予測するため、実験することなく未知の材料のデータを予測できます。この技術を用いることで、望みの特性を示す新規材料を簡単に予想することができます。後は、この予測に基づいて、材料を作製すれば良いだけです。
機械学習の概要については、なんとなく理解いただけたと思います。「じゃあ、機械学習って、具体的にはどんなことをやるの?」と考えると思います。簡単に「マテリアルインフォマティクスの機械学習」の基本的な流れを説明します。
- Pythonなどを用いたデータ解析
- 開発したい材料を作る方法を予測
- 実際に材料を作製
基本的な流れは上記になります。以降で、それぞれのステップを説明します。
Pythonなどを用いたデータ解析
まずは、既存のデータ・取得済みのデータを、Python。Rなどで解析します。この解析には、分類・回帰・クラスタリングなど数多くの手法があります。材料系や条件に見合った解析手法を選択して行う必要があります。
例えば、回帰分析ではデータ間の関係を表す数式(モデル)を得ることができます。
開発したい材料を作る方法を予測
上記で得られた解析結果をもとに「開発したい材料」「望みの物性を持つ材料」を得る方法を予測します。
実際に材料を作製
予測結果に基づいて、実際に材料を作製していきます。
このような流れで研究開発を行うことで、従来のように条件を一つづつ変えて検討する必要がなくなるので、短時間で材料を開発することができます。
データ分析の具体例:回帰分析
ここからはデータ解析について簡単な例を用いて、もう少し詳しく解説します。「機械学習」において、基礎的かつ重要なのが「回帰分析」です。回帰分析とは下記のようなものです。
データの関係性を表す数式から、知りたい値を予測する統計学の分析手法
これだけ聞いても何のことかわからないと思います。とても簡単な例を用いて、回帰分析の具体的な流れを解説します。
回帰分析の流れ
例えば、ある高分子材料の分子量と強度に下記のような関係があったとします。

強度が75の材料を開発したいとすると、どのくらいの分子量にすれば良いでしょうか?
上記のプロット図から、分子量と強度には比例関係があることが一目でわかります。数式で表すとy = ax (y:強度、x:分子量)になります。
上記のプロット図と数式から、分子量を7500程度にすれば、望みの強度の高分子材料が合成できそうですよね?「回帰分析」とは、このような方法で未知の物性を予測する手法です。
マテリアルインフォマティクスの機械学習では、このような計算をPythonやRを用いて実施していきます。
なぜMIでは機械学習が重要なのか?
上記の例は非常に簡単な例で、一目で数式を算出できます。わざわざ機械学習を利用する必要もないです。しかし、実際の材料開発では次のような課題があります。
- 入力因子が多い(温度、時間、組成、分子構造…)
- 関係が非線形(直線では表せない)
- 因子同士が複雑に影響し合う
上記のような問題があるため、実際の材料開発では、人間の頭で関係式(数式)を作成することは不可能です。このような状況で活躍するのが「機械学習」です。「機械学習」を用いることで、上記のような複雑な場面でも関係式を短時間で算出してくれます。
つまり、機械学習を用いることで、材料開発のような複雑な場面でも、簡単に関係式を作成できるようになり、結果として、従来より短時間で材料開発ができるようになります。
また、機械学習には、回帰分析以外にも状況に合わせた下記のような数多くの分析手法が存在します。
- 決定木
- ランダムフォレスト
- サポートベクターマシン
- ニューラルネットワーク
これらを用いることで、どんな状況でも適切な関係式や分類を行うことができ、短時間で材料開発を行うことができるようになります。
まとめ
この記事では、マテリアルインフォマティクス(Material Informatics:MI)とはどんなものかを解説しました。マテリアルインフォマティクスとは下記です。
「機械学習」などの情報科学を活用して、新材料の探索を加速する取り組み
これからの時代、マテリアルインフォマティクスを活用した材料開発が主流になっていきます。
従来型の研究開発方法に固執している人は近い将来淘汰されていきます。今のうちからマテリアルインフォマティクスについて理解を深め、実践できるようになっておきましょう。
まずは、「機械学習」を自分で実践できるようにしておきましょう。「機械学習」というと難しそうに聞こえますが、パソコンさえあれば誰でも実施できるものです。「難しそう・・・」と考えずに、下記記事を参考に「機械学習」を学習してみましょう。




コメント