中山氏は「機械学習のほとんどの作業は、変数をどう減らすかに尽きる」と語った。先ほどの例では42個の変数があり、それの15個のサンプルに対してフィッティングすることは無理がある。そこで実際には42個の変数に拘束条件をかけて3つの変数にまとめている。変数を減らす方法には今回使ったPLS（部分的最小二乗法）や主成分分析（PCA）などがある。

　「（予測式を導出することによって）42変数のうちどれが効いているのかも簡単に知ることができる。この変数があると物性値が大きく変わる、この構造が変わっても大して物性値は変わらないといった傾向を読み取ることができる。そのため材料設計のフィードバックにも使えるだろう」（中山氏）。

ベイズ最適化では得られた知識を応用できる

　フィッティングができない場合は、ベイズ最適化法が有効になる。フィッティングがよくなければ抜き取りサンプル数を増やすことになる。従来の統計の考え方では必ずランダムにサンプリングしなければならないが、ベイズ最適化ではサンプリングにバイアスを掛けられる。

　中山氏は1600サンプルと規模の大きなLiF系材料を例に説明した。ベイズ最適化を適用することにより、この1600サンプルのうち160サンプルを探した段階で最も良いデータに行きついた。一方ランダムサーチでは探すほど良くはなるものの、いつまでたっても良いデータにはたどり着かない。ベイズ最適化では全サンプルのうち10分の1だけ計算すれば出ており、かなり短いステップで済む。

　「こうしたベイズ最適化による結果は、通常データと違い、伝承できるのが良い点になる」（中山氏）という。Li系材料の結果で得られた知識をNa系材料に応用してイオン伝導度の高いサンプルを探索することにより、より高速に評価できた例を示した。

データベースにない材料を調べていく

　紹介した例のように、数千から数万の単位の材料であっても、ハイスループット計算、機械学習、ベイズ最適化を適用することで、現実的な時間スケールで最適化することは可能になる。システム作りは相当大変だが、対応は可能な範囲ということだ。

　「今後の課題は、データベースにない材料の探索になる」（中山氏）という。先ほどの1600件のデータを化学組成の類似性や結晶構造の類似性からプロットし、材料の地図を作ると、一部分については非常にデータが充実しているが、別の部分では穴開きということも分かってくる。「そもそも合成できるのかは検証が必要だが、調べていない空間がかなりあることが分かる。これらを中心にデータベースにない材料を調べていきたいと考えている」（中山氏）。

関連キーワード

名古屋工業大学 | 機械学習 | リチウムイオン電池

シミュレーションは分断から融合へ、データをリンクさせてコラボせよ――Science in the Age of Experience 2017
ダッソー・システムズは初めてシミュレーション関連ブランド全てを統合したユーザーイベントを米国で開催した。狙いは異なる分野のアプリケーションを組み合わせる効果を知ってもらうことだという。イベント初日の講演と記者会見の様子を中心にお届けする。
製薬大手がバイオ医薬品の製造・品質データ解析システムを導入
新日鉄住金ソリューションズは、中外製薬工業がバイオ医薬品の製造・品質データ解析システム「製造品質モニタリング・レポートシステム」を導入したことを発表した。
マルチフィジックスとマルチスケールの先にあるもの
ダッソー・システムズのSIMULIAブランドの責任者らが、米で3ブランドを包括したイベントを行った背景や、バーチャル都市およびバーチャル心臓プロジェクトの詳細、大規模解析の開発状況やこれからの市場展開について語った。
3Dプリンティング技術を育てるために重要なこと
アメリカの航空宇宙・防衛企業のオービタルATKは、3Dプリンティング技術の健全な発展のためには、単に装置を購入するだけではなく、3Dプリンタメーカーとの共同開発や、教育・研究機関、ベンチャーの支援など積極的に周囲を巻き込んで行動することが重要だという。
“体験経済”時代のプラットフォームを目指すダッソー、カバー領域をさらに拡大
ダッソー・システムズは年次ユーザーイベント「3DEXPERIENCE FORUM JAPAN 2014」を開催。それに先立ちフランス本社の社長兼CEOのベルナール・シャーレス氏が記者会見を行い、製造業を取り巻く環境の変化と同社の取り組みについて説明した。