Home
->  8月開催 化学系セミナー 

マテリアルズインフォマティクスのためのデータ解析"超入門"

8月開催 化学系セミナー  更新日:2019年7月 2日
 セミナー番号【908209】8/26 講師1名
★ 『データの可視化』『モデルの予測性能向上』『モデルの逆解析』を特に重点的に解説!
★ ケモインフォマティクス・プロセスインフォマティクスにも役立つ
★ 分子設計・材料設計・プロセス設計・プロセス管理に関する最新の研究事例を紹介

マテリアルズインフォマティクスのためのデータ解析"超入門"


■ 講師
明治大学 理工学部 応用化学科 専任講師 博士(工学) 金子 弘昌 氏

■ 開催要領
日 時 :
2019年8月26日(月) 10:00~17:00

会 場 : [東京・五反田] 技術情報協会 セミナールーム
聴講料 :
1名につき 50,000円(消費税抜、昼食・資料付)
〔1社2名以上同時申込の場合のみ1名につき45,000円〕

    ※定員になり次第、お申込みは締切となります。


プログラム

【講座の趣旨】
近年、化学・産業においてデータが蓄積されつつあり、そのデータを解析する動きが活発になっている。しかし、実験結果、高機能性材料などの開発データ、化学・産業プラントにおいて様々な製品を製造する際のデータなど、蓄積されたデータを十分に活用しきれていない状況も存在する。本セミナーでは、そのような化学・産業データの使い方・解析の仕方を基礎から解説する。情報科学・データサイエンスに基づき、データから種々の材料の機能を予測するモデルを構築したり、構築したモデルを活用することで新たな構造・実験条件・材料・装置を設計したりする方法である。さらに、ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクス分野を中心にして豊富な応用事例も紹介する。

【習得できる知識】
・ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクス・データ解析・機械学習・分子設計・材料設計・プロセス設計・プロセス管理の基礎知識
・ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクス分野の最新の研究事例
・データ解析の一般的なすすめ方・活用の仕方
・データ解析の応用事例
・最新のデータ解析手法・モデリング手法
・モデルの予測精度向上の方法
・モデルの逆解析の方法


1.ケモインフォマティクス・マテリアルズインフォマティクス・プロセスインフォマティクスの基礎知識
 1.1 機械学習・人工知能
 1.2 定量的構造物性相関・定量的構造活性相関
 1.3 化学構造生成
 1.4 分子設計
 1.5 材料設計
 1.6 プロセス設計
 1.7 プロセス管理
 1.8 ケモインフォマティクス
 1.9 マテリアルズインフォマティクス
  1.10 プロセスインフォマティクス

2.化学・産業データ解析の進め方・活用方法
 2.1 データの形式、記述子
 2.2 一般的なデータの前処理
 2.3 データの可視化・低次元化
  (1) ヒストグラム・散布図・箱ひげ図・相関行列
  (2) 主成分分析 (Principal Component Analysis, PCA)
  (3) 可視化の性能を検討するための指標
  (4) [発展] Generative Topographic Mapping (GTM)
  (5) [発展] 多様体学習
 2.4 クラスタリング
  (1) 階層的クラスタリング
  (2) [発展] 混合ガウスモデル (Gaussian Mixture Model, GMM)
 2.5 クラス分類
  (1) 線形判別分析 (Linear Discriminant Analysis, LDA)
  (2) 決定木 (Decision Tree, TD)
  (3) ランダムフォレスト (Random Forest, RF)
  (4) [発展] サポートベクターマシン (Support Vector Machine, SVM)
 2.6 回帰分析
  (1) 最小二乗法による重回帰分析(Multiple Linear Regression (MLR) or Ordinary Least Squares (OLS))
  (2) 部分的最小二乗法 (Partial Least Squares, PLS)
  (3) 決定木 (Decision Tree, DT)
  (4) ランダムフォレスト (Random Forest, RF)
  (5) [発展] サポートベクター回帰 (Support Vector Regression, SVR)
 2.7 モデルの予測性能の向上
  (1) 予測性能の評価
  (2) アンサンブル学習
  (3) [発展] 半教師あり学習 (半教師付き学習)
 2.8 モデルの適用範囲
  (1) データ範囲
  (2) データ中心からの距離
  (3) データ密度
  (4) アンサンブル学習
 2.9 モデルの逆解析
  (1) モデルの適用範囲を考慮した逆解析
  (2) グリッドサーチ
  (3) サンプリング
  (4) [発展] ベイズの定理
 2.10 実行するためのプログラム紹介

3.分子設計・材料設計・プロセス設計・プロセス管理に関する最新の研究事例
 3.1 化学空間の可視化に基づく分子設計
 3.2 定量的構造物性(活性)相関モデルの逆解析に基づく分子設計
 3.3 定量的構造物性(活性)相関モデルの適用範囲を考慮した分子設計
 3.4 適応的実験計画法による材料設計
 3.5 シミュレーションとインフォマティクス技術を活用したプロセス設計

4.まとめ・質疑応答