Home
->  11月開催 電気系セミナー  12月開催 電気系セミナー 

機械学習・時系列データ分析のためのデータ前処理のポイント


11月開催 電気系セミナー  更新日:2019年10月 1日
 セミナー番号【912413】12/12 講師1名
★欠損データの補完、外れ値の検出、ノイズ除去をどのように行えばよいのか?
適切に扱うための前処理は何をすればよいのか?

機械学習・時系列データ分析のためのデータ前処理のポイント



■ 講師
茨城大学 大学院理工学研究科 情報科学領域 教授 博士(工学) 新納 浩幸 氏

■ 開催要領
日 時 : 2019年12月12日(木) 10:00~17:00
会 場 : [東京・五反田]技術情報協会 セミナールーム
聴講料 :
1名につき50,000円(消費税抜き・昼食・資料付き)
〔1社2名以上同時申込の場合1名につき45,000円(税抜)〕

※定員になり次第、お申込みは締切となります。


プログラム

【講演概要】

 前処理とは何らかの解析処理を行う前に行う処理のことです。前処理の効果は大きく、以降に続く解析処理の成否を決めているのが、実は、前処理とも言われています。
 本セミナーでは、解析処理を時系列データ分析、自然言語に対する機械学習及び画像に対する機械学習の3つに限定します。その上で、各処理に対して、通常、前処理として位置づけられている処理を解説します。
 また利用するプログラミング言語は Python です。
 個々の前処理を行うために有用なパッケージや関数などを紹介します。

【プログラム】

1.時系列データ分析の前処理
 1-1 欠損値とその補完
 1-2 変数変換
 1-3 スライド窓
 1-4 移動平均とスムージング
 1-5 外れ値検出

2.自然言語の機械学習処理のための前処理
 2-1 構造化文書から plain テキストへ
 2-2 クリーニング処理、単語の正規化、Stemming
 2-3 単語分割
 2-4 単語の埋め込み表現
 2-5 BERT の利用
 2-6 Bag of words と TF-IDF
 2-7 文や文書の埋め込み表現

3.画像の機械学習処理のための前処理
 3-1 フォーマット変換
 3-2 ノイズ除去
 3-3 フィルター処理
 3-4 画像サイズの変更
 3-5 Data Augmentation


【質疑応答】