Home
->  3月開催 その他セミナー  4月開催 その他セミナー 

深層強化学習の具体的な使い方とポイント

3月開催 その他セミナー  更新日:2019年2月 6日
 セミナー番号【904506】4/4 講師1名
★深層強化学習のメリット・デメリットは?自分の仕事のどこに活用できるか!
実際に活用するためのコツやフレームワークを分かやすく解説します!!

深層強化学習の具体的な使い方とポイント


■ 講師
1.
中部大学 工学部情報工学科 准教授 山下 隆義 氏

■ 開催要領
日 時 :
平成31年4月4日(木) 10:00~17:00

会 場 : [東京・五反田]技術情報協会 8F セミナールーム
聴講料 : 1名につき50,000円(消費税抜き、昼食、資料付) 
〔1社2名以上同時申込の場合1名につき45,000円(税抜)〕


プログラム

<10:00~17:00>


深層強化学習の具体的な使い方とポイント

中部大学 工学部情報工学科 准教授 山下 隆義 氏

【講演趣旨】
ロボットや自動車などの自律制御に向けて,深層強化学習が注目されている.強化学習は古くから研究されているが,深層学習の登場により,これらを組み合わせてより高い精度を達成することができている.その代表的な例がAlpha Goであり,世界チャンピオンとの囲碁の対戦で勝利するまで至っている.本講演では,強化学習および深層強化学習の仕組みと最新の事例を紹介する.また,実際に活用するためのフレームワークやコツなどについても深く紹介する.

【講演項目】

1.強化学習について
 1-1.強化学習はどんなことができるのか
 1-2.強化学習の概念
 1-3.強化学習とは
 1-4.強化学習の目的

2.深層強化学習のアルゴリズム
 2-1.強化学習アルゴリズムマップ
 2-2.Q‐Learningとは
 2-3.Q‐Learningの問題点
 2-4.DQN
 2-5.Double DQN
 2-6.Actor‐Critic
 2-7.A3C
 2-8.UNREAL  
 2-9.学習の安定化のために

3.深層強化学習のフレームワーク
 3-1.強化学習を行うために
 3-2.OpenAI Gymとは
 3-3.OpenAI Gymの使い方とは
 3-4.MuJoCoとは
 3-5.MuJoCoを使うには
 3-6.ChainerRLとは
 3-7.ChainerRLの使い方

4.深層強化学習のコツ
 4-1.深層強化学習のメリット・デメリット

5.仮想環境を用いた強化学習
 5-1.強化学習によるロボットの動作獲得
 5-2.シミュレータを用いた強化学習

【質疑応答・名刺交換】