Home
->  12月開催 その他セミナー 

強化学習の基礎とその使い方

12月開催 その他セミナー  更新日:2018年11月 1日
 セミナー番号【812503】12/18 講師1名
★強化学習とは何か?どんな仕組みか?何ができるのか?
学習エージェントと環境、アルゴリズム、深層強化学習...分かりやすく解説します!

強化学習の基礎とその使い方


~Q学習から深層強化学習AlphaGoZeroまで~


■ 講師
京都工芸繊維大学 情報工学・人間科学系 准教授 飯間 等 氏

■ 開催要領
日 時 :
平成30年12月18日(火) 10:00~17:00

会 場 : [東京・五反田]技術情報協会 8F セミナールーム
聴講料 :
1名につき50,000円(消費税抜き、昼食・資料付) 
〔1社2名以上同時申込の場合1名につき45,000円(税抜)〕


※定員になり次第、お申込みは締切となります。


プログラム

【講演のポイント】
人工知能分野では、プロ棋士の経験に基づいて囲碁の打ち方を学習するAlphaGoが一昨年に大 きな話題となり、続いてこれを上回るAlphaGoZeroが昨年提案されました。AlphaGoZeroは深層強化学習とい う最先端技術を用いることでプロ棋士の経験を全く使用せずに学習できること、また応用分野が限定されて おらず、どのような分野でも適用可能であることから世界中のあらゆる分野で注目を集めております。 本講演では、このように注目を集めて続けている強化学習を基礎から平易に解説します。学習の方法につい て、伝統的で幅広く用いられているQ学習から最新の深層強化学習まで、様々な学習法を紹介します。例を 用い、また練習問題を解くことで理解を深めます。

【講演項目】
1. 強化学習の例示(デモンストレーション)
  1.1 最短経路探索
  1.2 ゲームプレイ
  1.3 二足歩行

2. 強化学習問題
  2.1 学習エージェントと環境
  2.2 問題の定義
  2.3 設定例

3. 表形式の強化学習法
  3.1 価値関数
  3.2 行動選択法
  3.3 伝統的な学習法:Q学習、Sarsa

4. 近似を用いる強化学習法
  4.1 価値関数の近似: 放射基底関数、ニューラルネットワーク
  4.2 勾配法
  4.3 価値勾配を用いる学習法
  4.4 方策勾配を用いる学習法

5. 人間を超える学習法:深層強化学習
  5.1 深層学習(ディープラーニング)
  5.2 ビデオゲームに対する学習法
  5.3 囲碁に対する学習法: AlphaGoとAlphaGoZero

【質疑応答・個別質問・名刺交換】


 
強化学習 セミナー