41

PG - Q @shohu33

PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Download PDF Report

Upload
-
View
889
Download
2

Embed Size (px)

Citation preview

Page 1: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

PG - Q@shohu33

Page 2: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

ATARI

Page 3: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

PG

PG

Page 4: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

(policy)

Page 5: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

PG

PG

Page 6: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

PG

Q

( ) ( or

) (

) Q

Page 7: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

"Q-Learning Tutorial". Mnemosyne Studio. http://mnemstudio.org/path-finding-q-learning-tutorial.htm

Page 8: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

6

5

Page 9: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

1. (Gamma)

2. Q 0

3. :

3.1

3.2 5 :

3.2.1

3.2.2

3.2.3 Q

Q(state, action) = R(state, action) + Gamma * Max[Q(next state, all actions)]* Q

3.2.4

3.2.5 5

3.3

Page 10: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Page 11: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

1. (Gamma)

Page 12: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

(Gamma) 0 1

0 ( )

0.8

Page 13: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

[ ]

Page 14: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

100

Page 15: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Page 16: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

2. Q( ) 0

Page 17: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

0

1 5

100

Q( )

0( )

Page 18: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Page 19: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.1

Page 20: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

RANDOM

Page 21: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.2 5

Page 22: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.2.1

Page 23: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3 5

Page 24: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.2.2

Page 25: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

5

Page 26: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.2.3 Q

Q(state, action) = R(state, action) + Gamma * Max[Q(next state, all actions)]

Page 27: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

今回、部屋1 から部屋5 に移動する⾏動を選んだので

Q

state=1, action=5, Gamma=0.8, next state=5, all actions = 1,4,5

Q

Page 28: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Q

Q

5

1,4,5

Q

Page 29: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.2.4

Page 30: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

5

Page 31: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.2.6 5

Page 32: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

5

Page 33: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.3

Page 34: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

3.1

Page 35: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

31

Q(state, action) = R(state, action) + Gamma * Max[Q(next state, all actions)]

Q(3, 1) = R(3, 1) + 0.8 * Max[Q(1, 3), Q(1, 5)] = 0 + 0.8 * Max(0, 100) = 80

1

Page 36: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Page 37: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

1 55

5 Q(state, action) = R(state, action) + Gamma * Max[Q(next state, all actions)]

Q(1, 5) = R(1, 5) + 0.8 * Max[Q(5, 1), Q(5, 4), Q(5, 5)] = 100 + 0.8 * Max(0, 0, 0) = 100

Q

Page 38: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Page 39: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Q

Q

2Q 2 → 3 → 1 → 5

OR

2 → 3 → 4 → 5

5

Page 40: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Q

Page 41: PGに簡単なゲームのやり方を学習させる Vol.1 - まずはQ学習を理解する

Q

2019.6.9（日）第1回飯田学習室カフェ＠飯田学習室‘¬6.9...2019.6.9（日）第1回飯田学習室カフェ＠飯田学習室飯田学習室にて、第1回飯田学習室カフェを開催しました。

2019.6.9（日）第1回飯田学習室カフェ＠飯田学習室‘¬6.9...2019.6.9（日）第1回飯田学習室カフェ＠飯田学習室飯田学習室にて、第1回飯田学習室カフェを開催しました。

Documents

ソーシャルメディア分析サービスにおけるNLP技術の活⽤と近 … · 深層学習を含む機械学習 2005年 2019年深層学習を含む機械学習 Øスパム推定

ソーシャルメディア分析サービスにおけるNLP技術の活⽤と近 … · 深層学習を含む機械学習 2005年 2019年深層学習を含む機械学習 Øスパム推定

Documents

2019 年度看護学科第 4学年シラバス · ー・場所」の欄を確認の上、その指示に従ってください。 2. 事前学習・事後学習について. 単位修得は事前学習・事後学習を前提としています。各科目の事前学習・事後学習は

2019 年度看護学科第 4学年シラバス · ー・場所」の欄を確認の上、その指示に従ってください。 2. 事前学習・事後学習について. 単位修得は事前学習・事後学習を前提としています。各科目の事前学習・事後学習は

Documents

Monthly Research Fourteenforty Research Institute, Inc. 機械学習 … · 2013. 7. 5. · FFRI,Inc. 1. はじめに 2. 機械学習概要 – 機械学習とは – 機械学習を取り巻く環境

Monthly Research Fourteenforty Research Institute, Inc. 機械学習 … · 2013. 7. 5. · FFRI,Inc. 1. はじめに 2. 機械学習概要 – 機械学習とは – 機械学習を取り巻く環境

Documents

家庭学習ノートを活用した自主学習指導- 1 - 家庭学習ノートを活用した自主学習指導～学習習慣の改善を促す学級システム作り～東久留米市立第十小学校

家庭学習ノートを活用した自主学習指導- 1 - 家庭学習ノートを活用した自主学習指導～学習習慣の改善を促す学級システム作り～東久留米市立第十小学校

Documents

仮想サーバを利用した協調学習支援方式 · い目的を協調学習という学習方法を用いて達成しようとするグループウェアの検討がなされてきた[₁]。学習者間の

仮想サーバを利用した協調学習支援方式 · い目的を協調学習という学習方法を用いて達成しようとするグループウェアの検討がなされてきた[₁]。学習者間の

Documents

マルチエージェント強化学習による自律移動ロボットの行動獲得 · 2016-12-13 · 2. 強化学習 2-1. 強化学習とは本研究ではロボットの学習に強化学習を用いる。強化学習とは機械学習の一

マルチエージェント強化学習による自律移動ロボットの行動獲得 · 2016-12-13 · 2. 強化学習 2-1. 強化学習とは本研究ではロボットの学習に強化学習を用いる。強化学習とは機械学習の一

Documents

決定木の学習...1 決定木の学習知能情報処理学習訓練と経験から知識を獲得するエージェント • 学習 • 決定木 • ID3アルゴリズム 2

決定木の学習...1 決定木の学習知能情報処理学習訓練と経験から知識を獲得するエージェント • 学習 • 決定木 • ID3アルゴリズム 2

Documents

1 自主学習「ふくみねノート」のねらい2 3 家庭学習の習慣や方法 (1) 家庭学習の習慣 ①毎日必ず机に向かう。（学習する時間を決めて）

1 自主学習「ふくみねノート」のねらい2 3 家庭学習の習慣や方法 (1) 家庭学習の習慣 ①毎日必ず机に向かう。（学習する時間を決めて）

Documents

103C2 ニューラルネットワークを使った強化学習による行動学習 …shws.cc.oita-u.ac.jp/shibata/pub/SICEQ2017Egoshi.pdf · た強化学習を用いて、音声を入力として簡単な行動学習

103C2 ニューラルネットワークを使った強化学習による行動学習 …shws.cc.oita-u.ac.jp/shibata/pub/SICEQ2017Egoshi.pdf · た強化学習を用いて、音声を入力として簡単な行動学習

Documents

新学習指導要領の趣旨小学校総合的な学習の時間を踏まえた授 …€¦ · 〇プログラミング的思考の育成プログラミングを体験しながら論理的思考力を身に付ける学習活動を行う場合には、探究的な学習の過

新学習指導要領の趣旨小学校総合的な学習の時間を踏まえた授 …€¦ · 〇プログラミング的思考の育成プログラミングを体験しながら論理的思考力を身に付ける学習活動を行う場合には、探究的な学習の過

Documents

CNTKdeepdive - eventmarketing.blob.core.windows.net · cntkでの分散学習–1/6 深層学習での分散学習とは？ →主に学習時間短縮のためにマルチgpuを利用すること

CNTKdeepdive - eventmarketing.blob.core.windows.net · cntkでの分散学習–1/6 深層学習での分散学習とは？ →主に学習時間短縮のためにマルチgpuを利用すること

Documents

家庭学習の手引き家庭を学びの環境に家庭を学びの環境に · 家庭学習の提案をすすんで学ぶ力・家庭学習の習慣化を目指して家庭教育を見直し、各家庭の事情に合わせた内容や

家庭学習の手引き家庭を学びの環境に家庭を学びの環境に · 家庭学習の提案をすすんで学ぶ力・家庭学習の習慣化を目指して家庭教育を見直し、各家庭の事情に合わせた内容や

Documents

機械学習の仕組みの指導と機械学習を用いた問題解決の授業実践€¦ · 機械学習の指導一斉学習機械学習の仕組みの理解、機械学習を用いる技能の習得

機械学習の仕組みの指導と機械学習を用いた問題解決の授業実践€¦ · 機械学習の指導一斉学習機械学習の仕組みの理解、機械学習を用いる技能の習得

Documents

子どもの学習意欲を引き出す多様な学習指導・学習 …...J1―01 報告475 子どもの学習意欲を引き出す多様な学習指導・学習活動の在り方

子どもの学習意欲を引き出す多様な学習指導・学習 …...J1―01 報告475 子どもの学習意欲を引き出す多様な学習指導・学習活動の在り方

Documents

Pythonで機械学習を自動化 auto sklearn

Pythonで機械学習を自動化 auto sklearn

Data & Analytics

協調学習で学びを見る、学びを見直す - jasce.jp · 協調学習で学びを見る、学びを見直す白水始（東京大学大学発教育支援コンソーシアム推進機構）

協調学習で学びを見る、学びを見直す - jasce.jp · 協調学習で学びを見る、学びを見直す白水始（東京大学大学発教育支援コンソーシアム推進機構）

Documents

ボケるRNNを学習したい (Chainer meetup 01)

ボケるRNNを学習したい (Chainer meetup 01)

Technology

メンタルレキシコンの学習：子どもはどのように単語の意味を学習するか

メンタルレキシコンの学習：子どもはどのように単語の意味を学習するか

Documents

技能を高め、卓球の特性に深く触れる学習 - …平成16年度学校体育長期研修報告技能を高め、卓球の特性に深く触れる学習～学習資料を使った教え合う学習と

技能を高め、卓球の特性に深く触れる学習 - …平成16年度学校体育長期研修報告技能を高め、卓球の特性に深く触れる学習～学習資料を使った教え合う学習と

Documents

防災体験学習の活動発表 - Nakanoto · ①の基本学習では、防災の基礎知識を学ぶため、各学年で学習をしました。 ①基本学習【実施日】：7月26日(水)

防災体験学習の活動発表 - Nakanoto · ①の基本学習では、防災の基礎知識を学ぶため、各学年で学習をしました。 ①基本学習【実施日】：7月26日(水)

Documents

深層学習のリモートセンシングへの応用 hamaguchi.pdf · •リモートセンシングと深層学習 •なぜ深層学習か？ •深層学習を使って何ができるか？

深層学習のリモートセンシングへの応用 hamaguchi.pdf · •リモートセンシングと深層学習 •なぜ深層学習か？ •深層学習を使って何ができるか？

Documents

CALL学習に対する学習者個人特性の分析€¦ · 近年学習者の多様化に伴い、外国語教育の分野では、教師が学習者に教えるという方向から、学習者が教師を含む学習リソースを利用して自律的に学習す

CALL学習に対する学習者個人特性の分析€¦ · 近年学習者の多様化に伴い、外国語教育の分野では、教師が学習者に教えるという方向から、学習者が教師を含む学習リソースを利用して自律的に学習す

Documents

SAS Enterprise Minerを使用した機械学習

SAS Enterprise Minerを使用した機械学習

Data & Analytics

単元名器械運動「マット運動」...5 7 整理運動をし，後始末をする。 8 学習のまとめをする。学習カード全体で本時の学習をふり返る。

単元名器械運動「マット運動」...5 7 整理運動をし，後始末をする。 8 学習のまとめをする。学習カード全体で本時の学習をふり返る。

Documents

イラストレーター速習編training.softopia.or.jp/wp-content/uploads/2017/08/h29.9-12.pdf · 学習目標・機械学習のライブラリであるTensorFlow (テンソルフロー)を利用して、簡単な画像を機械学

イラストレーター速習編training.softopia.or.jp/wp-content/uploads/2017/08/h29.9-12.pdf · 学習目標・機械学習のライブラリであるTensorFlow (テンソルフロー)を利用して、簡単な画像を機械学

Documents

機械学習学習する人工知能...機械学習による予測を盲信するリスク： –機械学習（とくに深層学習）モデルはブラックボックス –敵対的変動：データの僅かな変更で予測を変更可

機械学習学習する人工知能...機械学習による予測を盲信するリスク： –機械学習（とくに深層学習）モデルはブラックボックス –敵対的変動：データの僅かな変更で予測を変更可

Documents

TBL(チーム基盤型学習法）を活用したビジネス実 …...学生の学びを深める学習法の研究 TBL(チーム基盤型学習法）を活用したビジネス実務教育における学習法

TBL(チーム基盤型学習法）を活用したビジネス実 …...学生の学びを深める学習法の研究 TBL(チーム基盤型学習法）を活用したビジネス実務教育における学習法

Documents

機械学習テンプレートライブラリを用いた ...yans-previous.anlp.jp/symposium/2008/paper/yans2008-matsushima.pdf · 機械学習テンプレートライブラリを用いた英語品詞タガー

機械学習テンプレートライブラリを用いた ...yans-previous.anlp.jp/symposium/2008/paper/yans2008-matsushima.pdf · 機械学習テンプレートライブラリを用いた英語品詞タガー

Documents

大学における映画を活用した授業の特徴 · 行研究を検討し、映画を教材とした授業のコンセプトとして学生中心の学習、経験学習、反省的学習、問題解決学習の4つを挙げている。

大学における映画を活用した授業の特徴 · 行研究を検討し、映画を教材とした授業のコンセプトとして学生中心の学習、経験学習、反省的学習、問題解決学習の4つを挙げている。

Documents