4

STOCHASTIC NEURAL NETWORKS FOR HIERARCHICAL REINFORCEMENT LEARNING Carlos Florensa† , Yan Duan†‡, Pieter Abbeel†‡ 2017/2/10 発発発発発発発：

[DL輪読会]Stochastic Neural Networks for Hierarchical Reinforcement Learning

Download PPTX Report

Upload
deeplearningjp2016
View
84
Download
4

Embed Size (px)

Citation preview

Page 1: [DL輪読会]Stochastic Neural Networks for Hierarchical Reinforcement Learning

STOCHASTIC NEURAL NETWORKS FOR HIERARCHICAL REINFORCEMENT LEARNING

Carlos Florensa† , Yan Duan†‡, Pieter Abbeel†‡

2017/2/10発表者：金子貴輝

Page 2: [DL輪読会]Stochastic Neural Networks for Hierarchical Reinforcement Learning

階層的強化学習• 報酬を得るまでが長いタスクを分割したい• 従来法の問題–タスクの分割に固有の知識を必要とする–タスク間で知識を共有せずサンプル効率が低い

2

Page 3: [DL輪読会]Stochastic Neural Networks for Hierarchical Reinforcement Learning

問題設定• 事前学習ができる• 状態空間が（共通，タスク固有）に分かれて相互作用が少ない–例：把持タスクにおける対象物の位置

3

Page 4: [DL輪読会]Stochastic Neural Networks for Hierarchical Reinforcement Learning

提案手法• 確率的ニューラルネット–同じ状況でも異なる行動を取れるので，状況の変化に対応できる

• 相互情報量基準での正規化–新しい場所に行けば報酬になるらしい

• タスク特徴の挿げ替えによる階層的 RL–タスクを表す特徴で条件付けて事前学習• 報酬は疎のままでいい

–固定ステップごとに one hotなタスク特徴を自作する上位のニューラルネット4

Reinforcement Learning

Reinforcement Learning

Documents

Reinforcement Learning Das Reinforcement Learning-Problem Alexander Schmid

Reinforcement Learning Das Reinforcement Learning-Problem Alexander Schmid

Documents

Hierarchical Deep Reinforcement Learning: Integrating Temporal … · 2016. 4. 21. · Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstraction and Intrinsic Motivation

Hierarchical Deep Reinforcement Learning: Integrating Temporal … · 2016. 4. 21. · Hierarchical Deep Reinforcement Learning: Integrating Temporal Abstraction and Intrinsic Motivation

Documents

Reinforcement Learningaplicadoa videojuegos

Reinforcement Learningaplicadoa videojuegos

Documents

Reinforcement Learning - 4. Model-free reinforcement Learning

Reinforcement Learning - 4. Model-free reinforcement Learning

Documents

Hierarchical Interactive Theater Model

Hierarchical Interactive Theater Model

Documents

Hierarchical Clustering

Hierarchical Clustering

Documents

Fiber reinforcement concrete

Fiber reinforcement concrete

Engineering

Fast Hierarchical Back Projection

Fast Hierarchical Back Projection

Documents

Pengaruh Penguatan Reinforcement)

Pengaruh Penguatan Reinforcement)

Documents

PENERAPANALMOST STOCHASTIC DOMINANCE DAN NEW … · perpustakaan.uns.ac.id digilib.uns.ac.id commit to user PENERAPANALMOST STOCHASTIC DOMINANCE DAN NEW ALMOST STOCHASTIC DOMINANCE

PENERAPANALMOST STOCHASTIC DOMINANCE DAN NEW … · perpustakaan.uns.ac.id digilib.uns.ac.id commit to user PENERAPANALMOST STOCHASTIC DOMINANCE DAN NEW ALMOST STOCHASTIC DOMINANCE

Documents

PENGGUNAAN TOKEN REINFORCEMENT SYSTEM … · sistem token efektif dalam pengendalian perilaku. Meskipun terdapat token reinforcement system. token reinforcement system. adaptif anak

PENGGUNAAN TOKEN REINFORCEMENT SYSTEM … · sistem token efektif dalam pengendalian perilaku. Meskipun terdapat token reinforcement system. token reinforcement system. adaptif anak

Documents

Reinforcement learning v0.5

Reinforcement learning v0.5

Data & Analytics

Anchorage and Development Length. Development Length - Tension Where, α = reinforcement location factor β = reinforcement coating factor γ = reinforcement

Anchorage and Development Length. Development Length - Tension Where, α = reinforcement location factor β = reinforcement coating factor γ = reinforcement

Documents

Hierarchical MPC

Hierarchical MPC

Documents

2.3 Reinforcement 2015

2.3 Reinforcement 2015

Documents

Introduction to Stochastic Local Searchiridia.ulb.ac.be/ants2006/tutorial_slides/stuetzle_tutorial_slides.pdfIntroduction to Stochastic Local Search Thomas utzle St Outline Stochastic

Introduction to Stochastic Local Searchiridia.ulb.ac.be/ants2006/tutorial_slides/stuetzle_tutorial_slides.pdfIntroduction to Stochastic Local Search Thomas utzle St Outline Stochastic

Documents

Hierarchical production planning

Hierarchical production planning

Documents

Comparative analysis of metal reinforcement and fibre ...unistroy.spbstu.ru/index_2014_25/5_makusheva_25.pdf · Comparative analysis of metal reinforcement ... of metal reinforcement

Comparative analysis of metal reinforcement and fibre ...unistroy.spbstu.ru/index_2014_25/5_makusheva_25.pdf · Comparative analysis of metal reinforcement ... of metal reinforcement

Documents

Stochastic Models

Stochastic Models

Documents

Hierarchical temporal memory

Hierarchical temporal memory

Technology

PENGARUH REINFORCEMENT GURU TERHADAP MOTIVASI …repositori.uin-alauddin.ac.id/13572/1/Pengaruh Reinforcement Guru... · PENGARUH REINFORCEMENT GURU TERHADAP MOTIVASI BELAJAR PESERTA

PENGARUH REINFORCEMENT GURU TERHADAP MOTIVASI …repositori.uin-alauddin.ac.id/13572/1/Pengaruh Reinforcement Guru... · PENGARUH REINFORCEMENT GURU TERHADAP MOTIVASI BELAJAR PESERTA

Documents

Hierarchical clusteringHierarchical clusteringHierarchical … · 2019. 11. 21. · Hierarchical Clustering • Agglomerative Clustering ... Agglomerative clustering (bottom-up) •

Hierarchical clusteringHierarchical clusteringHierarchical … · 2019. 11. 21. · Hierarchical Clustering • Agglomerative Clustering ... Agglomerative clustering (bottom-up) •

Documents

Presentasi Reinforcement Positif

Presentasi Reinforcement Positif

Documents

Ujava.org reinforcement-learning

Ujava.org reinforcement-learning

Data & Analytics

New Transient and asymptotic dynamics of reinforcement learning … · 2009. 9. 6. · (1955) linear stochastic model of reinforcement learning for 2 × 2 (i.e. 2-player 2-strategy)

New Transient and asymptotic dynamics of reinforcement learning … · 2009. 9. 6. · (1955) linear stochastic model of reinforcement learning for 2 × 2 (i.e. 2-player 2-strategy)

Documents

Stochastic Processes and Stochastic Integration - Marcus Pivato

Stochastic Processes and Stochastic Integration - Marcus Pivato

Documents

Reinforcement Learning 2

Reinforcement Learning 2

Documents

Plants Reinforcement

Plants Reinforcement

Documents

Hierarchical Reconfigurable Petri Nets

Hierarchical Reconfigurable Petri Nets

Documents