24

A3Cという強化学習アルゴリズムで遊んでみた話

  • Upload
    mooopan

  • View
    6.883

  • Download
    0

Embed Size (px)

Citation preview

Page 1: A3Cという強化学習アルゴリズムで遊んでみた話
Page 3: A3Cという強化学習アルゴリズムで遊んでみた話
Page 4: A3Cという強化学習アルゴリズムで遊んでみた話
Page 7: A3Cという強化学習アルゴリズムで遊んでみた話

d✓v =@(R� V (si; ✓v))2

@✓v

d✓ = r✓ log ⇡(ai|si; ✓)(R� V (si; ✓v))

Page 8: A3Cという強化学習アルゴリズムで遊んでみた話

g = ↵g + (1� ↵)�✓2 ✓ ✓ � ⌘�✓pg + ✏

Page 9: A3Cという強化学習アルゴリズムで遊んでみた話
Page 10: A3Cという強化学習アルゴリズムで遊んでみた話
Page 13: A3Cという強化学習アルゴリズムで遊んでみた話
Page 14: A3Cという強化学習アルゴリズムで遊んでみた話
Page 15: A3Cという強化学習アルゴリズムで遊んでみた話
Page 17: A3Cという強化学習アルゴリズムで遊んでみた話
Page 18: A3Cという強化学習アルゴリズムで遊んでみた話
Page 19: A3Cという強化学習アルゴリズムで遊んでみた話
Page 20: A3Cという強化学習アルゴリズムで遊んでみた話
Page 21: A3Cという強化学習アルゴリズムで遊んでみた話
Page 22: A3Cという強化学習アルゴリズムで遊んでみた話
Page 23: A3Cという強化学習アルゴリズムで遊んでみた話
Page 24: A3Cという強化学習アルゴリズムで遊んでみた話