27
OpenAI universe-starter-agent 触ってみた

Open ai universe starter-agent触ってみた

Embed Size (px)

Citation preview

Page 1: Open ai universe starter-agent触ってみた

OpenAIuniverse-starter-agent

触ってみた

Page 2: Open ai universe starter-agent触ってみた

今回の目標

- universe-starter-agentでAtari pongの学習をさせて遊んでみる

Page 3: Open ai universe starter-agent触ってみた

学習の最終目標

- 強化学習を利用してアプリゲームなどのレベル上げを自動化したい

Page 4: Open ai universe starter-agent触ってみた
Page 5: Open ai universe starter-agent触ってみた
Page 6: Open ai universe starter-agent触ってみた

OpenAI / universe とは?

- AIの知能を測定・学習するためのソフトウェアプラットフォーム

- Universe上でAIエージェントは人間と同じようにコンピュータを利用することで学習

を行わせることができる

Page 7: Open ai universe starter-agent触ってみた

OpenAI / universe-starter-agent とは?

- 以前のPyData.Okinawa meetupでも利用した、universeの環境に加えて、

TensorFlowで実装されたA3Cアルゴリズムが最初から実装されている

- さまざまなuniverse上の環境を解決できるエージェントらしいが、実際はAtari pongの環境に最適化されているっぽい

Page 8: Open ai universe starter-agent触ってみた

環境構築 → プロセスの起動

- リポジトリのREADMEを参照しながらやったらすぐできた

- 環境構築がうまくいけばanacondaの仮想環境内でtmuxのセッションが立ち上がる

Page 9: Open ai universe starter-agent触ってみた

ps:別々のワーカ間でパラメータを同期させるパラメータサーバ

Page 10: Open ai universe starter-agent触ってみた

w-0:方策勾配法で強化学習を行うプロセス(なるほどわからん)

Page 11: Open ai universe starter-agent触ってみた

w-1:環境から受け取ったランダムなノイズを利用するプロセス(なるほどわからん)

Page 12: Open ai universe starter-agent触ってみた

tb:TenorBoardを動かすプロセス

Page 13: Open ai universe starter-agent触ってみた

htop:マシンにかかる負荷を監視できる

Page 14: Open ai universe starter-agent触ってみた

学習のようす

- 53000ステップ目付近

- 160000ステップ目付近

Page 15: Open ai universe starter-agent触ってみた

学習のようす:TensorBoardの global/reward_per_time

Page 16: Open ai universe starter-agent触ってみた

所感

- 強化学習の理論の勉強ちょうむずかしそう

- 2014年に購入した4CoreのMacを使ってるんですが、はやくもつらくなってきた。。

- 今度はマシンスペックに余裕のある環境(EC2)で構築してみる

Page 17: Open ai universe starter-agent触ってみた

大変だったこと

- 最近飼い始めたねこ(むぎ君)が邪魔してなかなか作業がはかどらなかった

- ねこと強化学習の勉強は相性が悪い可能性あり(突然のCtrl-C!)

Page 18: Open ai universe starter-agent触ってみた

ねこのハトムギ君

Page 19: Open ai universe starter-agent触ってみた

これからやることリスト

- スペックの高いマシンでの

- A3Cアルゴリズムの勉強

- universe-starter-agentのREADMEによると、さまざまな環境で使えるようなので

ほかのゲームでも学習を試してみる

- ねこと一緒に住んでても快適にコーディングできる術を考える

Page 20: Open ai universe starter-agent触ってみた

参考文献

- universe-starter-agent- https://github.com/openai/universe-starter-agent

- OpenAI UniverseでするAtari Pongの強化学習 - http://qiita.com/TSY/items/9ef0db18d40233f023e8

- A3Cという強化学習アルゴリズムで遊んでみた話 - https://www.slideshare.net/mooopan/a3c-62170605

Page 21: Open ai universe starter-agent触ってみた

さいごに

- おもしろそうだなと思ってくれたそこのかた!

- 一緒に勉強しましょう!(土下座)

Page 22: Open ai universe starter-agent触ってみた
Page 23: Open ai universe starter-agent触ってみた

GitHubのPyData.OkinawaリポジトリにあるJupyter notebookがDeadKernelになる人へ

Page 24: Open ai universe starter-agent触ってみた
Page 25: Open ai universe starter-agent触ってみた

つらみ(´・ω・`)

Page 26: Open ai universe starter-agent触ってみた

解決方法

- 気になる方は”IT系バンドマンの日常”でけんさくけんさくぅ

Page 27: Open ai universe starter-agent触ってみた

いつもよりはフランクな雰囲気だと思いますのでなんでも聞いてください