[DL輪読会]Deep Direct Reinforcement Learning for Financial Signal Representation and Trading

DEEP LEARNING JP[DL Papers]

http://deeplearning.jp/

Deep Direct Reinforcement Learning for Financial SignalRepresentation and Trading

Kunihiro Miyazaki, Matsuo Lab

• タイトル– Deep Direct Reinforcement Learning for Financial Signal Representation and Trading

• ジャーナル– IEEE transactions on neural networks and learning systems– IF: 6.108 as of 2016

• Date of Publication– 15 February 2016

• 引用数– 13

• 著者– Yue Deng, Feng Bao, Youyong Kong, Zhiquan Ren and Qionghai Dai–

• 一言で– DL RL

2017/6/2 2

• 元々金融系の研究をしている

• DLによる金融時系列情報からの特徴量抽出• RLによる金融商品トレーディング– 2

• まだDLでトレーディングを試みている論文は少ない

2017/6/2 3

• 金融における機械学習応用は様々1.2.3.4.5. etc

• 効率的市場仮説–

•–

•• =>DL

2017/6/2 4

• 問題設定• 提案手法• 実験と結果• 考察• 感想

2017/6/2 5

• 2つの問題設定––

• 以下の二つを統合した、• Direct Reinforcement Learningによる金融トレードシステムを

提案– Fuzzy Learning RNN– Task-aware BPTT

2017/6/2 6

Direct Reinforcement Learning

• R: 時間t毎の利得• δ: ポジション {1,0,-1}• c: 決済のコスト• z: 前の時刻からのリターン• u: ポジション変更のコスト

• g: NNのマッピング• a: 前の層からのインプット• o: ある層のアウトプット

Fuzzy Learning

• 株価にはその会社の本質の価値だけでなく、マーケットのセンチメントや会社の噂など、数多くのファクターで成り立っている

• メンバーシップ関数を用いることで、よりロバストな学習が可能– k=3

• v: メンバーシップ関数R→[0,1]

Task-aware BPTT

2017/6/2 9

• Fuzzy Learningは、実装する上で膨大な潜在変数に対処しきれない– Task-aware BPTT

• 初期値の設定– DNN Part AutoEncoder

• Task-aware BPTT– Reward BPTT time stack BP

• Reward stack

Task-aware BPTT

• Task-aware BPTTを用いるとロバストな学習ができる

-• 使用したデータ– IF

• 300•

–• AG• SU

• 特徴量– 45m 3h 5h 1d 3d 10d

• 約1年のデータをtrainとtestに分割11

TC: 決済コスト

• DLを用い、最初にFuzzy_learningを用いる程結果は良くなる–

• S&Pのデータで実験–

2017/6/2 14

• パラメータを変更した結果–– τ

• 結論–

•– Fuzzy Leaning

• 感想– DL– DL

2017/6/2 15

2017/6/2 16

[DL輪読会]Deep Direct Reinforcement Learning for Financial Signal Representation and Trading

Technology

Reinforcement Learning Eligibility Traces

Reinforcement Peneguhan

Reinforcement Learning - 4. Model-free reinforcement Learning

Anchorage and Development Length. Development Length - Tension Where, α = reinforcement location factor β = reinforcement coating factor γ = reinforcement

Plants Reinforcement

ujava.org Reinforcement Learning (2nd)

ASD Reinforcement Manual 2011

Pengaruh Penguatan Reinforcement)

Reinforcement Learning

[Dl輪読会]introduction of reinforcement learning

(2a) Laminate & Reinforcement Mat'l

Pro-Social Reinforcement PwrPoint

Simplified representation of concrete reinforcement

論文輪読資料「Why regularized Auto-Encoders learn Sparse Representation?」DL Hacks

An Object-oriented Representation for Efficient Reinforcement Learning

Learning a State Representation for a Game Agent’s ... · Agent’s Reactive Behaviour ... In reinforcement learning, an agent interacts with its environment by taking actions and

Inverse Reinforcement On POMDP

Trauma & Representation (next time –trauma “management” and media representation)

Reinforcement learning v0.5

Presentasi Reinforcement Positif