エージェントモデル及び強化学習による災害時の避難誘導シス … ·...

エージェントモデル及び強化学習による災害時の避難誘

導システムの研究

Erick MAS （マス・エリック）東北大学・災害科学国際研究所・広域被害把握研究分野（准教授）

タフ・サイバーフィジカルAI研究センター・HPC計算モジュール研究部門

Tough Cyberphysical AI Research Center - Tohoku University

A traffic jam is seen as people evacuate after tsunami advisories were issued following an earthquake, in Iwaki, Fukushima prefecture, Japan, in this photo taken by Kyodo November 22, 2016. Mandatory credit Kyodo Kyodo/via REUTERSSource: https://www.reuters.com/article/us-japan-quake-evacuation/bitter-lessons-of-japans-2011-tsunami-put-to-use-with-latest-quake-idUSKBN13H0EC

交通渋滞

Tsunami warning evacuation in Indonesia. (photo credit: REUTERS)Source: https://www.jpost.com/International/Quakes-off-Indonesia-stir-panic-but-no-big-tsunami

混雑

Source: The Weather Channel (YouTube channel) : https://www.youtube.com/watch?v=coPW6unxeY8

渋滞回避（混雑を避ける）

最適避難経路

Source: 内閣府作成

Source: https://upload.wikimedia.org/wikipedia/commons/b/bb/Kar-go_Real-time_Neural_Network_Processing.gif

1.リアルタイム津波浸⽔予測と強化学習による避難誘導最適化

東北⼤SX-ACE/Aurora（災害時運⽤可能）

東北⼤D-waveマシン

2.量⼦アニーリングによる避難経路探索最適化

3. ⼈・⾞のリアルタイムモニタリングと避難誘導更新

4. 避難誘導システム

渋滞回避︕

逃げ遅れ無し︕

(*) https://technology-illustration.com/highresolution/027-illustration-technology.png

l 避難経路選択の問題点l 経路の全体的の被害状況を知らずl 最適の道を選択されない時もある

l 最適とは最短経路のみではない. さらに混雑していない、津波到達時間の余裕、⾼いところを向かう、などの意味を考慮する.

BEST 2nd

BEST3rd

強化学習と次世代ベクトル機による経路選択

問題を解く

量⼦アニーリングによる避難者を複数の道に配布

する＋

Input: 被害状況の想定あるいはリアルタイム情報 Input: 避難者の位置情報と⽬的地

Source: https://medium.freecodecamp.org/an-introduction-to-reinforcement-learning-4339519de419

強化学習について

環境

エージェント

行動報酬新状態

津波避難の場合

+1-1 -1

津波避難の場合

国勢調査

Agents gender

Agents age

分解

N = 2,723 人数

code coord_x coord_y evacuation0 497729.4 4229597 01 497673.6 4229756 02 497719.6 4229728 03 497623.3 4229661 04 497669.2 4229633 05 497940.6 4230147 06 497427.4 4229905 17 497821.3 4229666 08 497875 4230132 0… … … …

ノード(240個)

# number node1 node2 length0 0 4 701 0 35 582 0 94 523 1 2 544 1 3 1085 1 6 2886 1 44 2157 2 28 448 2 36 729 2 39 60

リンク(312枚)

Code Num. links L0 L1 L2 L3 L4 L5 L6 L7 L8 L90 3 0 1 2 0 0 0 0 0 0 01 4 3 4 5 6 0 0 0 0 0 02 4 7 8 9 3 0 0 0 0 0 0… … … … … … … … … … … …

Code Num. nodes C0 C1 C2 C3 C4 C5 C6 C7 C8 C90 3 4 35 94 0 0 0 0 0 0 01 4 2 3 6 44 0 0 0 0 0 02 4 28 36 39 1 0 0 0 0 0 0… … … … … … … … … … … …

リンクの接続ノードの接続transition

Node0 codeNumber of links connected to node0

Links connected to node0

Node0 codeNumber of nodes connected to node0

Nodes connected to node0

出口

避難所

ノード: 𝑛!

混雑レベル: 𝑑!,"

𝑑!,#

𝑑!,$

時間: 𝑡&

𝑠 = 𝑛!, 𝒅

(1) 1回目の試行（ランダム誘導）(2) 結果の評価(3) 報酬を与える(4) 政策更新と保存(5) 2回目の試行（現在の最高政策を入力）(6) 避難者に誘導（数人へランダム誘導）(7) (2)へ戻ります

出口

避難所

：i +1 番目の試行回数のみで得られた報酬の総数

：i番目の試行回数まででそのノードが使用された総数

：i +1 番目の試行回数のみでそのノードが使用された総数

政策の更新式

… … … … … … … … … … … … … … … … … … … … … … … … … … … … … … …36 0 0 1 0 0 0 0 0 0 0 0.86 0.99 0.99 0.99 0 0 0 0 0 0 130 79 68 62 0 0 0 0 0 02 0 1 0 1 0 0 0 0 0 0 0.98 0.97 0.98 0.96 0 0 0 0 0 0 26 19 21 14 0 0 0 0 0 0100 0 1 0 0 0 0 0 0 0 0 0.99 0.79 0.96 0 0 0 0 0 0 0 189 468 175 0 0 0 0 0 0 036 0 1 0 0 0 0 0 0 0 0 0.92 0.66 0.97 0.93 0 0 0 0 0 0 18 297 15 23 0 0 0 0 0 036 0 1 1 0 0 0 0 0 0 0 0.99 0.99 1 1 0 0 0 0 0 0 186 176 169 159 0 0 0 0 0 036 0 1 1 1 0 0 0 0 0 0 0.83 0.5 0.75 0.83 0 0 0 0 0 0 3 1 2 3 0 0 0 0 0 07 0 0 1 0 0 0 0 0 0 0 0.88 0.75 0.5 0 0 0 0 0 0 0 4 2 1 0 0 0 0 0 0 094 0 1 0 0 0 0 0 0 0 0 0.98 0.98 0.99 0 0 0 0 0 0 0 21 30 36 0 0 0 0 0 0 036 1 1 1 0 0 0 0 0 0 0 0.99 0.99 0.99 0.99 0 0 0 0 0 0 81 74 81 53 0 0 0 0 0 0100 0 1 1 0 0 0 0 0 0 0 0.5 0.88 0.75 0 0 0 0 0 0 0 1 4 2 0 0 0 0 0 0 088 1 0 0 0 0 0 0 0 0 0 0.75 0.5 0.5 0.75 0 0 0 0 0 0 2 1 1 2 0 0 0 0 0 028 1 0 1 0 0 0 0 0 0 0 0.83 0.9 0.93 0 0 0 0 0 0 0 3 5 7 0 0 0 0 0 0 038 0 0 1 0 0 0 0 0 0 0 0.92 0.92 0.94 0 0 0 0 0 0 0 6 6 8 0 0 0 0 0 0 028 0 1 1 0 0 0 0 0 0 0 0.99 0.98 0.99 0 0 0 0 0 0 0 88 84 72 0 0 0 0 0 0 0100 1 1 0 0 0 0 0 0 0 0 1 0.99 1 0 0 0 0 0 0 0 114 124 116 0 0 0 0 0 0 028 1 1 1 0 0 0 0 0 0 0 0.94 0.94 0.93 0 0 0 0 0 0 0 9 8 7 0 0 0 0 0 0 02 1 1 0 0 0 0 0 0 0 0 0.98 0.98 0.98 0.99 0 0 0 0 0 0 32 32 28 56 0 0 0 0 0 0100 1 1 1 0 0 0 0 0 0 0 0.75 0.75 0.5 0 0 0 0 0 0 0 2 2 1 0 0 0 0 0 0 028 0 1 0 0 0 0 0 0 0 0 0.99 0.98 0.99 0 0 0 0 0 0 0 74 89 70 0 0 0 0 0 0 02 0 1 0 0 0 0 0 0 0 0 0.99 0.99 0.98 0.99 0 0 0 0 0 0 69 63 80 58 0 0 0 0 0 0100 1 0 0 0 0 0 0 0 0 0 0.97 0.99 0.99 0 0 0 0 0 0 0 52 59 61 0 0 0 0 0 0 021 0 1 0 0 0 0 0 0 0 0 0.75 0.83 0.75 0 0 0 0 0 0 0 2 3 2 0 0 0 0 0 0 02 1 0 0 0 0 0 0 0 0 0 0.96 0.79 0.97 0.95 0 0 0 0 0 0 14 12 15 11 0 0 0 0 0 01 2 0 0 0 0 0 0 0 0 0 0.81 0.64 0.98 0.8 0 0 0 0 0 0 8 7 31 339 0 0 0 0 0 0220 1 0 0 0 0 0 0 0 0 0 0.5 0.9 0.75 0 0 0 0 0 0 0 1 5 2 0 0 0 0 0 0 063 0 0 1 0 0 0 0 0 0 0 0.75 0.5 0.5 0.5 0.833 0 0 0 0 0 2 1 1 1 3 0 0 0 0 02 0 0 0 2 0 0 0 0 0 0 0.97 0.74 0.96 0.95 0 0 0 0 0 0 18 21 12 336 0 0 0 0 0 01 2 0 0 1 0 0 0 0 0 0 0.5 0.83 0.92 0.75 0 0 0 0 0 0 1 3 6 2 0 0 0 0 0 044 1 0 0 0 0 0 0 0 0 0 0.76 0.95 0.89 0.99 0 0 0 0 0 0 1518 69 60 58 0 0 0 0 0 0… … … … … … … … … … … … … … … … … … … … … … … … … … … … … … …

State code Action-Value function Number of observations

新状態を記録されます毎試行後に更新されますエージェントが任意の状態を経験し、任意の政策を実行した回数

記録状態政策評価使用された総数

1回目の試行 (n = 1) 最終の試行 (n = 1000)

津波到達時間: 67分

1回目の試行 (n = 1) 最終の試行 (n = 1000)

従来の避難モデル

（誘導なし）

強化学習の避難モデル

（誘導あり）

~485 ~0~0~485

最大密度（避難者）

最大密度（避難者）「重み」

経路探索最適化モデル

まとめ

• Society5.0とHPCは、リアルタイム津波避難シミュレーションの機会を提供する

• 交通渋滞の回避と最適避難経路を実装するために効果的な避難誘導システムが必要である

• 強化学習(RL)は効果的な避難誘導システムを設計するための適切な方法のようである

• HPC-RLとQAの組み合わせにより, 避難誘導システムに堅牢性が提供されます HPC: High Performance Computing

QA: Quantum Annealing

ご清聴ありがとうございました

エージェントモデル及び強化学習による災害時の避難誘導シス … ·...

Documents

Osaka University Knowledge Archive : OUKA...第2章避難所の発生と避難行動は，限神・淡路大震災における避難所の発生メカニズムと避難所数* 避難者数の経時的な推移を明らかにするとともに，被災者が註ぜ避難し，

熱海市津波避難計画 - Atami...1 第1章総則 1 津波避難計画の目的津波避難については、市民1人ひとりの率先避難、地域ぐるみによる避難が基本で

安全マニュアル - chem.s.u-tokyo.ac.jp · ・緊急連絡先：本マニュアル裏表紙を参照・避難路：避難経路、非常口、一次避難場所、二次避難場所

73...- 73 - --資料編 - 74 - --- 75 - --0 500 1000 1500 2000 2500 (人数）全市避難者数安佐南区避難者数安佐北区避難者数避難者数の推移安佐北区最大

水災害からの避難訓練...3 2. 本ガイドブックのコンセプトと水害に関する避難の流れ 1. 本ガイドブックのコンセプト ①「避難訓練」

1 / 45dpl-tourism.in.arena.ne.jp/wp/wp-content/uploads/...4 / 45 避難所関係・避難場所（ひなんばしょ） evacuation sites英語：繁体語：避難場所日本語例文

LED LEDs 点滅形誘導灯 - 三菱電機 Mitsubishi Electric...LED誘導灯ルクセントLEDsシリーズ点滅形誘導灯煙感知器の停止用渡り線 4F 3F 2F 1F（避難階）

第6章用語の解説集 - City of Nagoya...第6章用語の解説集〇一時避難場所 “地震の揺れ”からの指定緊急避難場所。広域避難場所へ避難す

避難先津波避難施設等避難方向避難先の種類 - …第四地区西第四地区東[一部] 施設名称建物階数外階段避難利用箇所収容面積施設名称

泉佐野市避難行動要支援者避難行動支援プラン（ …...3 計画の対象となる要支援者避難行動要支援者の避難支援体制の整備は、他者の支援がなければ避難できない在宅の人

高輝度蓄光式避難誘導標識 - ltic.co.jp · 高輝度蓄光式避難誘導標識 sn シリーズ仕様書エルティーアイ株式会社〒616-8294 京都市右京区梅ヶ畑引地町34-4

高輝度蓄光式避難誘導製品 - ltic.co.jpltic.co.jp/catalogue/katarogu.pdf · s 級品消防認定誘導標識認定番号：hp-048号 S級認定品《S50・200級》避難口用

パニック時の避難行動シミュレーション - 名古屋大学traffic.phys.cs.is.nagoya-u.ac.jp/~mstf/pdf/mstf2012-05.pdf全員が避難できた時間（避難時間）は約30

災害対策マニュアルmoriya-youho.wakaba-gakuen.ed.jp/files/bosai/bosai.pdf- 6 - 松前台小学校校 5、避難所・避難場所マップ避難場所大山公園じ難

Kad...内定場ンで面ば日時容：避員：所：北 HUG(のことできたばか避難者のにどれだよいか、避難所主催：地方 Kad 冬の避難

ベクトル総研 S2.避難シミュレーション 141208pm1

鉄道乗車中の津波避難における情報提供・避難誘導に関する一 ...tetsugaku-train.com/wp-content/uploads/2019/04/vol.15... · 2019. 4. 11. · ー18ーを活かした避難誘導ができたこと、③発災から津波

被災地病院における看護の役割 - nanzando.com · ・二次災害の予防・トリアージ・応急処置避難・誘導診療継続の判断・診療継続・避難準備

令和2年6月24日各指定居宅サービス事業所管理者 …/pdf/keikai_level_chirashi.pdf 2．避難確保計画の作成、避難訓練の実施、避難確保計画及び避難訓練の検証

津波避難を想定した避難路、避難施設の配置及び避難誘導に ... · 2013. 5. 9. · る（サンプル数は、個人；10,603人、事業所；985事業所）。調査員により、避難所･仮設住宅･自宅等

エージェントモデル及び強化 学習による災害時の避難誘 導シス … ·...

エージェントモデル及び強化学習による災害時の避難誘導シス … ·...