目的
時系列画像データベースから時間空間変動パターンを抽出する手法を確立 自己組織化マップ( SOM) による画像系列を記号
系列に変換 隠れマルコフモデルによるモデル化
気象画像に対して適用し、その有用性を調べる
HMM :隠れマルコフモデル
確率的な状態遷移と確率的な記号出力を備えた計算機の数学的モデル:オートマトンの一種
「光陰矢の如し」
品詞という状態が隠れている・・・【隠れ】
「時蝿は矢を好む」
Time flies like an arrow.
品詞:状態,単語:出力記号
名詞 , 動詞 , 前置詞 , 冠詞 , 名詞名詞 , 名詞 , 動詞 , 冠詞 , 名詞
隠れマルコフモデル(推定問題)
(1) Q ={ q 1 , ・・・ ,qN }:状態の有限集合(2)∑={ o1, ・・・ ,oM}:出力記号の有限集合(3) A ={aij } :状態遷移確率分布(4) B ={bi(ot)} :記号出力確率分布(5) π ={ πi } :初期状態確率分布 5項組M=(Q,∑,A,B,π)
出力記号系列 O から、 P(O|M) を最大にするようなモデル M を求める
問題[ バウム・ウェルチアルゴリズム ,EM アルゴリズム ]
推定問題
画像系列→記号
季節など→状態
実験条件
使用する画像データ・ 1997 年~ 2000 年の 1 月1日~12月31日の画像・気象衛星ひまわりによる日本上空の赤外画像(雲
画像)・高知大 , 菊地研究室でアーカイブ・計1335枚(欠損あり)・画像の記号系列の変換 クラスタ化・・・二段階ブロック化自己組織化マップ ( KATAOKA 1997)
クラスタリング結果
0 1 2 3 4 5
6 7 8 9 10 11
12 13 14 15 16 17
18 19 20 21 22 23
24 25 26 27 28 29
30 31 32 33 34 35
0,1,1,2,4,・・・・
実験
・隠れマルコフモデルによるモデル化・バウム・ウェルチアルゴリズム, EM アルゴリズムに
よってパラメータ推定・入力記号系列:クラスタの記号系列を 28 日ごとにセグ
メント化 [95 個 ]・状態数は2~8の変動パラメータとする。
モデルのパラメータの推定(状態遷移確率 , 記号出力確率 , 初期状態確率)
BIC (ベイズの情報量基準)による状態数選択
BIC ‐= 2 (最大対数尤度)+ dklogn (dk:モデルの自由度 n: 出力記号数)
情報量基順のモデルの妥当性検証(学習データ28日)
10000
11000
12000
13000
14000
15000
16000
17000
0 2 4 6 8 10
状態数
情報
量基
準
BIC
BIC が小→もっともらしい
モデル
まとめ、今後の課題
考察・ 自己組織化マップによるクラスタリングと、隠れ
マルコフモデルによって時間空間変動パターンに関する知識を抽出することができた。
・ BIC (ベイスの情報基準)より、状態数が5,6のときがモデルに適していることが分かった。
課題 ・本研究のシステムを使い、他のもっと複雑な時系列
画像においても適用して有用性を確認する。
情報量基準
情報量基準の状態の妥当性検証(14日)
10000
11000
12000
13000
14000
15000
16000
17000
0 2 4 6 8 10
状態数
情報
量基
準
BIC
情報量基準
情報量基準のモデルの妥当性検証(学習データ14日)
10000
11000
12000
13000
14000
15000
16000
17000
0 2 4 6 8 10
状態数
情報
量基
準
AICBIC
画像
システム概要
SOM 学習1 2 3 4 5 6
7 8 9 ・・
・.
・・・
36
クラスタリング
パラメータ推定
EM アルゴリズム
バウム ウェル・チアルゴリズム
データ
AIC,BIC
HMM知識発見
記号系列 ABC を出力する状態遷移系列は?
S1- S3- S2, S2- S1- S2,
S2- S3- S2 の3種類。それぞれの確率は、
0.8×0.2×0.5×1.0×0.4×0.5 = 0.016
0.2×0.5×0.1×0.8×0.5×0.5 = 0.002
0.2×0.5×0.5×1.0×0.4×0.5 = 0.01
よって隠れマルコフモデルが ABC を出力する確率は三つの合計 0.028 となる
記号 ABC を出力する確率
状態遷移系列を求めたい!! S2
0.2
S10.8
S 30.0
0.50.5
0.4
0.5 0.1 0.
3
0.3
5.0:
5.0:
C
A
8.0:
2.0:
B
A
0.1:
0.0:
B
A
0.4
時系列気象画像のクラスタ ID
状態数2~8までにおいての最適なモデ
ル
最適な状態遷移系列ビタビ・アルゴリ
ズム
モデルのパラメータ推定には、バウ
ム・ウェルチアルゴリズム、 EM アルゴ
リズムを
使用
隠れマルコフモデル
画像データの説明
ヒストグラムを用いた二段階 SOMStep1: 時系列気象画像をm ×nに 分割するStep2: 分割された画像を自己組織化 マップによって学習させるStep3: 学習データのクラスタ ID の ヒストグラムをつくるStep4:ヒストグラムを再び自己組織
化 マップにかけ学習するStep5 :学習データが集合し、クラ
スタ に分けられる
時系列気象画像 SOM
SOM
1 2 3 4 56 7
・・・・・・・・・・・・・
実験
・隠れマルコフモデルによるモデル化EM アルゴリズムによってモデルのパラメータ推定☆学習データとなる記号系列が必要である。今回本研究では、時系列気象画像のクラスタ IDを 97年から 00年まで1月 1日~ 12月 31日の順に並べ、記号系列とし、それぞれの年度は独立させる学習データとし、さらに2週間( 14日)と4週間(28日)に分け、2週間に対しては後半の一週間を次の系列の初めの一週間となるようにする。 (例:“ 13243433453213”→“34532133245671”)同じように4週間に対しては後半の二週間を次の系列の初めの二週間となるように反復させ、それぞれの14日、28日を独立させた記号系列を学習データとした。この学習データにより、モデルのパラメータを推定した
AIC,BIC
AIC (赤池の情報量基準) BIC (ベイスの情報量基準) :情報量基準によるモデルの妥当性検証
AIC ‐= 2 (最大対数尤度)+2 dk*
BIC ‐= 2 (最大対数尤度)+ dk*
*dk :フリーパラメータ= O(O‐ 1)+ O(N-1)+O-1
O: 状態数 N :記号数 n :モデルにかかわる出力記号の数
nlog
状態遷移確率のフリ―パラメータ
記号出力確率のフリーパラメータ
初期状態確率のフリーパラ
メータ
状態遷移系列の復元(ビタビ・アルゴリズム)
・隠れマルコフモデルにおいての最適な状態遷移系列を求めるアルゴリズム
S 1
S3
S2
S1
S2
S3
S1
S2
S3
A B C初期状態
0.0
0.2
0.8
0.2
0.5
0.0
[0.16]
[0.1]
[0.0]
S1→S2=0.5S1→S3=0.5S2→S1=0.1S2→S2=0.4S2→S3=0.5
0.8
0.0
1.0
[0.008]
[0.0]
[0.08]
0.5
0.0
[0.016]
ビタビ・アルゴリズム
最大の確率が得られた地点から太い矢印を逆向きにたどる
と
S2→S3→S1
従って最適な状態遷移系列は
S 1→ S3→S 2となる
実験結果1 ( 学習データが28日の状態 5 のモデル)
状態2 [0.7] (盛夏)
状態3 [0.19]状態4 [0.24]
状態5 [0.14]
状態1 [0.2] (春 , 秋)
0.02
0.030.87
0.01
0.01
0.94 0.9
0.02
0.910.95
0.85
0.090.25
0.0
状態 6[0.17]