Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
第10章�分類��分類とは,�
こと.��例えば,画像にある地表の被覆物を「市街地」,「農地」,「水域」・・などに分類する.分類の方法には,�
のふたつがある.�
1.�教師なし分類� 1)�教師なし分類とは�
�教師なし分類は,�
�に用いられる.�
この方法はDN値を元に特徴が類似している画素を��������������������������という方法で機械的に分類する.�
2)�クラスター分析��クラスターとは,
をいう.クラスター分析とは,様々な事柄や物など(固体)の間の差異や類似点を調べ,分類するために用いられる統計的手法の一つである(他に判別分析,数量化II類などがある). �クラスター分析では,固体間の類似性を����������
として計測し,類似している(距離の近い)固体同士を集めてクラスターをつくることにより固体の分類を行う.�
距 離�
2.�トレーニングデータと教師付き分類 �
�分類項目を設定するためには,分類の基準を設定することが必要である.そのためには,各分類項目の母集団の特徴を知る必要がある.
�������������������とは,分類項目の明らかな画像中の領域から取り出したデータのことであり,トレーニングデータから母集団の統計量を計算し,画像に含まれる各画素を類似度によって分類クラスに分ける. この方法を������������������������という.
�この方法を適用するためには,画像にどのような対象物が含まれているかを予め知っておく必要がある.画像に含まれる対象物がはっきりしない場合は利用できない.�
例えば,画像上のある領域が,「農地」であることが現地調査でわかっているような場合には,「農地」の領域にあるデータの統計量を計算し,類似した場所が画像上の他の場所にあれば,そこを「農地」に分類する.�
分類の精度はトレーニングデータをいかに正確に取得するかにかかっている.�
教師付き分類法には,以下の方法がある.�
3.�教師付き分類法�
・その他�
3.1�レベルスライス法��下の図では,バンドbの値が30より大きいか小さいかによってグループ1とそれ以外に分け,次に,グループ1以外のものを,バンドaの値が25より大きいか小さいかによって二つのグループに分けている.データをある値(のレベル)で分ける(スライスする)方法を�
����������������������という.��この事例では,うまい具合に二次元空間領域上で分類できている.しかし,多くの場合はデータの分布がこれほど単純ではない.�
グループ3
グループ1�
グループ2�
バンドa�
バンドb�
25�
30�
3.2�マルチレベルスライス法�
グループ3
グループ1�
グループ2�
バンドa�
バンドb�
25�
30�
下の図のようなデータ分布では,もはや二次元空間領域で分類することはできない.このような場合はより多くの軸で分類を行うことが必要になる.データを複数の多くのレベルで分割する方法を
�������������������������という.�
マルチレベルスライスの例�
3次元特徴空間の分割例�
4.�ディシジョンツリー法��ディシジョンツリー法は,
である. �比較に用いられる特徴の種類や基準値は現地調査や対象物に関する知見などにもとづいて作成される. �特徴として用いられるものには,スペクトル値,スペクトル値の算術値,主成分などがある.�
�ディシジョンツリー法は,演算のほとんどは大小比較のみであり,分類に要する時間は短かくてすむ.�
5.�最短距離分類法�1)最短距離分類法とは�
距離の表し方にはつぎのようなものがる. ・ユークリッド距離 ・標準化ユークリッド距離 ・マハラノビスの汎距離�
�最短距離分類法とは,画素データと分類クラスの特徴との類似度を特徴空間における距離で表し,その距離の最も短いクラスに画素データを分類する方法である. �バンド1とバンド2が張る2次元空間を示すと右の図のようなる.��クラスの平均値や分散は,トレーニングデータから推定される.�
各クラスの平均�
未知の画素� バンド1�
クラスA�
クラスC�
クラスB�
バンド2�
2)�ユークリッド距離��ユークリッド距離とは,我々が日常的に用いている距離のこと.�ユークリッド距離は次式で表される.�
ここで, X�:画素データベクトル �μk :クラスkの平均値ベクトル�
X=( x1, x2 , ・・, xi ,・, ・, xn )t �
μk= (m1k, m2k, ・,・,mik , ・, ・, mnk)t �
Xiは第iバンドの値�
mikはクラスkの第iバンドの平均値�
=�成分表示すると�
ユークリッド距離(2次元の場合)�
クラス1のバンドbの平均値:mb1
クラス1のバンドaの平均値:ma1
クラス2のバンドbの平均値:mb2
クラス2のバンドaの平均値:ma2
クラス1とXの距離��D12=(x1 - ma1)2+ (x2 - mb1)2 �
クラス2とXの距離��D22=(x1 - ma2)2+ (x2 - mb2)2�
バンドa
バンドb
クラス1
クラス2
未知画素�X=(x1,x2)
x1�
x2�
3)�標準化ユークリッド距離 ��軸方向で母集団の分布のばらつき(分散)の大きさが異なる時,分散の大きい変数(バンド)ほど距離の決定に大きく影響する.�
出典:図解リモートセンシング,日本測量協会�
�未知画素Xは,ユークリッド距離ではクラスBに近い.�
�各クラスのバンドのばらつき(分散)を考慮すると,クラスAへ分類した法が妥当である.�
標準化ユークリッド距離(つづき)��標準化ユークリッド距離とは,ユークリッド距離を各変数の分散で割って正規化した距離のこと.次式で表される.�
ここで, �X�:画素データベクトル ��μk :クラスkの平均値ベクトル ��σk:クラスkに関し,各変数の分散を対角成分にもち,その他の成分がゼロの行列 �
�σk-1 : σkの逆行列�
クラスkの第n変数の分散�
€
σk =
σk11 0σk 22
•
0 σknn
€
X = x1, x2[ ], µk = µk1,µk2[ ]
σ k =σ k1 00 σ k2
σ k
−1 =1/σ k1 00 1/σ k2
(X − µk )t = x1 − µk1( ), x2 − µk2( )[ ]
(X − µk )t ⋅σ k
−1 = x1 − µk1( ), x2 − µk2( )[ ] ⋅1/σ k1 00 1/σ k2
= x1 − µk1( ) /σ k1, x2 − µk2( ) /σ k2[ ]
Dk2 = (X − µk )
t ⋅σ k−1 ⋅ (X − µk ) = x1 − µk1( ) /σ k1, x2 − µk2( ) /σ k2[ ] ⋅
x1 − µk1( )x2 − µk2( )
= x1 − µk1( )2 /σ k1 + x2 − µk2( )2 /σ k2
標準化ユークリッド距離(2次元の場合)�
標準化ユークリッド距離(2次元の場合)�
バンドa
バンドb
クラス1
クラス2 (ma1 , mb1 )�
未知画素�X=(x1,x2)
x1�
x2�
(ma2 , mb2 )�
σ2aa�
σ2bb �σ1aa�
σ1bb �
クラス1とXの距離��D12=(x1 - ma1)2/ σ1aa + (x2 - mb1)2 / σ1bb �
クラス2とXの距離��D22=(x1 - ma2)2 / σ2aa + (x2 - mb2)2 / σ2bb�
4)�マハラノビスの汎距離��母集団の分布は軸方向で分散が異なるだけでなく,各変数の間に相関がある場合がある.�各変数間の分布の相関(共分散)を考量した距離をマハラノビスの汎距離という.�
�マハラノビスの汎距離は,以下の式で表される.�
ここで,���X�:画素データベクトル,��μk :クラスkの平均値ベクトル ��Σk:クラスkに関し,各変数の分散を対角成分にもち,����その他の成分が共分散の行列�
�Σk-1 : Σkの逆行列�
€
Σk =
σk11 σk12 • σk1n
σk 21 σk 22 • •
• • • •
σkn1 • • σknn
6.�最尤分類法��最尤分類法は,
�である.�
バンド2�
クラスA�
クラスB�
バンド1�
未知画素X�
2次元正規分布�
クラスBに対する尤度※�
クラスAに対する尤度※�
未地点画素Xは,距離法ではクラスAに近いが,最尤分類では,クラスBに分類される.�
※尤度とは確率のこと�
7.�分類結果の検討�分類結果の精度や信頼性を確認する.�
出典:図解リモートセンシング,日本測量協会�