55
順位解析とHodge分解 (理論、、応用) 坂田年男 坂田年男 坂田年男 坂田年男 九大 九大 九大 九大 芸工 芸工 芸工 芸工 俊雄 俊雄 俊雄 俊雄 九大 九大 九大 九大 芸工 芸工 芸工 芸工 宮崎充弘 宮崎充弘 宮崎充弘 宮崎充弘 京都教育大 京都教育大 京都教育大 京都教育大 代数統計学に数理統計の新たな展開 代数統計学に数理統計の新たな展開 代数統計学に数理統計の新たな展開 代数統計学に数理統計の新たな展開 つく国際会議場 つく国際会議場 つく国際会議場 つく国際会議場 1月19日-20日 1月19日-20日 1月19日-20日 1月19日-20日

順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

Embed Size (px)

Citation preview

Page 1: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

順位データ解析とHodge分解(理論、アルゴリズム、応用)

坂田年男坂田年男坂田年男坂田年男 九大九大九大九大 芸工芸工芸工芸工角角角角 俊雄俊雄俊雄俊雄 九大九大九大九大 芸工芸工芸工芸工宮崎充弘宮崎充弘宮崎充弘宮崎充弘 京都教育大京都教育大京都教育大京都教育大

代数統計学による数理統計の新たな展開代数統計学による数理統計の新たな展開代数統計学による数理統計の新たな展開代数統計学による数理統計の新たな展開つくば国際会議場つくば国際会議場つくば国際会議場つくば国際会議場1月19日-20日1月19日-20日1月19日-20日1月19日-20日

Page 2: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

Topological Data Analysisの一部として位置づけ

1.TDAの簡単な紹介

(目的、人物、文献)

2.TDAの統計への応用の紹介

2.1 順位データとHodge分解

2.2 多様体M上の点データからMを知る

2.3 多様体M上の関数(回帰、密度)

2.4 判別、MDS,クラスタリングの新しい視点

Page 3: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

Topological data analysis

� 多様体上のデータから多様体の幾何学的

特徴を抽出する

□多様体上の関数データから関数の性質を知る

□ グラフ(ネットワーク)の幾何学的特長を抽出する

手法:複体のHOMOLOGY理論、複体の上昇列とPersistent Homology, MORSE理論

などを使う

Page 4: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

位相幾何学の特徴が生きる場面(G.Carlsson:Topology and Dataより)

� 定量的よりも定性的情報が重要な場合定量的よりも定性的情報が重要な場合定量的よりも定性的情報が重要な場合定量的よりも定性的情報が重要な場合

� 距離が理論的に正当化されない場合距離が理論的に正当化されない場合距離が理論的に正当化されない場合距離が理論的に正当化されない場合

(生物学における類似性など)(生物学における類似性など)(生物学における類似性など)(生物学における類似性など)

□□□□ 座標が自然でない場合座標が自然でない場合座標が自然でない場合座標が自然でない場合

□□□□大量データの定性的な要約がパラメータの具体的値大量データの定性的な要約がパラメータの具体的値大量データの定性的な要約がパラメータの具体的値大量データの定性的な要約がパラメータの具体的値

よりも重要(パラメータの変化に対するモデルの定性よりも重要(パラメータの変化に対するモデルの定性よりも重要(パラメータの変化に対するモデルの定性よりも重要(パラメータの変化に対するモデルの定性的変化に関心がある)的変化に関心がある)的変化に関心がある)的変化に関心がある)

Page 5: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

TDAにおける道具

� グラフ理論

� 単体的複体(点、直線、三角形、四面体、、、の集合)

� Homology 代数(loopの分類ができる)

� Parsistent Homology(複体の上昇列に対するHomologyの変化を表現)

� モース理論 レベル空間{f1=<c}の性質を調べる。臨界点cでのみ位相構造が変わる

Page 6: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

多様体Mの有限点列データからMを知る

� 多様体M�点データ{x1,x2,…,xn}=>

単体複体の構成、例えば、

Vietris-Rips複体: k-部分集合の全ての点間相互距離がepsilon以下�k-単体をなすと定義した複体

単体的複体Fと多様体MがHomotopyequivalent�Mの代わりにFを調べればよい

Page 7: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

TDAの研究者群

� G.Carlson(Topology and Data Bull.AMS2009,v0l29,255-308),

� G.Carlson (Talk:Persistent homolog and high dimensional data analysis)

� A. Tausz and G. Carlson(APPLICATIONS OF ZIGZAG PERSISTENCE TO TOPOLOGICAL DATA ANALYSIS(Arxiv.Org/pdf/1108.3545)

� R.Christ(Barcodes:The persistent topology of data, Bull. Amer. Math. Soc. 45 (2008), 61-75 )

� V. de Silva and R. Ghrist, (Coordinate-free coverage in sensor networks with controlled boundaries via homology,International Journal of Robotics Research, vol25 Issue 12,2006)

� A.Zomorodian (Computing parsistent homology,Discrete & Computational Geometry,33,2,2005)

� P. Bubenik and P.Kim(A statistical approach to persistent homology,Homology,Homotopy, and Applications,9,2,337-362,2007)

� P. Bubenik(Several talks:Multivaraite TDA(2008),Estimating the topology of functions on manifolds from noisy data(2009), Nonparametrix regression for topology, applied to brain imaging data(2010),Persistent homology and statistical inference:Persitentlandscape(2012)

Page 8: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

� P. Bubenik他(Statistical topology via Morse theory persistency and nonparametric estimation,Algebraic methods in statisitics and probability II.comtemporary mathematics,516,75-92,2010)

� M.K.Chung, P. Bubenik, P.Kim(Persistence Diagrams of Cortical Surface DataLecture Notes in Computer Science, 5636 (2009), 386-397)

Page 9: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

統計との関連性のある話題

� 方向データ(球面データ)と回帰

� 方向データ(球面データ)と密度推定

� MDS,クラスタリング、判別の新しい視点を

与える可能性

まだあまり多くの実用例はないが、

○糖尿病患者の判別

○肺がん患者の画像診断

○ネットワーク解析

Page 10: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

統計的応用の文献

� J. Gamble and G.Heo, (Exploring uses of persitent homology for statistical analysis of landmark-based shape data, J.MultivariateAnalysis,2010,vol.101,pp.2184-2199)

� M.Lee 他(Comarison of Pattern detection methods in microaaray time series of the segmentation clock, Plos one open access journal,2008)

� G. Sign 他(Topological Methods for the Analysis of High Dimensional

Data Sets and 3D Object Recognition、2007)

□□□□ Monica Nicolau1, Arnold J. Levine2, Gunnar Carlsson(Topology based data analysis identifies a subgroup of breast cancers with a unique mutational profile and excellent survival((((Proc Natl Acad Sci U S A. 2011 Apr 26;108(17):7265-70. Epub 2011 Apr 11.)

Page 11: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

Hodge decompositionの文献� Xiaoye Jiang � Lek-Heng Lim � Yuan Yao �Yinyu Ye((((Statistical ranking and

combinatorial Hodge theory、、、、Math. Program., Ser. B (2011) 127:203–244)。

� Zhanglong JI, Yang AN, Ying CHEN, Yuan YAO, Jun XU, Hang LI(Hodge decomposition of paird camparison flows in Click-through data. Tech Report, appeared in The 6th Joint Workshop on Machine Perception and Robotics (MPR), Fukuoka, Japan, 2010.)

� Qianqian Xu, Qingming Huang, Tingting Jiang, Bowei Yan, Yuan Yao, and Weisi Lin, (HodgeRank on Random Graphs for Subjective Video Quality Assessment, IEEE Transactions on Multimedia, submitted.)

� Qianqian Xu, Tingting Jiang, Yuan Yao, Qingming Huang, BoweiYan, Weisi Lin. (Random Partial Paired Comparison for Subjective Video Quality Assessment via HodgeRank. ACM Conference on Multimedia (MM), 2011.)

� L.J. Grady and J.R.Polimeni(Discrete Calculus, Springer, 2010)

Page 12: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

TDAの一つとしての対比較のの一つとしての対比較のの一つとしての対比較のの一つとしての対比較のHODGE 分解分解分解分解(Xiaoye Jiang � Lek-Heng Lim � Yuan Yao �Yinyu Ye

((((Statistical ranking and combinatorial Hodge theoryからからからから)

� 対比較の順位データは古から統計解析の対象である対比較の順位データは古から統計解析の対象である対比較の順位データは古から統計解析の対象である対比較の順位データは古から統計解析の対象であるが、最近でも会社の格付けデータやWEBのページラが、最近でも会社の格付けデータやWEBのページラが、最近でも会社の格付けデータやWEBのページラが、最近でも会社の格付けデータやWEBのページランクどの分野で議論がンクどの分野で議論がンクどの分野で議論がンクどの分野で議論が活発なデータ形式である。活発なデータ形式である。活発なデータ形式である。活発なデータ形式である。

2011年のJian-Lim-Y2011年のJian-Lim-Y2011年のJian-Lim-Y2011年のJian-Lim-Yan-Yeの論文は順位-Yeの論文は順位-Yeの論文は順位-Yeの論文は順位データ解析にHodge分解が利用できることを示した。データ解析にHodge分解が利用できることを示した。データ解析にHodge分解が利用できることを示した。データ解析にHodge分解が利用できることを示した。

� 本稿は本稿は本稿は本稿はJ-L-Y-Yの理論の概要を紹介し、作成したRの理論の概要を紹介し、作成したRの理論の概要を紹介し、作成したRの理論の概要を紹介し、作成したRとASIRによる解析プログラミングについてコメントすとASIRによる解析プログラミングについてコメントすとASIRによる解析プログラミングについてコメントすとASIRによる解析プログラミングについてコメントする。また、それを用いて、具体的なデータについて理る。また、それを用いて、具体的なデータについて理る。また、それを用いて、具体的なデータについて理る。また、それを用いて、具体的なデータについて理論を適用した結果について紹介する。論を適用した結果について紹介する。論を適用した結果について紹介する。論を適用した結果について紹介する。

� 最後に研究の最新の動向についても紹介する最後に研究の最新の動向についても紹介する最後に研究の最新の動向についても紹介する最後に研究の最新の動向についても紹介する

Page 13: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

データを読む

� データの意味を摑む為に、データを意味のある空間へ射影し分解することはデータ解析の基本的な手法である。

� HODGE分解もそのような理論の一つである。適用されるのは対比較データである。

目的は対比較=大域一致順序(Gradiant flow)

+局所一致かつ大域不一致(curl=0, div=0)+大域不一致かつ局所不一致(curl div=0 )

に分解することである。

0≠

Page 14: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

対比較データのグラフ表現

� 頂点集合(比較対象)

� 辺(対比較の実施された対)

}{1,2,...,V n=

12222

3333

4444

}{{ }{ }{ }{ }1, 2 , 1,3 , 1, 4 , 3, 4Edge =

Page 15: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

辺の値=評価値の差

� 辺の値=番号の高い方の対象の評価値ー 番号の低い方の対象の評価値

� 2は1より2低い、3は1より1高い、4は1より

3高い、 4は3より2高い

1111

2222

3333

4444

-2

Page 16: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

対比較グラフの交代行列表現

� 対比較グラフに対して交代行列Xを対応させる。

� 辺 に数値aが

乗っている場合

� jの評価がiよりaだけ高い、iの評価がjより

aだけ低いので、X(i,j)=a,X(j,i)=-aと定め

比較されていない対の場合は0と置くと対比較辺グラフは交代行列Xと対応する。

{, }, ,i j i j<ただし

Page 17: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

関数空間 とgrad()作用素� 頂点集合V上の関数の全体を で表す。ベクトル=s(s1,s2,�,sn)の全体とも考えられる。

で作用素 を定めgrad()と呼ぶ。内積を以下で定める

注意: Im(grad)は大局的一致評価の全体を表す。

0C

0C

0 1

0

0

( ) :

[ ]( , ) ( ) ( )

grad C C

s i j s j s i

δ

δ

= −

0, ( ) ( )i V

s t s i t i∈

< > = ∑

Page 18: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

交代行列の空間を関数の空間 とみる

� 交代行列の空間はまたVxV上の関数空間とみなせる

� 任意の重み関数W=(Wij), Wij>0により、

内積を以下のように定める。

{ }1 | ( , ) ( , ), ( , ) 0C X X i j X j i X i i= = − =

{ }1, ,, ( , ) ( , ) ( , )

W i j EdgeX Y W i j X i j Y i j

∈=∑

1C

Page 19: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

関数空間 とcurl()作用素

� VxVxV上の関数の中で

を満たし、その他では0 となるものの全体を で表す。

所謂、交代テンソルの全体とも考えられる。Curl写像を以下で定める

2C

2C

1 2

1

1

( ) :

[ ]( , , ) ( , ) ( , ) ( , )

curl C C

X i j k X i j X j k X k i

δ

δ

= + +

( , , ) ( , , ) ( , , ) ( , , )

( , , ) ( , , )

i j k j k i k i j j i k

i k j k j i

Ψ = Ψ = Ψ = −Ψ

= −Ψ = −Ψ

{ , , } ( )i j k T E∈すべての に対し、

Page 20: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

辺の3角形の集合 T(E)

� ただし、前頁のT(E)を次のごとく定めている。

� の内積を以下で定める。

( ) {{ , , }||{ , },{ , },{ , } }T E i j k i j j k k i E= ∈2C

1 2 2 1 2

{ , , } ( )

, ( , , ) ( , , )i j k T E

i j k i j k∈

<Θ Θ > = Θ Θ∑

Page 21: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

写像が定める のHODGE分解

� 次の写像の連鎖を考える。

� ここで, は次で定める。

* * *10 01( )( ) ( )( )

0 1 2 1 0curlgrad divcurl

C C C C Cδδ δδ −

→ → → →

*

0 1, 0 0

*

1 2 1 1,

, ,

, ,

W

W

s X s X

X X

δ δ

δ δ

< > =< >

< Θ > =< Θ >

* *

0 1,δ δ

1C

Page 22: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

基本関係式

� よって、

� また、

� より

*

0 0Im( ) Im( ) ( ) ( )grad Ker Ker divδ δ⊥ ⊥= = =

1 *

0 0Im( ) ( ) Im( ) ( )C Ker grad Ker divδ δ= ⊕ = ⊕

1 * *

1 1( ) Im( ) ( ) Im( )C Ker Ker curl curlδ δ= ⊕ = ⊕

*

1 1Im( ) Im( ) ( ) ( )curl Ker Ker curlδ δ⊥ ⊥= = =

Page 23: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

証明

� 定義より � 左を使う

* *

1 0 0 1( ) 0 , ( ) 0δ δ δ δ= =

[ , ] [ , ] [ , ]

( [ ] [ ]) ( [ ] [ ])

( [ ] [ ])

0

Y i j Y j k Y k j

s j s i s k s j

s i s k

+ +

= − + −

=

1 0

*

0 1

* *

0 1

* *

0 0

* *

0 0

( ), 0, ,

( ), ( ) 0, ,

, ( ) 0, ,

( ) 0,

0

s T s T

s T s T

s T s T

T T

δ δ

δ δ

δ δ

δ δ

δ δ

< >= ∀

< >= ∀

< >= ∀

= ∀

=

Page 24: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

基本関係式の証明

最初の等号 � 2番目の等号

0 0

*

0

*

0

* *

0 0

Im( ) ( ), 0,

, ( ) 0,

( ) 0

( ) ( )

X s X s

s X s

X

X Ker

δ δ

δ

δ

δ δ

⊥∈ ⇔< >= ∀

⇔< >= ∀

⇔ =

⇔ ∈

*

1

*

1

1

1

1

Im( )

, ( ) 0,

( ), 0,

( ) 0

( )

X

X T T

X T T

X

X Ker

δ

δ

δ

δ

δ

⊥∈

⇔< >= ∀

⇔< >= ∀

⇔ =

⇔ ∈

Page 25: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

のHODGE分解

� 次の包含関係が成り立つ

� これより次の表現が導かれる

*0, 0

Im( ) ( ), Im( *) ( ).

curl grad div curl

grad Ker curl curl Ker div

= =

⊆ ⊆

� � より

( ) ( ) (Im( ) Im( ) )

( ) (Im( ) ( ))

Im( )

Im( )

( ( ) (

(

))

Ker curl Ker curl grad grad

Ker curl grad K

Ker curl Ker div

er div

grad

gra Harmonid c

⊥= ⊕

= ⊕

= ⊕

= ⊕

定議)

1C

Page 26: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

のHodge分解

� よって、次のHodge分解を得る。

� Hamonic順位は(1)任意の三角形で無矛盾で

(2)任意の頂点でinflowの値とoutflowの和が0であることは次の式からわかる。

1 *

*

Im( ) Im( )

Im(

(

) Im

(

(

( )

)

))C grad curl

gra

Ker curl Ker div

Harmonicd curl

= ⊕ ⊕

= ⊕ ⊕

1C

{ }. . ,

( ) [ ] [ , ] [ , ]j s t i j Y

d i v Y i W i j Y i j∈

= ∑

Page 27: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

Ker(curl)の部分空間:Harmonic

� Ker(curl)は任意の3角形でflow sum=の空間。これはすべての3角形で局所無矛盾な順位。

さらに、 curl ◎ grad=0

より、

よって、局所無矛盾で大域矛盾な順位が

局所無矛盾なKer(curl)に含まれる。それが、

Im ( ) ( )grad Ker curl⊆

†( ) Im( ) ( ) ( )Ker curl grad Ker curl Ker div=∩ ∩

Page 28: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

3つの部分空間への分解の意味

� 対比較データを3通りに分類する。

1)ある一つの評価関数で順位が決まっているもの=大局一致評価(順位)

2)局所無矛盾であるが大局一致評価ではない

3)ある3辺での評価で局所不一致な評価

Im( )grad⇒

( ) ( )Ker curl Ker div⇒ ∩

*Im ( )cu r l⇒

Page 29: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

HODGE分解の図式

統計学的意味

大域一致(Im(grad)

局所一致(Ker(curl))

局所一致かつ大域不一致

大域不一致かつ局所不一致

局所不一致(Ker(Curl)に直交)

大域不一致( Im(grad)に直交)

Im( )grad ⊥

Page 30: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

例 大局一致評価

� S=(2,1,3,4)による大局一致評価

1111

2222

3333

4444

-1-1-1-1

1111

1111

2222

Page 31: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

局所一致であり大局不一致な評価

� s=(0,1,2,4,5)は{2,3、4,5}で矛盾

� T(E)={1,2,5}で無矛盾

1111

2222

3333

4444

5555

1111

55556666

1111

22221111

Page 32: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

対比較の交代行列表現

[,1] [,2] [,3] [,4] [,5]

[1,] 0 1 0 0 6

[2,] -1 0 1 0 5

[3,] 0 -1 0 2 0

[4,] 0 0 -2 0 1

[5,] -6 -5 0 -1 0

Page 33: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

観測および推定された大局一致評価

Page 34: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

Harmonic flow

Page 35: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

局所不一致(したがって大局不一致)評価

� s=(0,1,2,4,5)は{1,5}、{2,5}で矛盾

� T(E)={1,2,5}で矛盾

1111

2222

3333

4444

5555

1111

33336666

1111

22221111

Page 36: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

Edge flow and Gradiant flow

Page 37: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

Harmonic Flow and Im(Curl*)

Page 38: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

考える空間

� 対比較データ� 対比較グラフ�交代行列

V={1,2,3,4}人の対比較を考える。

i<jの評価の差Sj-Siをi-jを結ぶ返上に書く

411111111

1111

2222-2

2222

-1

Page 39: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

注意1

� すべての交代行列が一つの評価関数sによってY[i,j]=s[j」-s[i]

によって得られるとは限らない。この場合は特殊なケースで、大局的一致性がある対比較データといえる。

δ0: C0 � C1を δ0[s](i,j)=s[j]-s[i]によって定め, gradiant 作用素とよぶと大局一致性のある対比較は Im(δ0) に属するもの。

Page 40: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

局所一致性� 任意の対比較の間の3角形関係を論じる空間を考える。� T(E)={ (i,j,k)| {i,j},{j,k},{i,k}がすべて対比較グラフの辺である(比較が行われた)}

C2=VxVxVの上の3変数関数X(i,j,k)で*) X(i,j,k)=X(j,k,i)=X(k,i,j)=-X(j,i,k)=-X(k,j,i)-X(i,k,j) When (i,j,k) in T(E)

X(I,j,k)=0 When (i,j,k) not in T(E) を満たす関数のクラスを考える

δ1:C1 �C2を

δ1[X](i,,j,k)=X(i,j)+X(j,k)+X(k,i)を定める. これをCurl 写像とよぶ1) δ1の像は*)を満たす。即ち, C2に属する2) 局所一致性を持つ比較はδ1のkernelに属する。

Page 41: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

大域的一致性のある順位の最小2乗近似

の正規方程式は

であり、解は

ここで、

0 1,min || ( ) || Ws C

grad s Y∈

0 ( )s div Y∆ = −

0 ( )s div X+= −∆

*

0 0 0 0,div grad Moor Penrose g inverseδ δ +∆ = =− ∆ − −� � は  

Page 42: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

証明

行列表現を使う

0 , 1

0 0 0 0 0

* *

0 0 0

* *

0 0 0

t t

C C

s

s

s

δ

=

=

に お け る 基 底 を 固 定 し て

の 表 現 行 列 を D と す る と

<Y- D s , Y - D s > = < Y , Y > - 2 < Y , D > + < D s , D s >

< Y , Y > - 2 < D Y , > + < D D s , s >

< Y , Y > - 2 ( D Y ) + s D D s

で あ る か ら 通 常 の s に 関 す る 偏 微 分 で

最 小 化 す れ ば 正 規 方 程 式 が 従 う

Page 43: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

第2の最小2乗法

� Rを大域順序による残差をRとして、

への射影を求めるには次の最小2乗問題を解

ばよい。

正規方程式は

2 2

* *

2, 2,{ } { }min || || min || ||W WC C

R curl X curlΨ∈ Ψ∈

− Ψ = − Ψ

* *

1Im( ) Im( )curlδ =

*

* *

Im( )P ( ) ( ) ( )

() :

roj curlX curl curl curl curl X

Moore Penrose Inverse

+

+

=

*

0 1 1 0( ), ( ) ( ), 0s T s Tδ δ δ δ< >=< >=� であるから

Page 44: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

Harmonic 空間の特徴付け

� 命題

� Hermholz作用素を

で定めると

* *

1 1 1 0 0δ δ δ δ∆ = +

*

1 1 00 ( ) ( )X X Ker Ker Hδ δ∆ = ⇔ ∈ ∩ =

Page 45: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

証明

� 補題

(1)の証明

*

0 0 0 0

* * *

1 1 1 1

(1) ( ) 0 ( ) 0

( 2 ) ( ) 0 ( ) 0

s fo r s

fo r

δ δ δ δ

δ δ δ δ

≠ ≠

Φ ≠ Φ ≠

*

0 0 0 0

* *

0 0 0 0

*

0 0 0

( ) 0, ( ) 0

( ) ( ) Im( ) {0}

( ) ( ) Im( ) {0}

s s

s Ker

s Ker

δ δ δ δ

δ δ δ δ

δ δ δ

≠ =

⇒ ∈ ∩ =

⇒ ∈ ∩ =

で矛盾

Page 46: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

証明

(2)の証明

* * *

1 1 1 1

* *

1 1 1 1

* *

1 1 1

( ) 0, ( ) 0

( ) ( ) Im( ) {0}

( ) ( ) Im( ) {0}

Ker

Ker

δ δ δ δ

δ δ δ δ

δ δ δ

Φ ≠ Φ =

⇒ Φ ∈ ∩ =

⇒ Φ ∈ ∩ =

で矛盾

Page 47: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

命題の証明

は自明だから、その逆を示せばよい。そのために

のとき、

を示せばよいが、補題より明らかである。

*

1 0 1( ) ( ) ( )Ker Ker Kerδ δ∩ ⊆ ∆

*

1 00 ker( ), 0 ker( )X or Xδ δ≠ ∉ ≠ ∉

1 0X∆ ≠

Page 48: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

Harmonic 空間への射影

を用いて、harmonic spaceへの射影は

で与えられる。

* *

1 1 1 0 0 ,δ δ δ δ∆ = +� �

1 1( )I Y+−∆ ∆

Page 49: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

R-program

� Hodge分解を得るために(2つの最小2乗法を解くために)は写像

およびそれらの共役写像

の基底を定めた行列表現が必要である。また、写像

の行列表現とそれらの

Moor-Penrose一般逆行列も必要である。

0 1 2, ,δ δ δ

* * *

0 1 2, ,δ δ δ

1 2,∆ ∆

0 1,∆ ∆

Page 50: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

R-program(続き)

幸いなことに、

1)直交基底の計算、

2)写像の行列表現、

3)一般逆行列計算

4)対比較グラフの描画

はRのプログラムで簡単に実現できる出来る

ことは有難い。グラフも簡単に描ける利点がある。

注)共役写像は転置行列与えられる。

Page 51: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

4年生の卒業研究(坂田研:劉茜)

� 天神商店街のデパート

岩田屋、大丸、岩田屋、パルコ、イムズ

� 博多駅商店街のデパート

阪急、アミューズ

� キャナルシティ商店街

に対する対比較アンケート(50名)データに対

する大域的順位の付与を試みた

Page 52: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

今後の展開

� 高次の関数空間 の導入と

意味づけとRによる分解プログラムの作成

□□□□更なる実データの解析とRプログラム群の充実

□□□□正規分布の平均値に対する多重比較へ適用した場合の性能のシミュレーション

□□□□TDAの統計への応用、理論を統計家の立場で

深める

, 3kC k ≥

Page 53: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

実際問題への応用

Page 54: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

大域的評価結果

� 岩田屋 13.111111

� 三越 10.000000

� 大丸 13.777778

� 阪急 -11.555556

� アミュ -1.777778

� キャナル -14.222222

� パルコ -8.444444

� 天神コア 1.555556

� イムズ -2.444444

Page 55: 順位ヅヺソ解析とHodge分解 (理論、゠ラゲヨジ …park.itc.u-tokyo.ac.jp/atstat/kakenhi/120120tsukuba/...+局所一致かつ大域不一致(curl=0, div=0) +大域不一致かつ局所不一致

結 語

� 位相幾何学的データ解析(TDA)の分野が発展しつつあることを紹介した。

� 順位分解にHODGE分解理論を使うという

最新の話題について詳しく紹介した

Rープログラムによっていくつかの対比較グラフについてHODGE分解をグラフ化した。

□□□□ 今後、順位分解についての統計へのさらなる今後、順位分解についての統計へのさらなる今後、順位分解についての統計へのさらなる今後、順位分解についての統計へのさらなる応用が考えられる。また、TDAについても応用が考えられる。また、TDAについても応用が考えられる。また、TDAについても応用が考えられる。また、TDAについても

同様である。同様である。同様である。同様である。