31
Introduction to Deep Learning @simizut22

Introduction to Topological Data Analysis

Embed Size (px)

Citation preview

Page 1: Introduction to Topological Data Analysis

Introduction toDeep Learning

@simizut22

Page 2: Introduction to Topological Data Analysis

注意:タイトルには誤りがあります

Page 3: Introduction to Topological Data Analysis

登場人物      : 単体法おじさん

       : 僕 ( 画像は llvm)

FF 講義やらない ??

お題とかあるんでしょうか ??

はあ…

一応タイトルは, Deep Learning の紹介ということにしてあるけど

F

F でも,好きなこと話していいよ.Topological Data Analysis でもA∞ とか離散 morse 理論の話になってもいいですか ??   (; ・ `д ・́

)

F えっ,そういう話なの??まぁ,いいんじゃない

Page 4: Introduction to Topological Data Analysis

Introduction toDeep Learning

Topological Data Analysis

@simizut22

Page 5: Introduction to Topological Data Analysis

I’m not Data Scientist,

but C++er…

Page 6: Introduction to Topological Data Analysis

最近の興味• Homotopy Type Theory• Directed Algebraic Topology• Computational Topology

つまり…

Page 7: Introduction to Topological Data Analysis

最近の興味• 型はいいぞぉ!!• 並列化はいいぞぉ!!• 代トポはいいぞぉ!!

Page 8: Introduction to Topological Data Analysis

最近の興味• 型はいいぞぉ!!• 並列化はいいぞぉ!!• 代トポはいいぞぉ!!ついでに… • constexpr はいいぞぉ!!

※ constexpr の読み方は YOMIKATA.org 参照

Page 9: Introduction to Topological Data Analysis

本日の内容• TDA # とは• Persistent Homology• 計算法 (+ 離散 Morse 理論 )• 社会での利用例

Page 10: Introduction to Topological Data Analysis

Topological data analysis # とは• もともとは Edelsbrunner/Letscher/Zomordian が画像認識を行うために Persistent Homology を考えた (*)• 与えられたデータの位相 ( 幾何 ) 的な不変量を用いることで,データの次元削減 /noise の除去などを行う→例えば機械学習の前処理として使える* Edelsbrunner, Herbert, David Letscher, and Afra Zomorodian. "Topological persistence and simplification." Discrete and Computational Geometry 28.4 (2002): 511-533.

Page 11: Introduction to Topological Data Analysis

Topological data analysis # とは• スペクトル系列と関連

スペクトル系列はいいぞぉ!! (*´д` *) ハァハァ

Basu, Saugata, and Laxmi Parida. “Spectral Sequences, Exact Couples and Persistent Homology of filtrations.” arXiv preprint arXiv:1308.0801 (2013). より

Page 12: Introduction to Topological Data Analysis

Topological data analysis # とは• 主な応用分野は以下1. 画像認識2. Manifold learning3. 遺伝子情報解析4. 高分子構造の解析5. 音楽データの解析6. Network(social/ 脳の neuron) の解析7. Sensor network 問題

etcetc…

Page 13: Introduction to Topological Data Analysis

Persistent Homology

定義 (point cloud):有限集合を point cloud という定義 (Vietoris Rips) に対し, で生成される自由加群

Page 14: Introduction to Topological Data Analysis

Persistent Homology

Point cloud : given半径の列 をとると、次の Vietoris Rips 複体の列が得られる → homology の列が誘導される

Page 15: Introduction to Topological Data Analysis

Persistent Homology

定義 (Persistent Homology):包含写像の誘導する準同型とする。p-th Persistent Homology is defined as below:

Page 16: Introduction to Topological Data Analysis

Persistent Homology の表示Persistent Homology は homology class の生成と消滅を表すと言われている。主に使用される図示方法は 以下の 2 つ1. Persistence diagram2. Barcode

Page 17: Introduction to Topological Data Analysis

Persistence Diagram

: betti number: で現れて , で消えるホモロジークラス全体の rank とする i.e.

Persistence Diagram: に重複度 を持たせて書いたもの

Page 18: Introduction to Topological Data Analysis

Persistence Diagram

Page 19: Introduction to Topological Data Analysis

計算方法 ( 体係数の時 )

次の operator を : inclusion の拡張で与える考える係数体を としたとき、Boundary を多項式環 module の準同型として考える。この ( 多項式環係数 ) 行列の smith-normal form を用いる

Page 20: Introduction to Topological Data Analysis

補足 : smith normal form

PID 係数の 行列 の smith-normal form とは正則行列 , を用いて,

Page 21: Introduction to Topological Data Analysis

計算方法上の algorithm + 行列の reduction を用いることで、計算量を抑えている。一般の環係数に対して、最悪計算量はMilosavljevic 等は体係数の Persistent Homology を行列積 order で計算をしている (*)現状 が知られている* Milosavljević, Nikola, Dmitriy Morozov, and Primoz Skraba. "Zigzag persistent homology in matrix multiplication time." Proceedings of the twenty-seventh Annual Symposium on Computational Geometry. ACM, 2011.

Page 22: Introduction to Topological Data Analysis

離散 Morse 理論• 離散 morse 理論を用いて、単体複体を小さくすることで計算量を抑えることを考える• 離散モース理論:単体複体 上の関数 が morse 任意の単体 に対し

Page 23: Introduction to Topological Data Analysis

離散 Morse 理論単体複体 の単体 が morse 関数 の臨界点(critical point)

類似:多様体に対する morse 理論では morse 関数の臨界点に応じて、多様体の cell 分解を行った…

Page 24: Introduction to Topological Data Analysis

離散 Morse 理論定理 ( 基本定理 )単体複体 上にモース関数 が存在⇒ の p- 次の臨界点に対応した p- 次のセルを持つ CW 複体と homotopy 同値になる の臨界点から生成される自由加群以下が分かるで は chain 複体。これを morse 複体というこれは homology を保っている。

Page 25: Introduction to Topological Data Analysis

離散 Morse 理論• の homology の計算例 上の morse 関数を以下の図で与える。

2

3

1

1 23

t

e

e

Page 26: Introduction to Topological Data Analysis

離散 Morse 理論 ( 例 )

• これの morse complex は次で与えられるこれより、

Page 27: Introduction to Topological Data Analysis

離散 Morse 理論 (Filtered ver.)

• Mischaikow, Konstantin, Nanda は離散モース理論 (Morse complex) の理論を filtered complex に拡張し ,Persistent Homology の計算の効率化を行った (*)

• filtration に適合した morse complex は元の複体と同じ Persistence Diagram を与える(*) Mischaikow, Konstantin, and Vidit Nanda. "Morse theory for filtrations and efficient computation of persistent homology." Discrete & Computational Geometry 50.2 (2013): 330-353.

Page 28: Introduction to Topological Data Analysis

離散 Morse 理論 (Filtered ver.)

以上の方法計算量に使う値を定義する cell の個数 (input size) i- 次元のセルの個数 morse complex のセルの個数 (output)

i.e.  

Page 29: Introduction to Topological Data Analysis

離散 Morse 理論 (Filtered ver.)

一般の体係数に対しては、 filtered morse 理論を用いた際の計算量はまた、体係数ではに削減できる。

詳細:略 (´;ω; ` )

Page 30: Introduction to Topological Data Analysis

社会での実用例• Fujitsu が TDA を利用したサービスをリリース時系列データを高精度に分析する新たなDeep Learning技術を開発• Carlsson 先生が co-founder を務める

Ayasdi 社

Page 31: Introduction to Topological Data Analysis

ZHIEND