カーネル法 - 統計数理研究所fukumizu/ISM_lecture_2004/Lecture...1 カーネル法正定値カーネルを用いたデータ解析統計数理研究所福水健次 2004年11月24~26日公開講座「機械学習の最近の話題」

カーネル法

正定値カーネルを用いたデータ解析

統計数理研究所福水健次

2004年11月24~26日公開講座「機械学習の最近の話題」

Final version Nov26 2004

講義の概要 I1 イントロ－非線形データ解析としてのカーネル法

2 正定値カーネルの基礎正定値カーネルの定義と代表的な例

正定値カーネルと関数空間

3 線形アルゴリズムの非線形化としてのカーネル法正定値カーネルによる非線形化

サポートベクターマシンスプライン平滑化カーネルPCAカーネルCCA

４正定値カーネルの性質正定値性の判定

Bochnerの定理representer定理

講義の概要 II5 構造化データのカーネル

複雑な構造を持つ非ベクトルデータ（ストリングツリーグラフ）の数量化としてのカーネル法

６独立性条件付独立性とカーネル確率変数の独立性条件付独立性の特徴づけ

カーネルICA カーネル次元削減法

7 まとめ

用語に関する注意

「カーネル」という用語は統計学では伝統的にノンパラメトリックな確率密度推定

に用いる密度関数 g(x)の意味に使われることも多い（Parzen windowともいう）

最近では正定値カーネルのことを「カーネル」「カーネル法」と呼ぶことが多いので注意して区別する必要がある

本講義の「カーネル」は後者の意味である

minus=N

1 イントロダクション

このセクションの目的

カーネル法に関して大まかなイメージを持ってもらう

くわしい説明はあとできちんとやる

非線形データ解析としてのカーネル法

非線形データ解析の重要性古典的なデータ解析

データの行列表現

rArr線形の処理（主成分分析正準相関分析線形回帰）

線形で十分か

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

m次元 N点のデータ

-6 -4 -2 0 2 4 6-6

線形識別可能線形識別不能

)2()( 2122

21321 xxxxzzz =

カーネル法の概略

高次元空間への非線形写像データを高次元のベクトル空間（一般には無限次元の関数空間）へ写像し解析しやすいデータに変換する

xiΦ(xi) zi

Ω もとのデータの空間H 高次元ベクトル空間（ヒルベルト空間）

HrarrΩΦ 変換写像

H = 特徴ベクトルの空間（特徴空間feature space）

Φ(x)はデータ xに対する特徴ベクトルと考えることができる

もとの空間 Ω でなく（高次元または無限次元）特徴空間 H でデータ解析を行う

もとの空間 Ωはベクトル空間でなくてもよいrArr データ xはツリーグラフなどでもよい

「カーネルトリック」高次元（無限次元）ベクトル空間 Hにおいて内積が容易に計算できるrArr さまざまなデータ解析手法を H上で適用可能

Support vector machine Kernel PCA Kernel CCA

)()()( jiHji xxkxx =ΦΦ 正定値カーネル

データ xi と xjの類似度を定める

Ωzｊ

２正定値カーネルの基礎

カーネル法で用いられる基礎的な概念を述べる

正定値カーネルの代表的な例を紹介する

正定値カーネルがヒルベルト空間を定めることを説明する

正定値カーネル

正定値カーネルΩ集合k(xy) がΩ上の正定値カーネルであるとは次の２つを満たすことをいう１ (対称性) k(xy) = k(yx)２（正定値性）任意の自然数 n と任意のΩの点 x1 hellip xnに対し

が（半）正定値すなわち任意の実数 c1hellip cnに対し

対称行列のことをグラム行列と呼ぶ

gesum =

ji jiji xxkcc

( )njiji xxk

RrarrΩtimesΩk

( )njiji xxk

= ⎟⎟⎟

⎜⎜⎜

xxkxxk

ntimesn行列

複素数値の正定値カーネル

の場合にも正定値性は以下のように定義される

任意の自然数 n と任意のΩの点 x1 hellip xn と任意の複素数 c1hellip cnに対し

が成り立つときk(xy) を正定値カーネルという

カーネル正定値カーネル正定値カーネルのことを単に「カーネル」と呼ぶ場合も多い

CrarrΩtimesΩk

gesum =

ji jiji xxkcc （は複素共役）jc

正定値カーネルの例

多項式カーネル

ガウスカーネル（RBFカーネル)

Fourierカーネル(複素数値）

正定値性であることはあとでチェックする

dT cyxyxk )()( +=mR=Ω

（ d自然数）0gec

⎟⎠⎞

⎜⎝⎛ minusminus= 2

1exp)( xyyxkσ

mR=Ω（ σ gt 0 ）

mR=Ω )(1)( yxT

eyxk minusminus= ω ( ）mRisinω

ヒルベルト空間の復習(実)ヒルベルト空間ベクトル空間で内積が与えられている

完備性を満たす（rarr 本講義では使わないので説明は省略）

複素ヒルベルト空間も定義されるが以下では実ヒルベルト空間を考える

復習ベクトル空間 V の内積とは次の３条件を満たす

VtimesVrarrR の写像

(1)線形性(2) 対称性

(3) 強正定値性かつ

hghfhgf βαβα +=+ (αβisinR fgisinV）gffg =

0 geff 00 =hArr= fff

内積があるとノルムがにより定まる

ヒルベルト空間は無限次元でもよい

例） L2(ab)区間 (ab)上の２乗可積分関数全体

ユークリッド空間 Rm もヒルベルト空間のひとつ

adxxgxfgf )()(内積

正定値カーネルとヒルベルト空間

定理k(xy) 集合 Ω上の正定値カーネル

Ω上の関数からなるヒルベルト空間 Hkが一意に存在して

次の３つを満たす

(2) 有限和の形の元は Hkの中で稠密

(3) （再生性）

注) k( x) x を固定した1変数関数

kHxk isinsdot )( ( xisin Ωは任意に固定)

sum = sdot= ni ii xkcf 1 )(

)()( xkfxf sdot= forall f isinHk xisinΩ

再生核ヒルベルト空間（Reproducing Kernel Hilbert Space）

集合 Ω上の関数を要素に持つヒルベルト空間 Hが再生核ヒルベルト空間であるとは任意の xisinΩに対して φxisinHがあって任意の fisinHに対し

が成り立つことをいう

φxのことを再生核という

)( xff x =φ

以下 RKHS と略する場合がある

正定値カーネルとRKHS正定値カーネルrArr RKHS正定値カーネル k(xy) により定まる Hkは再生核を持つ(定理の(3)）

RKHS rArr正定値カーネル再生核 φx は正定値カーネルを定める

)( xff x =rArr φ)( xkx sdot=φ

)()( yxyk xφ=rArr

と定義

yxx yxyk φφφ )()( == (対称性もわかる）

sumsumsumsum ======

ji xxjin

ji jiji jiiiccccxxkcc

1111)( φφφφ

1ge= sum =

i xi ic φ (正定値性)

正定値カーネル再生核ヒルベルト空間

再生核ヒルベルト空間の性質関数の値が扱える

L2空間などでは関数の値は定まらない（測度0の集合上の値を変更しても同じ元）

再生性

関数の値が内積で計算できる

内積が関数の値で計算できるカーネルトリック（次のスライド)

連続性

Ω = Rm正定値カーネル k(x y)が連続だとすると定義されるRKHS Hkの関数はすべて連続関数

実はk(xy)が微分可能だとすべての関数が微分可能

2222 )()()()()()( ykxkfykxkfyfxf sdotminussdotlesdotminussdot=minus

)(0))()(2)((2 yxyykyxkxxkf rarrrarr+minus=

∵）

再生核とカーネルトリックΩデータが含まれる空間k(xy) 集合 Ω上の正定値カーネルHk kにより定まる再生核ヒルベルト空間

kHrarrΩΦ xxkx φ=sdot=Φ )()( により定める

内積計算は関数 kの計算でOK)()()()()( yxkykxkyx =sdotsdot=ΦΦ カーネルトリック

Ω xｊ

再生核ヒルベルト空間

ixφjxφ

データの空間

例多項式カーネルR2上の正定値カーネル k(xy) = (xTy )2 = (x1y1 + x2y2)2

kが定める再生核ヒルベルト空間 Hk と写像 Φ R2rarr Hkを求めよう

H R2上の２次関数全体

を正規直交基底として内積を以下で定義

Hは R3 と同型になる

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

２再生性任意の Hの元

カーネルトリック

Hxk isinsdot )( 22

222121

21 22)( zxzzxxzxxzk sdot+sdot+sdot=

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

2111 )2()( zzzzzf ααα ++= に対し

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

H（３次元）の内積 Ω（２次元）の計算で済んでいる

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

21 2 zzzzと基底とした表現

多項式の次数が高ければ圧倒的に k(xy)の計算が有利

係数

セクション２のまとめ

正定値カーネルの定義グラム行列の(半)正定値性

正定値カーネルの代表的な例多項式カーネル

ガウスカーネル

Fourierカーネル（複素数値カーネル）

再生核ヒルベルト空間正定値カーネルは特別な内積を持つ関数空間を定める

再生核ヒルベルト空間は都合のよい性質を持つ

再生性関数の値が定まる（場合によっては）連続性微分可能性

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

３線形アルゴリズムの非線形化としてのカーネル法

線形なデータ解析法をカーネルによって非線形化する方法を紹介する

具体的なカーネル化アルゴリズムスプライン平滑化サポートベクターマシンカーネルPCAカーネルCCA

特徴空間での線形アルゴリズム

線形のアルゴリズムデータが Rmのベクトル

線形アルゴリズムの利用線形回帰主成分分析正準相関分析 etc

相関分散共分散行列の計算が本質的

内積計算ができればヒルベルト空間内のデータにも適用可能

カーネルによる非線形化正定値カーネルにより定まるヒルベルト空間は特徴空間とも呼ばれる

データの空間再生核ヒルベルト空間＝特徴空間（feature space）

Ω xｊ

特徴空間における線形アルゴリズムデータの空間での非線形アルゴリズム

)()( xkxx sdot=Φa xの特徴ベクトルとみなせる

（Data space）

カーネルPCAカーネルCCA SVMプライン平滑化 etc

PCAとカーネルPCA

-25 -20 -15 -10 -5 0 5 10 15 20

主成分分析（PCA 復習）m次元データ X1 hellip XN

主成分分析分散が最大になる方向（部分空間）にデータを射影

単位ベクトル a方向の分散

Vの固有ベクトル u1 u2 hellip um (ノルム１)（ λ1≧ λ2≧ hellip≧ λm ）

第 p主成分の軸＝ up

データ Xjの第 p主成分＝

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

11 sum == sum =minus= N

j jNii XXX 11~ (中心化)分散共分散行列

jTp Xu

カーネルPCA（Schoumllkopf et al 98）

データ X1 hellip XN 特徴ベクトル φ1 hellip φN

特徴空間での単位ベクトル h方向の分散＝

としてよい（∵直交する方向は分散に寄与しない）

主成分は

カーネル k を設定 kjj HXk isinsdot= )(φ

sum == Ni iih 1

sum =Ni ih

2~1 φ

ただし sum =minus= Nj jNii 1

1~ φφφ （中心化）

ααφφα 21

1~1~~1 K

a aNj jj == sum sum= = jiijK φφ ~~~ =ただし

ααα

2~max KT

制約条件 1~ =αα KT

分散

ααφαφα Kh Ti i iiiiHk

~~~ == sum sum⎩⎨⎧

カーネルPCAのアルゴリズム分散最大の方向＝の最大固有値の固有ベクトル方向

の固有値分解

第 p主成分を与える α

K~sum == N

a uuK 1~ λ

pp uprop)(α

1~ =αα KT ゆえ p

α 1)( =

データ Xjの第 p 主成分＝pjpj

pi uλφφα =sum =

sumsumsum === +minusminus= Nba baN

Na jaN

Na aiNjiij XXKXXKXXKXXKK 1

1 )()()()(~2

( )ijNN KQQ=1 T

NNNNN IQ 11minus= 1N = (1hellip1)Tただし

カーネルPCAの実験例lsquoWinersquoデータ（UCI Machine Learning Repository）

13次元１７８データ３種類のワインの属性データ２つの主成分を取った（３クラスの色は参考に付けたもの)

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

カーネルPCAの特徴

非線形な方向でのデータのばらつきが扱える

結果はカーネルの選び方に依存するので解釈には注意が必要

ガウスカーネルの分散パラメータなど

どうやって選ぶか必ずしも明確でない

前処理として使える

後の処理の結果を改良するための非線形特徴抽出

カーネルCCA正準相関分析（CCA 復習）CCA ２種類の多次元データの相関を探る

m 次元データ X1 hellip XN

n次元データ Y1 hellip YN

Xを a方向Yを b方向に射影したときに相関が大きくなる (ab) を求める

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

iiNXY YXV ~~1 などただし

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

TYYXYXX VUVVV Λ=minusminus 2121 )( 1 muuU K= )( 1 nvvV K=

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

カーネルCCA（Akaho 2001 Bach and Jordan 2002）

データ X1 hellip XN 特徴ベクトル φX1 hellip φX

Y1 hellip YN φY1 hellip φY

カーネルCCA 特徴空間での相関を最大化する射影方向 f g を求める

カーネルkX kY を設定 XkjX

Xj HXk isinsdot= )(φ

YkjYYj HYk isinsdot= )(φ

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

カーネルPCA同様 ~1sum == N Xf l llφα sum == N Yg 1

~l llφβ としてよい

ββααβαρ

βα 22 ~~

isinisin

正則化

ところがはゼロ固有値を持つので正則化を施す

結局YX KK ~~

( ) ( ) βεβαεα

βαρβα 22 ~~

~~max~

isinisin

( ) ( ) TNYYXNX VUIKKKIK Λ=++

minusminus 11 ~~~~ εε 特異値分解

)( 1 NuuU K= )( 1 NvvV K=

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

i iXi Xkf α sum = sdot= Ni iYi Ykg 1 )(~β

-1 -05 0 05 10

-1 -05 0 05 1-035

カーネルCCAの実験例

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

SVM マージン最大化による２値識別２クラス識別問題データ

線形識別関数

fw(x) = aTx + b

問題未知の xに対しても正しく答えられるようにfw(x) を構成せよ

)()( 11 NN YXYX Km

iX Risin11 minusisiniY ２クラスのクラスラベル

⎩⎨⎧

rArrltrArrge

0)(0)(

w y = 1 (クラス１)と判定

y = －1 (クラス２)と判定

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

マージン最大化学習データは線形識別が可能と仮定rArr 学習データを分類する線形識別関数は無数にある

マージンを最大化する方向を選ぶ

-8 -6 -4 -2 0 2 4 6 8-8

マージンベクトル aの方向で測った学習データのクラス間の距離

識別関数は２つの境界の真中

マージン

サポートベクター

-8 -6 -4 -2 0 2 4 6 8-8

マージンの計算

(ab) を定数倍しても識別境界は不変なのでスケールを一つ決める

⎩⎨⎧

minus=+

1)max(

1)min(

iT Yi = 1 のときYi = －1 のとき

マージン = a2

マージン最大化識別関数

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

ba制約条件 )(1)( ibXaY iT

i forallge+

２次最適化有効な最適化アルゴリズムの利用が可能数値的に必ず解を得ることができる

ソフトマージン線形識別可能の仮定は強すぎるので少し弱める

ソフトマージンの識別関数

正則化問題としての表現

ハードな制約条件ソフトな制約条件

i bXaY ξminusge+ 1)(1)( ge+ bXaY iTi ( ξi≧ 0 )

i bXaY ξminusge+ 1)(sum =+ Ni iba

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

ただし (z)+ = max(z 0)

サポートベクターマシン

特徴空間でのソフトマージン最大化

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

H 正定値カーネル kにより定まる再生核ヒルベルト空間

カーネル kを用意

Representer定理による解の構成

最適化問題

の解は

の形で与えられる（Representer theorem セクション４で詳しく述べる)

あるいはソフトマージンに戻って

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

( ) sumsum sum == += ++minus Nji

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

制約条件 iii bKY ξα minusge+ 1))((ξi≧ 0

Kij = k(Xi Xj) グラム行列２次最適化問題として解ける

SVMの例ガウスカーネル

複雑な識別境界が

実現可能SVM デモ

httpsvmdcsrhbncacuk

リッジ回帰とスプライン平滑化線形回帰(復習)

問題

データ行列を使うと

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

)()( 11 NN YXYX K RR isinisin imi YX

sum = minusNi

i XfY12))((min を達成する線形関数 fw(x) = wTx

YXXXw TT 1)(ˆ minus=

xXXXYxf TTw

1ˆ )()( minus=

リッジ回帰（Ridge regression）

問題

最適解は

最適な関数は

リッジ回帰はXTXが特異になるときに特に有効Bayes的な解釈もできる（縮小推定)

2))((min wXfYNi

i λ+minussum = を達成する線形関数 fw(x) = wTx

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

スプライン平滑化リッジ回帰

非線形化

解の構成Representer theorem よりの形なので

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

HffXfY λ+minussum =isin

スプライン平滑化

sum == Ni

ii Xxkxf 1 )()( α

αλααα

KKY T+minus 2min を解けばよい

)()()( 1 xgIKYxf NT minus+= λ

Kij = k(X i X j) グラム行列gi(x) = k(x X i)

正則化としてのスプライン平滑化２乗誤差によるカーブフィッティング

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

誤差 0 となる fは無数にある

解が一意になるように正則化項を付加

滑らかさによる正則化（平滑化）

実は微分が２乗可積分な関数全体＝ある正定値カーネル kに対する再生核ヒルベルト空間

かつ

ガウスカーネルもある種の微分作用素に対応する正定値カーネルRBFスプライン

SVMも同様の正則化ただし2乗誤差ではない

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

bffbXfY λ++minussum = +

セクション3のまとめカーネルによる非線形化線形データ解析アルゴリズムを特徴空間で行うことによって非線形アルゴリズムが得られる rarr カーネル化（kernelization）

「内積」を使って表される線形手法なら拡張が可能

射影相関分散共分散etc

例サポートベクターマシンスプライン平滑化カーネルPCAカーネルCCAなど

非線形アルゴリズムの特徴線形ではとらえられない性質が調べられる

とらえることのできる非線形性はカーネルの選び方に影響を受ける

４正定値カーネルの性質

正定値性を保つ演算と正定値性のチェック

Rm上の正定値カーネルの特徴づけ Bochnerの定理無限次元の問題を有限次元へ還元 Representer定理

正定値性を保つ演算

和と積k1(x y) k2(x y) Ω上の正定値カーネル次も正定値カーネル

(1) 非負実数 a1 と a2に対する線形和

(2) 積

正定値カーネルの収束列k1(x y) k2(x y) hellip kn(x y) hellipを Ω上の正定値カーネル列とするとき

ならば k (x y) も正定値カーネル

Ω上の正定値カーネル全体は積について閉じた（各点位相での）閉凸錐

)()( 2211 yxkayxka +

)()( 21 yxkyxk

)(lim)( yxkyxk nn infinrarr= （任意の x y isin Ω）

正規化k (x y) は Ω上の正定値カーネルf Ωrarr Rは任意の関数とすると

は正定値カーネル

特に正定値カーネルが k (x x) gt 0 （xisinΩは任意）を満たすとき

は正定値カーネル normalized カーネル

)()()()(~ yfyxkxfyxk =

)()()()(~

yykxxkyxkyxk =

dT cyxyxk )()( +=（ c gt 0 ）

22 )()()()(~

cyycxxcyxyxk

例）

証明和収束列 rArrグラム行列の半正定値性は明らか

正規化

x1 hellip xnisinΩc1 hellip cnisinR

積は半正定値なので対角化により

)()()()(~11 jji jiiji

ji jiji xfxxkxfccxxkcc sumsum ===

0)()()(1

ge= sum =ji jijjii xxkxfcxfc

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

ji jijiji xxkxxkcc1 21 )()(

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

i xxkUcUcxxkUcUc λλ L

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

カーネルの設計 Marginalized kernel隠れた構造を利用

z = (x y)x 観測される変数y 観測されない隠れ変数

p(xy) (x y) に対する確率モデル

kz(z1 z2) zに対する正定値カーネル

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

kz(z1 z2) = k(y1 y2) （yのみに依存）でもOK

正定値性の判定

正定値カーネルの例正定値性の証明多項式カーネル

xTyは正定値 ∵）

rArr xTy + cは正定値（ c≧ 0 ）rArr (xTy + c)dは正定値（d 個の積ゆえ）

Fourier カーネル

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

( ) ( ) ( )yxyx TTT ωωω 1exp1exp)(1exp minusminusminus=minusminus

)()( yfxf= rArr 正定値

復習

ガウス関数の Fourier変換はまたガウス関数

正定値性の証明

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎛ minusminusrarrminusminus

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正の数正定値カーネル

正定値

Rm上の正定値カーネル

Bochnerの定理k(xy) = φ(xｰy)の形により与えられる Rm上のカーネルが正定値である

ための必要十分条件は関数 φ(z) がある非負可積分関数 f(z)によって

と表されることである

すなわち φ(z) のFourier変換が非負実数関数となることである

上の積分表示を持つ φ(z)が正定値カーネルを与えることはガウスの場合と同様Bochnerの定理はその逆も成り立つことを主張している

Fourierカーネルが正定値カーネル全体の成す

閉凸錐を張っている

( )int minus= m dzzfz TR ωωφ 1exp)()(

( ))(1exp yxT minusminus ω

非負 Fourierカーネル(正定値)

Representer Theorem正則化の問題（復習）

一般化された問題k 正定値カーネル H k により定まる再生核ヒルベルト空間x1 hellip xN y1 hellip yN データ（固定）

h1(x) hellip hd(x) 固定された関数

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Nii fxhbxfyxL Ψ++ ==== suml ll

Hf isindb Risin)( l

Representer Theorem

正則化項の関数 Ψは[0infin)上の単調増加関数とする

( ) ( )21111 )()(min H

Hf isin db Risin)( l

( ) ( )ααα KxhbKyxL TN

iNj jij

Nii Ψ++=

===== sumsum 11111 )(min l llN

i Risin)(α db Risin)( l

)()(span~1 NN xkxkH sdotsdot= K k( xi) の張る N次元部分空間

K = (k(xixj)) グラム行列

H（無限次元）上の最適化が有限次元の最適化に変換できる

() の解 fはの中にあるNH~

sum == Ni ii xxkxf 1 )()( α

すなわち

の形で探してよい

Representer theorem の証明

perpoplus= HHH N~

直交分解

perp+= fff N~

0)( =sdotperp ixkf （foralli ）

)(~)(~)(~)()( iNiNiNii xfxkfxkffxkfxf =sdot=sdot+=sdot= perp

222 ~HHNH fff perp+=

rarr Lの値はだけで決まる

rarr Ψの値はのほうがよい

＝０perpf

NHf ~isin に最適解がある（証明終）

( ) ( )21111 )()(min H

セクション４のまとめ

正定値性を保つ演算非負の和積

Normalization 正定値カーネル列の各点収束

rArr あたらしいカーネルの作成カーネルの正定値性のチェック

Bochnerの定理φ(x ｰ y) 型のRm上のカーネルが正定値 hArr φのFourier変換が非負

Representer thoerem無限次元空間上の正則化問題を有限次元の問題へ

５構造化データのカーネル

複雑な構造を持つデータ（ストリングツリーグラフ）に対して定義されるカーネルとその計算法を紹介する

構造化データが使われる応用を紹介する

構造化データの処理

カーネルの利用

正定値カーネル k(x y) x yはベクトルデータでなくてよい

どんなデータでもOK長さの違うシンボル列＝ストリング

ツリー構造

グラフ表現されたデータ

カーネル法非ベクトルデータのベクトル化カーネルが定義されるとSVM カーネルPCA スプライン平滑化などの利用が可能

計算すべきもの＝データに対するグラム行列 k(xi xj)

ストリング

ストリングアルファベット Σ 有限集合ストリング Σの要素の有限長の列例） Σ = a b c dhellip z

ストリング cat head computer xyydyaahellip

Σ p 長さ pのストリング全体Σ lowast 任意の長さのストリング全体

記号法

s s1 s2 hellip sn ストリングに対し

| s | ストリング s の長さ = ns[ i j ] si hellip sj という s の部分列

s t に対し結合 s t = s1 s2 hellip sn t1 t2 hellip tm

注） Σ 0 = ε 空ストリング

ストリングカーネル

ストリングカーネルΣ lowast上の定義された正定値カーネル２つのストリング s tの類似度一致する部分列を数え上げるタイプが多い

効率的な計算の工夫が重要再帰式（漸化式)などDynamical Programming （DP)

典型的な応用先自然言語処理

文字列 Σ = a b c hellip z単語列 Σ = 単語全体

ゲノム解析

ゲノム Σ = A T G Cタンパク質 Σ = アミノ酸（20種類）

ストリングカーネルの応用

ゲノム配列のアラインメント

タンパク質の構造予測アミノ酸配列 Σ = 20種のアミノ酸

配列立体構造のクラスを予測

データベース

SCOP（Structural Classification of Proteins）など

7LES_DROME LKLLRFLGSGAFGEVYEGQLKTEDSEEPQRVAIKSLRK

ABL1_CAEEL IIMHNKLGGGQYGDVYEGYWKRHDCTIAVKALK

BFR2_HUMAN LTLGKPLGEGCFGQVVMAEAVGIDKDKPKEAVTVAVKMLKDDA

TRKA_HUMAN IVLKWELGEGAFGKVFLAECHNLLPEQDKMLVAVKALK

p-スペクトラムカーネル長さ pの部分列の出現回数を特徴ベクトルとする

| Σ | = m u isin Σ p

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

21 uwwswwspu =ΣtimesΣisin=φ sの中の uの出現回数

upm ssH Σisin=ΦcongrarrΣΦ )()( φR

特徴空間長さ pの列全体 m p次元

s = ldquostatisticsrdquo t = ldquopastapistanrdquo

3-スペクトラムs sta tat ati tis ist sti tic icst pas ast sta tap api pis ist sta tan

K3(s t) ＝ 12 + 11 = 3

sta tat ati tis ist sti tic ics pas ast tap api pis tan

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

p-スペクトラムカーネルの計算法

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

部分列 u を途中から始まる部分列 suffix （接尾辞）の先頭（prefix)と思う

s の p-prefix ＝ t の p-prefix

⎩⎨⎧

)( tsh pu

s の p-prefix ne t の p-prefix

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

p-スペクトラムカーネルの計算法(II)実は|s|+|t| に対して線形時間 O( p(| s | + | t |) ) で計算する方法がある

Suffix Treeストリングのすべての suffix を木構造で効率的に表すアルゴリズム例） ababc

詳しくは Vishwanathan amp Smola 03 Gusfield 97

abc$ c$

c$ababcbabcabcbcc

All-subsequences Kernelすべての長さの部分列（gapも許す）の出現回数を特徴ベクトルとする

| Σ | = m u isin Σ lowast

特徴空間＝任意長のストリングを添字に持つベクトル空間（無限次元）

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

iiiii = |)|1( 21 siii leltltltle lLただしに対し

]932[=iv

s statsitics =][isr

tacrArr

( ) )()( ΣφΣ isin

infin =ΦcongrarrΦ uu ssH R

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ATGACTAC ATGACTAC u = ATGCACATGCGATT CATG CGATT

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

ε 空ストリング

K(st) = 4

All-subsequences kernel の計算再帰的な式過去に計算した結果を利用

初期条件

k(s ε) = k(t ε) = 1 （任意の s t ） ε 空ストリング

k(s t) まで求まっているとして k(sa t) = k(sa t)＝（ s内と t内での一致によるもの）＋（a を含む一致）

sum minus+= ])11[()( jtsktsk1 ≦ j ≦|t|j t[j] = a

sum minus+= ])11[()()( jtsktsktsak1 ≦ j ≦|t|j t[j] = a

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

All-subsequences kernel の計算(II)計算の効率化

t 回の計算をやりたくない

)(~ tsak とおくと

t に関する再帰式

sum +minus= )(])11[()(~ tskjtsktbsak abδj = |tb| の場合1≦j≦ |t| の場合

)()(~ tsktsak abδ+=

)()(~)(~ tsktsaktbsak abδ+=

)(~)()( tsaktsktsak += (sについての再帰式）

(tについての再帰式）⎩⎨⎧

)(~)()( tsaktsktsak +=

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

Gap-weighted subsequence kernelGap に対してペナルティをつけた特徴ベクトル

| Σ | = m u isin Σ p 0 lt λ≦ 1

gap が多い一致は割り引く

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

C T G A C T Gu = CAT

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

Gap-weighted subsequences kernel の例

効率的なアルゴリズムとして再帰式によるものがある

計算量＝ O( p | s | | t | )

正規化が行われることが多い

詳しくは Lohdi et al (JMLR 2002)Rousu amp Shawe-Taylor (2004)

AT AG AC TG TC GC GT CT

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

他のストリングカーネルFisher kernel Jaakkola amp Haussler (1999)

Mismatch kernel Leslie et al (2003)

Marginalized kernel確率モデルにもとづくカーネル設計

z = (x y)x 観測される変数y 観測されない隠れ変数（データを生成する構造）

y1 y2の状態全体

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

p(x y)は隠れマルコフモデル（HMM）によって記述済み（y 隠れ状態）

Marginalized kernel

A C G G T T C A A A C C G T A C

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

zzk aiaizaisinATGCi =12

Cai(z) (a i)のカウント

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

グラフとツリー

有向グラフ

グラフV ノード（node vertex）有限集合E エッジ（edge） V x V の部分集合有向グラフ E の向きを考えたもの

(a b) isin E のときaからbへ矢印を描くノード a の親 (ba) isinE なる bノード a の子 (ab) isinE なる b

無向グラフ E の向きを忘れたもの

ツリー（directed rooted tree）連結した有向グラフで親の無いルートノードが存在し他の各ノードは親を1個だけ持つものリーフツリーの中で子の無いノード

無向グラフ

ツリー

ツリーカーネルツリー全体の集合上に定義された正定値カーネル

代表的な例

サブツリーの一致によりカーネルを定義する

All-subtrees kernel

再帰式で計算可能計算量＝ O(|T1| |T2|)

詳細は Collins amp Duffy (2002 NIPS) などを参照

Φ ツリー T HT isinΦ )(a 特徴空間（ベクトル空間）

)()()( 2121 TTTTk SS φφsum=

⎩⎨⎧

)(TSφTが S をサブツリーとして含む

Tが S をサブツリーとして含まない

S ツリー

自然言語処理への応用

構文解析

Jeff ate the appleサブツリーの例

the apple

グラフカーネル

グラフ上に定義された正定値カーネルグラフとグラフの類似度を測る

ラベル付グラフ

ノードとエッジにラベルがついている

L ラベルの集合（有限集合）ラベル付グラフ G = (V E h)

V ノードEエッジh VcupE rarr L ラベル付けの写像

応用

化合物の毒性予測

自然言語処理

Marginalized graph kernel 系列のラベル

系列の確率 ndash ランダムウォークノード間の遷移確率

系列の確率

グラフ上のランダムウォークにより生じる系列の確率

s v1 v2 v3 v5 v3

H(s) = h(v1)h(e12)h(v2)h(e23)h(v3)h(v35)h(v5)

= γ a α c β b α b β

( )⎩⎨⎧

)|(の隣接ノードの数i

vvp ij

Eji isin)(Eji notin)(

L)|()|()|()|()()( 353523121 vvpvvpvvpvvpvpsp =

ラベル系列に対するカーネル

Marginalized graph kernelG1 = (V1 E1 h1) G2 = (V2 E2 h2)

ランダムウォークにおいて同じパスが生じる確率

Marginalized kernelのひとつとみなせる

詳しくはKashima et al (2003) Maheacute et al (2004)

⎩⎨⎧

=times)(0)(1

HHKLLK LL

sum= ))()(()()()( 212121 tHsHKtpspGGK L

1Vs isin

2Vt isin

H1 H2 それぞれ h1 h2から決まるラベル関数V1 V2 それぞれ V1 V2 をアルファベットとする系列全体

構造化データ上のカーネルの問題点

計算量k(xy) の計算にかかる時間

O( |s| |t| ) でもサイズが大きくなると困難

データ数

グラム行列の計算は（データ数）２のオーダー

SCOPデータベース配列の長さ～数百配列データの数～数千

ちょっと話を変えて

グラフLaplacian と Diffusion Kernel1

「ノード」間の近さを表す正定値カーネル

無向グラフ G = (V E)

各ノードが値をもつ f1 hellip fn

グラフ＝「隣接した２ノードは近い値をとりやすい」という情報の表現

rArr 相関構造の導入

ノード集合 1hellip n 上のカーネル rArr n次元ベクトルの再生核

注意グラフとグラフの近さではない

グラフのLaplacian 13

ノード数 n無向グラフ G = (V E)隣接行列 A

Laplacian L

Normalized Laplacian

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

sum === nj ijiii AdD 1ただし D は対角行列で

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

minusminusminusminus

11001311

01210112

21212121~ minusminusminusminus minus== ADDILDDL

Laplacianの意味

V上の関数

( f Lf )小 hArr 隣接ノードで近い値

特に Lは(半)正定値行列正定値カーネルに使える

cf) Rn上の Laplacian

RrarrVf （要はベクトル ( f(1) f(2) hellip f(n) ) ）

( ) ( )sum minus=ji～

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

これを離散点上で差分化したもの

Diffusion KernelDiffusion Kernel の定義

再生核ヒルベルト空間＝ n次元ベクトル空間内積

拡散方程式との関連

LeK β= L++++= 3322

21 LLLI βββ n x n正定値行列

β gt 0

隣接以外の近傍の効果が L より強調されている

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

V = 1hellipn上のRKHS rArr n次元ベクトル空間正定値カーネル

RKHSの内積

ベクトル表示すると

相関構造

K で「相関」を定める場合

)( jiK )1( nji K= n x n行列

)()( 1 ixKuxf ni isum == )()( 1 ixKwxg n

i isum ==

KwujKwiKugf Tnj i

ni iH =sdotsdot= sumsum == 11 )()(

Kuf = Kwg =

gfKgf H1 minus=

gfKgf H1 minus= ＝ Mahalanobis距離

補足有限集合上の再生核ヒルベルト空間

Laplacian Diffusion Kernel の応用グラフ上の関数の補間（semi-supervised learning)グラフ構造は既知

ノードの一部の値が未知

正則化問題

グラフ上の関数の平滑化（スプライン）すべての値が既知の場合

22))((min HiHffify λ+minussum

isin i 既知

2))((min H

fify λ+minussum=isin

セクション5のまとめ構造化データのカーネル非ベクトルデータのベクトル化

ストリング

p-spectral kernel all-subsequences kernel gap-weighted kernel hellip

ツリーグラフ

計算の効率化が重要

グラフLaplacian と Diffusion Kerneln 次元ベクトルデータに用いるグラフによる離散点の相関構造の定義

６独立性条件付独立性とカーネル

独立性や条件付独立性が正定値カーネルで特徴付けられることを説明する

この特徴づけをもとにした独立成分分析次元削減の方法を紹介する

「特徴空間での線形アルゴリズム」という今までの手法とは異なる

確率変数の独立性

独立性の定義X Y 確率変数PXY 同時確率 PX PY 周辺確率

X と Yが独立 hArr

特性関数による特徴づけ

X と Yが独立 [ ] [ ] [ ]YY

eEeEeeE ηωηω 1111 minusminusminusminus =hArr

hArr の相関が０YX TT

ee ηω 11 minusminus と

)()()( BPAPBAP YXXY =times

(forallω η)

ee ηω 11 minusminus とは非線形相関をはかるテスト関数

独立性 hArr 十分豊かな非線形相関が０

Fourierカーネル

再生核ヒルベルト空間と独立性再生核ヒルベルト空間（RKHS)による独立性の特徴づけ

X Y それぞれ ΩX と ΩY に値をとる確率変数

HX ΩX上のRKHS HY ΩY上のRKHS

X と Yが独立

[ ] [ ] [ ])()()()( YgEXfEYgXfE YXXY =hArr for all YX gf HH isinisin

lArr がいつ成り立つか（rArrは常に成立）

HX と HYがガウスカーネルのRKHSなら成立（Bach and Jordan 02）∵）十分豊かな非線形相関が表現できる

カーネルICA独立成分分析（ICA)Z m次元確率変数（ベクトル）

さまざまなアルゴリズムが知られているKLダイバージェンスにもとづく方法高次モーメントにもとづく方法など（村田04参照）

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

U の成分 U1 hellip Umが独立になるように m x m行列 A を見つける

カーネルCCAによるICA簡単のため２変数で説明

U = (XY)T = AZHX HY ガウスカーネルのRKHS

X と Yが独立

データ X1 hellip XN Y1 hellip YN を使うと

[ ] 0)()(Cov =hArr YgXfXY )( YX gf HH isinisinforall

[ ] 0)]([Var)]([Var

)()(Covmax 2121 =hArrisinisin YgXf

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

カーネルCCAの正準相関

カーネルCCAによるICAアルゴリズム（２変数）

βαρβα 22 ~~

~~max~

isinisin

Aについて最小化

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

)( 21 aaA =ただし

( ) ( ) 11 ~~~~ minusminus++ NYYXNX IKKKIK εε~ρ の最大特異値

Kernel generalized variance によるICA

非線形最適化による Aの最適化ガウス分布の相互情報量の一般化

( ) ( ) 11 ~~~~ minusminus++minus NYYXNXN IKKKIKI εε の特異値を大きくすればよい

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

YXXY KK ~~ˆ =Σ 2)~(ˆNXXX IK ε+=Σ 2)~(ˆ

NYYY IK ε+=Σ とおく

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

の固有値を大きくすればよい

Kernel generalized variance

回帰問題における次元削減

回帰問題における有効な部分空間回帰問題 Y を X で説明する

次元削減

)|( XYp の推定

X m次元ベクトルB = (b1 hellip bd) m x d行列

)|()|( XBYpXYp T=

となる Bを探す

BTX = (b1TX bd

TX) は Yを説明する目的ではX と同じ情報を持つ

有効部分空間（特徴ベクトル)

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

次元削減と条件付独立性X の分解 (U V) = (BTX CTX) )()( mOCB isin 直交行列

U 有効なベクトルの候補 V それに直交する方向

B が有効な部分空間を与える

)|()|( || xBypxyp TUYXY =hArr

Yvuyuypvuyp UYVUY )|()|( || all for=hArr

hArr Y と Vは Uのもと条件付独立 UVY |perp

条件付独立性と条件付分散

条件付分散X Y ガウスの場合

Var[Y | X ]＝ VYY ndash VYX VXX－1 VXY ＝（Yを Xで線形回帰した残差）

Var[Y | X ] が小さいほど Xは Yの情報を多く含んでいる

X Y 一般の場合X = (U V) と分解すると

]]|)([Var[]]|)([Var[ UYfEXYfE UX leYに関する情報が増えることはない

]]|)([Var[]]|)([Var[ UYfEXYfE UX =UVY |perp ならば

（forallf ）

Yに関する情報は落ちない

RKHSと条件付独立性Q 逆に

A f(Y)が Yに関する情報のバリエーションを十分表現できれば「Yes」

]]|)([Var[]]|)([Var[ UYfEXYfE UX =

UVY |perpならばか

HY ガウスカーネルのRKHS

UVY |perp

hArr Yf Hisinforall

証明は Fukumizu et al 04 参照

条件付分散の推定有限個のデータ X1 hellip XN Y1 hellip YN から条件付分散を推定

の形に限ると

cf) ガウス分布の条件付分散

sum = sdot= Ni iYi Ykf 1 )(α

( )αα XYXXYXYYT

X XYfE ΣΣΣminusΣasymp minus ˆˆˆˆ]]|)([Var[ 1

NYYY IK ε+=Σここで

VYY ndash VYX VXX-1 VXY

カーネル次元削減法

条件付分散の最小化

を小さくする U = BTX を探したい]]|)([Var[ UYfEU

UYUUYUYY ΣΣΣminusΣ minus ˆˆˆˆ 1最小化

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

再び Kernel generalizedvariance

Kernel Dimensionality Reduction (KDR)

（∵ は一定）YYΣUYUUYU ΣΣΣ minus ˆˆˆ 1

Kernel ICA の時と同様に

-20 -15 -10 -5 0 5 10 15 20

Wine data （他の次元削減法との比較)Data 13 dim 178 data3 classes2 dim projection

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

カーネル次元削減法の特徴

どんなデータでも扱える回帰問題の次元削減としては最も一般的

p(Y|X)のモデル（線形など)を使わないX Yの分布に条件がいらないYが離散値や高次元でもOK 従来法（SIR pHd CCA PLS etc）ではさまざまな制約

計算量の問題（カーネルICAKDRに共通)N x N行列を用いた演算

Incomplete Cholesky decomposition の利用非線形最適化に伴う局所解計算時間の問題

セクション６のまとめRKHSによる独立性条件付独立性の特徴づけ

RKHSは非線形性な関係をはかるテスト関数として有効L2などより「狭い」空間関数の連続性微分可能性

各点での値が意味を持つ

カーネルICA従来のICAと異なる理論にもとづくアルゴリズム

カーネル次元削減法（KDR)回帰問題に対するもっとも一般的な次元削減法

７まとめ

カーネル法

正定値カーネルによる特徴写像で線形アルゴリズムを非線形化

非ベクトルデータ構造化データの数量化

再生核ヒルベルト空間＝非線形性をはかるテスト関数の空間独立性条件付独立性の特徴づけ

現在も発展途上

講義で扱わなかったことSVMの詳細最適化に関わる点Vapnik流の誤差の上界評価

再生核ヒルベルト空間と確率過程の関係（Parzen 61）

補足RKHSと確率過程Ω 集合

1対1 相関 k(st) を持つ（2乗可積分な）確率過程 Xt

Ω上の正定値カーネル

k( t )

cong同型

RKHS Xtの張る部分空間sube L2空間

harrk( t ) tX

][)( st XXEstk =

カーネルには背後に確率過程がある

参考となる資料ホームページとソフトウエアカーネル関連ポータルサイト httpwwwkernel-machinesorghttpwwweuro-kermitorg Kernel Methods for Image and Text （欧州のプロジェクト）SVM Java applet httpsvmdcsrhbncacukSVM C++プログラム（Web上でJobも受け付ける） GIST

httpsvmsdsceducgi-binnph-SVMsubmitcgiUCI Machine Learning Repository

httpwwwicsuciedu~mlearnMLRepositoryhtml

論文誌国際会議Journal of Machine Learning Research

httpjmlrcsailmitedu （論文は全て無料でダウンロード可）

Neural ComputationNeural Information Processing Systems (NIPS Conference)International Conference on Machine Learning (ICML)

全般的な文献Schoumllkopf B and A Smola Learning with Kernels MIT Press 2002 津田宏治「カーネル法の理論と実際」 in 統計科学のフロンティア６パターン認識と学習の統計学（岩波書店）2003Muumlller K-R S Mika G Raumltsch K Tsuda and B Schoumllkopf (2001) An introduction to kernel-based learning algorithms IEEE Trans Neural Networks 12(2)pp181-201John Shawe-Taylor amp Nelo Cristianini Kernel Methods for Pattern Analysis Cambridge Univ Press 2004

個別の話題に関する文献（特にセクション５６）SVM 関連

Schoumllkopf B C Burges and A Smola (eds) Advances in Kernel Methods - Support Vector Learning MIT Press 1999 Smola A P Bartlett B Schoumllkopf and D Schuurmans (eds) Advances in Large Margin Classifiers MIT Press 2000 Vladimir Vapnik Statistical Learning Theory Wiley NY 1998

Kernel PCASchoumllkopf B A Smola K-R Muumlller (1998) Nonlinear Component Analysis as a Kernel Eigenvalue Problem Neural Computation 10 1299ndash1319

Kernel CCAAkaho S (2001) A kernel method for canonical correlation analysis International Meeting on Psychometric Society (IMPS2001)See also Bach and Jordan (JMLR 2002) in Kernel ICA

String kernel Lodhi H C Saunders J Shawe-Taylor N Cristianini C Watkins (2002) Text Classification using String Kernels J Machine Learning Research 2 (Feb) 419-444Leslie C E Eskin A Cohen J Weston and W S Noble (2003) Mismatch string kernels for SVM protein classification Advances in Neural Information Processing Systems 15 pp 1441-1448 Rousu J and J Shawe-Taylor (2004) Efficient computation of gap-weighted string kernels on large alphabets Proc PASCAL Workshop Learning Methods for Text Understanding and Mining

Suffix TreeDan Gusfield Algorithms on Strings Trees and Sequences Cambridge Univ Press 1997

Fisher KernelJaakkola TS and D Haussler (1999) Exploiting generative models in discriminative classifiers Advances in neural information processing systems 11 pp487-493

Tree kernelCollins M amp N Duffy (2002) Convolution Kernels for Natural Language Advances in Neural Information Processing Systems 14

Marginalized kernel Tsuda K T Kin and K Asai (2002) Marginalized kernels for biological sequences Bioinformatics 18 S268-S275

Graph kernel Kashima H K Tsuda and A Inokuchi (2003) Marginalized Kernels Between Labeled Graphs Proc 20th InternConf Machine Learning (ICML2003) Maheacute P N Ueda T Akutsu J-L Perret and J-P Vert (2004) Extensions of marginalized graph kernels Proc 21th Intern Conf Machine Learning (ICML 2004)p552-559

Diffusion kernelKondor RI and JD Lafferty (2002) Diffusion Kernels on Graphs and Other Discrete Input Spaces Proc 19th InternConf Machine Learning (ICML2002) 315-322Lafferty JD and G Lebanon (2003) Information Diffusion Kernels Advances in Neural Information Processing Systems 15 375-382

Kernel ICA Kernel Dimensionality ReductionBach FR and MI Jordan Kernel independent component analysis J Machine Learning Research 3 1-48 2002 Fukumizu K FR Bach and MI Jordan Dimensionality reduction for supervised learning with reproducing kernel Hilbert spaces J Machine Learning Research 5 73-99 2004

ICA村田昇「入門独立成分分析」東京電機大学出版局2004

RKHSと確率過程Parzen E (1961) An Approach to Times Series Analysis The Annals of Statistics 32 pp951-989

その他

Computational biology へのカーネル法の応用SchlkopfB K Tsuda J-P Vert (Editor) Kernel Methods in Computational Biology Bradford Books 2004

数学理論に関する本

Berlinet A and C Thomas-Agnan Reproducing Kernel Hilbert Spaces in Probability and Statistics Kluwer Academic Publishers 2003 Berg C J P R Christensen and P Ressel Harmonic Analysis on Semigroups Theory of Positive Definite and Related Functions (Graduate Texts in Mathematics Vol 100) Springer 1984

カーネル法正定値カーネルを用いたデータ解析

講義の概要 I

講義の概要 II

ヒルベルト空間の復習

再生核ヒルベルト空間の性質

再生核とカーネルトリック

３線形アルゴリズムの非線形化　　としてのカーネル法

カーネルCCA

SVM マージン最大化による２値識別

リッジ回帰とスプライン平滑化

セクション3のまとめ

カーネルの設計 Marginalized kernel

Representer Theorem

ストリング

p-スペクトラムカーネル

All-subsequences Kernel

Gap-weighted subsequence kernel

他のストリングカーネル

Marginalized kernel

ツリーカーネル

グラフLaplacian と Diffusion Kernel

グラフのLaplacian

Diffusion Kernel

Laplacian Diffusion Kernel の応用

再生核ヒルベルト空間と独立性

カーネルICA

次元削減と条件付独立性

RKHSと条件付独立性

セクション６のまとめ

７まとめ

補足RKHSと確率過程

参考となる資料

講義の概要 I1 イントロ－非線形データ解析としてのカーネル法

2 正定値カーネルの基礎正定値カーネルの定義と代表的な例

正定値カーネルと関数空間

3 線形アルゴリズムの非線形化としてのカーネル法正定値カーネルによる非線形化

サポートベクターマシンスプライン平滑化カーネルPCAカーネルCCA

４正定値カーネルの性質正定値性の判定

Bochnerの定理representer定理

7 まとめ

minus=N

線形で十分か

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

-6 -4 -2 0 2 4 6-6

)2()( 2122

21321 xxxxzzz =

xiΦ(xi) zi

Ωzｊ

gesum =

ji jiji xxkcc

( )njiji xxk

RrarrΩtimesΩk

( )njiji xxk

= ⎟⎟⎟

⎜⎜⎜

xxkxxk

ntimesn行列

CrarrΩtimesΩk

gesum =

⎟⎠⎞

1exp)( xyyxkσ

mR=Ω )(1)( yxT

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

7 まとめ

minus=N

線形で十分か

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

-6 -4 -2 0 2 4 6-6

)2()( 2122

21321 xxxxzzz =

xiΦ(xi) zi

Ωzｊ

gesum =

ji jiji xxkcc

( )njiji xxk

RrarrΩtimesΩk

( )njiji xxk

= ⎟⎟⎟

⎜⎜⎜

xxkxxk

ntimesn行列

CrarrΩtimesΩk

gesum =

⎟⎠⎞

1exp)( xyyxkσ

mR=Ω )(1)( yxT

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

minus=N

線形で十分か

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

-6 -4 -2 0 2 4 6-6

)2()( 2122

21321 xxxxzzz =

xiΦ(xi) zi

Ωzｊ

gesum =

ji jiji xxkcc

( )njiji xxk

RrarrΩtimesΩk

( )njiji xxk

= ⎟⎟⎟

⎜⎜⎜

xxkxxk

ntimesn行列

CrarrΩtimesΩk

gesum =

⎟⎠⎞

1exp)( xyyxkσ

mR=Ω )(1)( yxT

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

線形で十分か

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

-6 -4 -2 0 2 4 6-6

)2()( 2122

21321 xxxxzzz =

xiΦ(xi) zi

Ωzｊ

gesum =

ji jiji xxkcc

( )njiji xxk

RrarrΩtimesΩk

( )njiji xxk

= ⎟⎟⎟

⎜⎜⎜

xxkxxk

ntimesn行列

CrarrΩtimesΩk

gesum =

⎟⎠⎞

1exp)( xyyxkσ

mR=Ω )(1)( yxT

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

線形で十分か

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

-6 -4 -2 0 2 4 6-6

)2()( 2122

21321 xxxxzzz =

xiΦ(xi) zi

Ωzｊ

gesum =

ji jiji xxkcc

( )njiji xxk

RrarrΩtimesΩk

( )njiji xxk

= ⎟⎟⎟

⎜⎜⎜

xxkxxk

ntimesn行列

CrarrΩtimesΩk

gesum =

⎟⎠⎞

1exp)( xyyxkσ

mR=Ω )(1)( yxT

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

-6 -4 -2 0 2 4 6-6

)2()( 2122

21321 xxxxzzz =

xiΦ(xi) zi

Ωzｊ

gesum =

ji jiji xxkcc

( )njiji xxk

RrarrΩtimesΩk

( )njiji xxk

= ⎟⎟⎟

⎜⎜⎜

xxkxxk

ntimesn行列

CrarrΩtimesΩk

gesum =

⎟⎠⎞

1exp)( xyyxkσ

mR=Ω )(1)( yxT

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

xiΦ(xi) zi

Ωzｊ

gesum =

ji jiji xxkcc

( )njiji xxk

RrarrΩtimesΩk

( )njiji xxk

= ⎟⎟⎟

⎜⎜⎜

xxkxxk

ntimesn行列

CrarrΩtimesΩk

gesum =

⎟⎠⎞

1exp)( xyyxkσ

mR=Ω )(1)( yxT

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

Ωzｊ

gesum =

ji jiji xxkcc

( )njiji xxk

RrarrΩtimesΩk

( )njiji xxk

= ⎟⎟⎟

⎜⎜⎜

xxkxxk

ntimesn行列

CrarrΩtimesΩk

gesum =

⎟⎠⎞

1exp)( xyyxkσ

mR=Ω )(1)( yxT

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

Ωzｊ

gesum =

ji jiji xxkcc

( )njiji xxk

RrarrΩtimesΩk

( )njiji xxk

= ⎟⎟⎟

⎜⎜⎜

xxkxxk

ntimesn行列

CrarrΩtimesΩk

gesum =

⎟⎠⎞

1exp)( xyyxkσ

mR=Ω )(1)( yxT

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

gesum =

ji jiji xxkcc

( )njiji xxk

RrarrΩtimesΩk

( )njiji xxk

= ⎟⎟⎟

⎜⎜⎜

xxkxxk

ntimesn行列

CrarrΩtimesΩk

gesum =

⎟⎠⎞

1exp)( xyyxkσ

mR=Ω )(1)( yxT

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

gesum =

ji jiji xxkcc

( )njiji xxk

RrarrΩtimesΩk

( )njiji xxk

= ⎟⎟⎟

⎜⎜⎜

xxkxxk

ntimesn行列

CrarrΩtimesΩk

gesum =

⎟⎠⎞

1exp)( xyyxkσ

mR=Ω )(1)( yxT

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

CrarrΩtimesΩk

gesum =

⎟⎠⎞

1exp)( xyyxkσ

mR=Ω )(1)( yxT

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

⎟⎠⎞

1exp)( xyyxkσ

mR=Ω )(1)( yxT

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

(3) （再生性）

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

)( xff x =φ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

)()( yxyk xφ=rArr

と定義

sumsumsumsum ======

ji xxjin

1111)( φφφφ

1ge= sum =

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

再生性

連続性

∵）

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

Ω xｊ

ixφjxφ

データの空間

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

22222112

2111 )2()( zzzzzf ααα ++=

21 2 zzzz

22222112

2111 )2()( zzzzzg βββ ++=)2()( 2

22221122111 zzzzzf ααα ++=

222212121111 βαβαβα ++=H

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

１ ∵）

Hxk isinsdot )( 22

222121

)(2)( 22222112

2111 xfxxxxxkf

H=++=sdot ααα

22222112

kHH cong

22211 )()()()( yxyxyxkyx

H+==ΦΦ

⎟⎟⎟

⎜⎜⎜

harrsdot=Φ22

2)()(x

xkx 2221

係数

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

dT cyxyxk )()( +=

⎟⎠⎞

1exp)( xyyxkσ

)(1)( yxT

eyxk minusminus= ω

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

Ω xｊ

（Data space）

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

-25 -20 -15 -10 -5 0 5 10 15 20

VaaXaXa TNi i

T == sum =121 )~(][Var

Ni iN XXV ~~

jTp Xu

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

主成分は

sum == Ni iih 1

sum =Ni ih

2~1 φ

ααφφα 21

1~1~~1 K

ααα

2~max KT

分散

~~~ == sum sum⎩⎨⎧

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

の固有値分解

K~sum == N

a uuK 1~ λ

pp uprop)(α

α 1)( =

pi uλφφα =sum =

Na jaN

1 )()()()(~2

( )ijNN KQQ=1 T

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

-5 0 5-4

PCA（線形)-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 3)

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

-08 -06 -04 -02 0 02 04 06-08

KPCA（RBFσ = 5)

KPCA（RBFσ = 4)-05 -04 -03 -02 -01 0 01 02 03 04-05

KPCA（RBFσ = 2)

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

( )( )( ) ( ) bVbaVa

isinisin

==sumsum

sum max~~

sum= iT

正準相関

aTX bTYb

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

( )( )( ) ( )vu

vVVVubVaV

bVVVVVa YYXYXXT

YYYYXYXXXXT

21212121

maxmaxminusminus

isinisin

minusminus

isinisin

特異値分解

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege lL λλ

min nm=l

⎩⎨⎧

=minus

1λρ =

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

sumsum

isinisin

YiNi H

YkXk gf

gf2121

φφρ

ββααβαρ

βα 22 ~~

isinisin

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

正則化

結局YX KK ~~

βαρβα 22 ~~

~~max~

isinisin

⎟⎟⎟

⎜⎜⎜

⎛=Λ

101 gegege Nλλ L

( ) 11~ uIK NX

minus+= εα

( ) 11~ vIK NY

minus+= εβ

)(~1sum = sdot= N

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

-1 -05 0 05 10

-1 -05 0 05 1-035

-1 -05 0 05 1-1

0 005 01 015 02 025 03 035-035

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

線形識別関数

fw(x) = aTx + b

)()( 11 NN YXYX Km

⎩⎨⎧

rArrltrArrge

0)(0)(

y = fw(x)

fw(x)≧0

fw(x) lt 0

w = (ab)

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

-8 -6 -4 -2 0 2 4 6 8-8

マージン

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

-8 -6 -4 -2 0 2 4 6 8-8

⎩⎨⎧

minus=+

1)max(

1)min(

マージン = a2

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

( )⎪⎩

⎪⎨⎧

=+minus

minus=

1)(min

1max 制約条件

i forallge+

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

min ξ

ξ制約条件

ξi≧ 0

( ) 21 2

)(1min abXaYNi

λ++minussum = +

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

線形の場合

非線形化

( ) 21 2

)(1min abXaYNi

λ++minussum = +

( ) 21 2

))((1min HNi

bHffbXfY λ

++minussum = +isin

線形の関数

RKHSの元

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

最適化問題

の解は

( ) 21 2

))((1min HNi

bffbXfY λ

++minussum = +

sum == Ni

ii Xxkxf 1 )()( α

bXXkbXXkY 11 1

))(1min ααλαα

sum =+ Ni i

min ξααξα

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

httpsvmdcsrhbncacuk

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

問題

最適解は

最適な関数は

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

sum = minusNi

xXXXYxf TTw

1ˆ )()( minus=

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

問題

最適解は

最適な関数は

2))((min wXfYNi

YXIXXw TN

T 1)(ˆ minus+= λ

xIXXXYxf NTT

ˆ )()( minus+= λ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

非線形化

2))((min wXfYNi

i λ+minussum =

( ) 21

2)(min H

sum == Ni

ii Xxkxf 1 )()( α

αλααα

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

正則化

( ) )()(min 12

fXfYNi

fΨ+minussum =

( )sum = minusNi

2)(min

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

かつ

( ) int ⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

+++minussum = dxdx

xfdcdx

xdfcXfY m

112 )()()(min Lλ

（ ci≧ 0 ）

m fdxdx

xfdcdx

xdfc =⎪⎭

⎪⎬⎫

⎪⎩

⎪⎨⎧

++int L

( ) 21

2)(min H

( ) 21

))((1min HNi

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

(2) 積

)()( 21 yxkyxk

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

)()()()(~

yykxxkyxkyxk =

22 )()()()(~

cyycxxcyxyxk

例）

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

正規化

)()()()(~11 jji jiiji

0)()()(1

sum ==

ippji UUxxk

11 )( λ

( )njiji xxk

11 )(=

（ λp≧ 0 ）

( ) ( ) 0)()(1 21 2111 ge++= sumsum ==

ji jij

njinin

ji jij

sum sum= ==

ji jijp

ippji xxkUUcc

1 1 2 )(λ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

eg)ｙ HMM

系列x

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

( ) ( ) 0111

ge= sumsumsum ===

ji jTiji xcxcxxcc

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

復習

( ) ωωω

Rm m1exp

minus⎟⎟⎠

⎞⎜⎜⎝

⎛minus=⎟

⎟⎠

⎞⎜⎜⎝

⎛minus int

( )⎟⎟

⎜⎜

⎟⎟

⎜⎜

⎛minussum 2

exp)(1exp2

exp22 yx

t ωω

正定値

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

( ) 21

2)(min H

( ) 21

))((1min HNi

( ) ( )21111 )()(min H

Hf isindb Risin)( l

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

Representer Theorem

( ) ( )21111 )()(min H

iNj jij

Nii Ψ++=

すなわち

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

perpoplus= HHH N~

直交分解

perp+= fff N~

＝０perpf

( ) ( )21111 )()(min H

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

ツリー構造

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

ストリング

記号法

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

ゲノム解析

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

データベース

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

|)()( 21

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

K3(s t) ＝ 12 + 11 = 3

Φ(s) 1 1 1 1 1 1 1 1 0 0 0 0 0 0Φ(t) 2 0 0 0 1 0 0 0 1 1 1 1 1 1

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

直接的な計算

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

s[ i |s| ]

t[ j |t| ]

⎩⎨⎧

)( tsh pu

sum sum+minus

+minus

=minus+minus+=

1])1[]1[()(

jpp pjjtpiishtsK

計算量＝ O(p| s || t |)

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

abc$ c$

c$ababcbabcabcbcc

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

][|)( uisisu ==rr

riiii ssssis

321][ =

][ 321 lKr

]932[=iv

s statsitics =][isr

tacrArr

)()()()()(

tststsku

uu ΦΦ== sumisinΣ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

gapを許す比較

例s ATGt AGC

ε A T G C AT

Φ(s) 1 1 1 1 0 1 1 0 1 0

Φ(t) 1 1 0 1 1 0 1 1 0 0 1

K(st) = 4

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

初期条件

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

t2 t3 t4ε t1

1 1 1 1 1ε

s2 1計算量 = O( | s | | t |2 )

a s5 1

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

t2 t3 t4t1ε

1 1 1 1 1ε

s2 1計算量 = O( | s | | t | )

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

sum= )()( ipu s

rlλφ][ isuirr

= |][|)( 1 riisi =r

][ 1 riii Kr

=ただしに対し

6)( =ir

l]641[=ir

pup tststsK

p)()()()()( ΦΦ== sum

Σisinφφ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

計算量＝ O( p | s | | t | )

Φ(s) λ2 λ3 λ4 λ2 λ3 λ2 0 0

Φ(t) λ4 λ2 λ3 λ4 0 λ2 λ3 λ2

s ATGCt AGCTp = 2

k(st) = λ4 + λ5 + 2λ6 + λ7

)()()(

)(~ttkssk

tsktsk

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

sumsum=1 2

))()(()|()|()( 2211221121y y

z yxyxkxypxypxxk

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

Marginalized kernel

1 2 2 1 2 2 1 2 2

y2 1 2 2 1 2 2 1 exon intron

1 1 1 0 2 1 1 2

1 1 1 0 1 2 0 1

knownknown

unknown unknown

sum sum= )()(||||

1)( 2121

21 zCzCzz

sumsum=1 2

)()|()|()( 21221121y y

z zzkxypxypxxk

HMMから計算

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

有向グラフ

無向グラフ

ツリー

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

代表的な例

All-subtrees kernel

⎩⎨⎧

S ツリー

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

構文解析

the apple

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

応用

自然言語処理

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

系列の確率

s v1 v2 v3 v5 v3

( )⎩⎨⎧

vvp ij

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

⎩⎨⎧

=times)(0)(1

HHKLLK LL

1Vs isin

2Vt isin

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

データ数

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

Laplacian L

⎩⎨⎧

notinisin

=EjiEji

Aij )(0)(1 1 2 3 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

0100101101010110

3ADL minus= 4

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

11001311

01210112

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

Laplacianの意味

V上の関数

jfifLff 2)()(21

⎟⎟⎠

⎞⎜⎜⎝

⎛partpart

++partpart

+partpart

=∆ 2

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

LeK β= L++++= 3322

β gt 0

gKfgefgf TLTH

1 minusminus == β

LL Leedd ββ

β= )()( txHtxH

partpart

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

RKHSの内積

相関構造

i isum ==

KwujKwiKugf Tnj i

Kuf = Kwg =

gfKgf H1 minus=

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

正則化問題

isin i 既知

2))((min H

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

ストリング

ツリーグラフ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

X と Yが独立 [ ] [ ] [ ]YY

(forallω η)

Fourierカーネル

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

X と Yが独立

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

⎟⎟⎟

⎜⎜⎜

=⎟⎟⎟

⎜⎜⎜

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

X と Yが独立

[ ] 0)]([Var)]([Var

YgXfXY

)()(max

=sdotsdot

sdotsdot

sumsum

isinisin

i HiYNi HiXN

i HiYHiXN

YX YkgXkf

YkgXkf

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

βαρβα 22 ~~

~~max~

isinisin

( ) NjT

XNX QZaZakQK )(~11=

( ) NjT

YNY QZaZakQK )(~22=

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

A ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

ˆdetˆdetˆˆˆˆ

detmax

⎟⎟⎠

⎞⎜⎜⎝

⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣ

⎟⎟⎠

⎞⎜⎜⎝

=⎟⎟⎠

⎞⎜⎜⎝

ΣΣΣΣΣΣ

minusminus

ˆˆˆˆ

ˆˆˆˆˆˆ

NXXYXYY

YYXYXXN

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

次元削減

)|( XYp の推定

)|()|( XBYpXYp T=

BTX = (b1TX bd

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

-6 -4 -2 0 2 4 6

Y)100()2exp(1

minus+=

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

（forallf ）

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

UVY |perp

hArr Yf Hisinforall

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

の形に限ると

( )αα XYXXYXYYT

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

最大化

B ΣΣ

⎟⎟⎠

⎞⎜⎜⎝

⎛ΣΣΣΣ

ˆdetˆdet

ˆˆˆˆ

detmin

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

-20 -15 -10 -5 0 5 10 15 20

SIR pHd

CCA PLS

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

カーネル法

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

k( t )

cong同型

harrk( t ) tX

][)( st XXEstk =

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

その他

講義の概要 I

講義の概要 II

カーネルCCA

Representer Theorem

ストリング

Marginalized kernel

Diffusion Kernel

カーネルICA

７まとめ

Documents

カーネル法 - 統計数理研究所fukumizu/ISM_lecture_2004/Lecture...1 カーネル法 正定値カーネルを用いたデータ解析 統計数理研究所福水健次 2004年11月24~26日公開講座「機械学習の最近の話題」

カーネル法 - 統計数理研究所fukumizu/ISM_lecture_2004/Lecture...1 カーネル法正定値カーネルを用いたデータ解析統計数理研究所福水健次 2004年11月24~26日公開講座「機械学習の最近の話題」