Upload
kohta-ishikawa
View
4.568
Download
0
Embed Size (px)
DESCRIPTION
Citation preview
量子アニーリング解説 1
2012/10 @_kohta
アウトライン
• 量子力学入門 – 状態、純粋状態、混合状態
• 古典力学の世界と量子力学の世界 • 量子力学の世界
– 純粋状態と混合状態
• 機械学習への応用 – クラス分類問題
• 量子アニーリングによる最適化
• to be con1nued
量子力学入門
background image : h9p://personal.ashland.edu/rmichael/courses/phys403/phys403.html
状態、純粋状態、混合状態
• 古典力学の世界
• 量子力学の世界
粒子の状態 (x, p)位置と運動量を決めれば 古典的な粒子の状態は完全に決まる
粒子の状態
位置と運動量を同時に決めることができない (不確定性原理) 物理的に可能な限り情報を指定し尽くしたとき 「指定の仕方」が、あるベクトル空間の元となる (複素ヒルベルト空間)
| i : 状態ベクトル
: 相空間の座標
状態、純粋状態、混合状態
• 純粋状態 – 前述の「物理的に可能な限り情報を指定し尽くした状態」
を純粋状態と呼ぶ – 普通の量子力学で扱う対象で、シュレディンガー方程式
に従う
– Hamiltonianは状態ベクトルに対する(エルミート)演算子で、(有限次元の場合)行列で書くこともできる • 要するに行列Hの固有値問題
H| i = E| i
系のHamiltonian エネルギー固有値
状態、純粋状態、混合状態
• 純粋状態 – 具体的に計算するときは、何らかの基底で「表示」する必
要がある • ベクトルの成分を計算することに対応する
• (例えば)「座標」表示 → シュレディンガー方程式の左から を作用
h�|| i
: ブラ・ベクトル (ケットに作用してスカラー複素数を返す)
: ケット・ベクトル
h�| i : 2つのケット と の内積 |�i | i
hx|
hx|H| i = Hx
hx| i = Ehx| i座標表示のHamiltonian (微分演算子)
座標表示の状態ベクトル (波動関数)
状態、純粋状態、混合状態
• 純粋状態と確率 – (例えば)座標表示の波動関数 が わかると、 「粒子が位置x~x+dxにある確率」は となる(ボルン則/量子力学の確率解釈) – 状態が「位置演算子」の固有状態になっているときは、確
率密度はδ関数となる • 可換な演算子の組は同時対角化可能で、それらの値を同時に正
確に決定することができる • xとpは非可換なので同時に決定できない
– 「非可換の度合い」が不確定性の大きさを決める
hx| i ⌘ (x)
P (x) = | (x)|2dx
状態、純粋状態、混合状態
• 混合状態 – 純粋状態は、具体的な表示で見ると
などとなり、固有状態の重ね合わせ(様々な位置にいる 状態が同時に混在している)となっている。 – 一方、複数の純粋状態の「古典的な重ね合わせ」を考え
たい場合もある • 統計力学では、多数の粒子のあり得る配位についての確率的な
平均を考える • それぞれの配位は物理的に干渉する訳ではないので、古典的な
重ね合わせとなる • そのような状態を混合状態と呼ぶ
| i =X
x
|xihx| i =X
x
(x)|xi
状態、純粋状態、混合状態
• 混合状態 – 定義から、純粋状態 を確率的重み で混合した混合状態に対して、物理量Aの 確率分布は となる。
| 1i, · · · , | kip1, · · · , pk
物理量Aが固有値aをとる状態のブラベクトル
P (a) =X
i
pi|ha| ii|2
状態、純粋状態、混合状態
• 混合状態 – そのような混合状態を表すために、以下の密度演算子を
考えると便利
– 密度演算子が与えられると、物理量Aの確率分布は
と書け、期待値は と書ける
⇢̂ =X
i
pi| iih i|
P (a) = ha|⇢̂|ai
X
a
aP (a) =X
a
aha|⇢̂|ai =X
a
ha|⇢̂A|ai ⌘ Tr(⇢̂A)
⇢̂ =X
x,x
0
|xihx|⇢̂|x0ihx0|
密度演算子の行列表示(密度行列)
機械学習への応用
量子アニーリング
• 混合状態の量子力学の確率論的な枠組みを応用 – (純粋状態の理論で定式化する流儀もあるらしい)
• クラス分類問題 – N個のデータをK個のクラスに分類する
• kNN法を始めとして色々やり方がある
– 変分ベイズによる方法に量子効果を導入する • Issei Sato, et al. “Quantum Annealing for Varia1onal Bayes Inference”
– クラスタリング • Kenichi Kurihara, et al. “Quantum Annealing for Clustering”
クラス分類問題と密度行列
• クラス分類問題 – データ をK個のクラスに分類する
問題 • 単一データ のクラス割り当てを以下のように書く
• N個のデータ全てに対するある割り当ては
となる。 – K=N=2のとき、 なら
x = x1, · · · , xN
xk
�̃k = (0, · · · , 0, 1, 0, · · · , 0)T
K次元
� = ⌦Nk=1�̃k
�̃1 = (1, 0)T �̃2 = (0, 1)T
�̃1 ⌦ �̃2 = (0, 1, 0, 0)T
A⌦B =
0
B@a11B · · · a1lB...
. . ....
ak1B · · · aklB
1
CA
クロネッカー積
クラス分類問題と密度行列
• 例えばK=N=2の場合 – 4通りの状態をとる確率が のとき、次の
ような密度行列を考える
– 量子力学とのアナロジーを考えると
p1, p2, p3, p4
diag(p1, p2, p3, p4) =X
i
pi�(i)�(i)T
�(i) 2 {(1, 0, 0, 0)T , (0, 1, 0, 0)T , (0, 0, 1, 0)T , (0, 0, 0, 1)T }
�(i)状態ベクトル(ケット):
diag(� log p1, · · · ,� log p4)Hamiltonian:
クラス分類の量子力学的定式化
• 以下のようなHamiltonianを考える
– Hamiltonianに量子効果を入れる
log p(x) = log Tr{e�Hc}
Hc = diag(� log p(x,�(1)), · · · ,� log p(x,�(NK)
))
Hq
=NX
i=1
�xi
,�⌦i�1
j=1EK
�⌦ �
x
⌦�⌦N
l=i+1EK
�
�x
= �(EK
� 1K
)
H = Hc +Hq
後の鈴木-‐Tro9er展開で うまく計算できる形になる
H =
0
BB@
� log p(x,�(1)) �� �� 0
�� � log p(x,�(2)) 0 ��
�� 0 � log p(x,�(3)) ��
0 �� �� � log p(x,�(4))
1
CCA
イメージ
密度行列と古典的確率
• Hamiltonianが対角なら、問題は(通常の)古典的な確率モデルと完全に一致する – 密度行列を用いることで、Hamiltonianの非対角項に量子論的
効果を入れることができるようになる – 量子アニーリングでは、非対角項を使って局所最適解から抜
け出すことを考える
• 一般的な処方箋 – データと状態について、対角要素が古典的確率となるHamiltonianを設計する
– 適当な量子効果を入れた相互作用Hamiltonianを追加し、鈴木-‐Tro9er展開を用いて対角な(サンプリング可能な)確率モデルの積として近似する
– 量子効果を徐々に弱めるアニーリングを行いながらサンプリングし、最適解を求める
変分ベイズ法とクラス分類
• 変分ベイズ法の枠組み – 隠れ変数σ、パラメータθがある観測変数xの確率分布 – 観測xに対するσの事後分布
を求めたいが、厳密に計算するのは難しい
• クラス分類問題 – 観測変数x(データ)と、隠れ変数σ(データのクラス分類)
に対して、データxに対するσの事後分布を求める問題
P (x,�, ✓)
P (�, ✓|x)
変分ベイズ法とクラス分類
• 変分ベイズ法の枠組み – xについての周辺尤度が
と書け、等号が のときに成り立つ ことを利用する – を最大化するqを変分的に求め、それを事後分布と
見なすことができる(F[q]を変分自由エネルギーと呼ぶ) • そのままではqを求めることができない
logP (x) =
X
�
Zd✓q(�, ✓) log
P (x,�, ✓)
q(�, ✓)
+ KL(q||P (�, ✓|x))
�X
�
Zd✓q(�, ✓) log
P (x,�, ✓)
q(�, ✓)
⌘ F [q]
q(�, ✓) = P (�, ✓|x)
F [q]
変分ベイズ以外の方法
• MCMCなどを用いて、なんとか からサンプリングする方法もある – クラスラベル空間全体から一度にサンプリングするのは
難しい – 1変数を残して他を固定してサンプリングする過程を繰り
返す、ギブスサンプラーの方法を使える形にしたい
P (�, ✓|x)
量子的Hamiltonianの取り扱い
• 量子効果を入れたHamiltonianはまともに計算することができない
– 非対角な行列のexp?? • 鈴木-‐Tro9er展開
• Hamiltonianの非対角部分を計算可能な形に近似し、MCMCサンプリングなどを行う
• mが一つの独立な対角Hamiltonianに対応する形となり、実装的にはm個のシミュレーテッドアニーリングを走らせることになる
exp
X
l
Al
!=
Y
l
exp
✓Al
m
◆!m
+O
✓1
m
◆
logP (x) = logTr{e�(Hc+Hq)}
アニーリング
• 温度項の導入
• アニーリング – シミュレーテッドアニーリング
• βを徐々に増加(温度を低下)させながらサンプリング
– 量子アニーリング • βを徐々に増加させ、量子Hamiltonianの係数Γを徐々にゼロに近
づけながらサンプリング
logP (x) = logTr{e��(Hc+Hq)}逆温度(物理的には1/kBT)
Γ
T
SA QA
SA SA
QA QA
実験結果(文献より)
• 変分ベイズの方法 – 対数尤度値で見て、SAに比べ分類性能が10%程度改善し
たらしい – SAに比べ、局所解に陥りにくくなる性質があるらしい