Upload
teagan-rich
View
30
Download
0
Embed Size (px)
DESCRIPTION
S 学部. C 学科. W 大学. G 研究室. WEB ページのリンクの関係. Google のページランク. 基本的な仕組は数学的 グラフの行列による表現 隣接行列(推移行列、遷移行列) 固有値と固有ベクトル. 行列の上と左の W, S, C, G は注釈 であり行列に含まれない. S 学部. C 学科. W 大学. G 研究室. WEB ページのリンクの関係. 隣接行列を転置する. 隣接行列 を 転置 する リンクを「出す」側から「受ける」側へ. 1. 1. 1. 1/3. 1/3. S 学部. C 学科. 1/3. W 大学. - PowerPoint PPT Presentation
Citation preview
1
Google のページランク• 基本的な仕組は数学的
グラフの行列による表現 隣接行列(推移行列、遷移行列)固有値と固有ベクトル
0111
1000
0100
0010
G
C
S
WGCSW
行列の上と左の W, S, C, G は注釈であり行列に含まれない
に辺がないから頂点頂点0に辺があるから頂点頂点ji
ji1ija
W 大学
S 学部 C 学科
G 研究室
WEB ページのリンクの関係
2
隣接行列を転置する• 隣接行列 を転置する
リンクを「出す」側から「受ける」側へ)( ijaA
0100
1010
1001
1000
tAW 大学
S 学部 C 学科
G 研究室
WEB ページのリンクの関係
3
隣接行列から推移確率行列へ• 列 (column) の総和が1または0になるように調整
ページの評価値をリンク先に渡す
01003
10103
10013
1000
M
W 大学
S 学部 C 学科
G 研究室
WEB ページのリンクの関係
11
1
1/31/3
1/3
4
推移確率行列の固有値と固有ベクトル
• 固有値 λ と固有ベクトルr
• 行列 M を掛ける(乗算)ということは、グラフの辺に沿って(確率的に)推移するということである
• 固有ベクトルの各要素は M を掛けても定数倍しか変化しない。(安定している)固有ベクトルの各要素がランクになる(ただし要素の和が1となるように正規化する)
rrM
5
固有ベクトルの具体例• GNU Octave を使って計算する。固有値 λ =1が最大
の固有値であり、固有ベクトルは下の左のようになる。
62554.0
62554.0
41703.0
20851.0
33333.0
33333.0
22222.0
11111.0
• これを正規化したページランクは上の右である。
1/9 W 大学
S 学部 C 学科
G 研究室
11
1
1/31/3
1/3
1/3
1/3
2/9
ページランクを記入した図
6
Google における工夫• サイズの大きな
疎 (sparse) 行列の固有ベクトルの計算
• ユーザがランダムにページを渡り歩くと仮定
41
41
41
41
41
41
41
41
41
41
41
41
41
41
41
41
14NN
W 大学
S 学部 C 学科
G 研究室
7
Google におけるページランク• 次の行列の固有ベクトルを求めて、要素の和が
1になるように正規化する。
31409.0
32540.0
23401.0
12649.0
W 大学
S 学部 C 学科
G 研究室
0375.08875.00375.00375.0
320833.00375.08875.00375.0
320833.00375.00375.08875.0
320833.00375.00375.00375.0
4115.085.0
4NM
8
より深く調べるために• 本資料の例題は簡単にするために4つのサイトに閉
じていた。現実の PageRank は早稲田大学( 8/10 )、理工学部( 6/10 )、 CS 学科( 5/10 )、後藤研( 4/10 )。
• 次の資料が参考になるhttp://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html本資料は上記を参考にした。ただし Octave のスクリプトは若干改良した。
• Google の創始者による論文も入手できる。Lawrence Page, Sergey Brin, Rajeev Motwani, Terry Winograd, 'The PageRank Citation Ranking: Bringing Order to the Web', 1998,http://www-db.stanford.edu/~backrub/pageranksub.ps Taher H. Haveliwala, 'Efficient Computation of PageRank', Stanford Technical Report, 1999,http://dbpubs.stanford.edu:8090/pub/1999-31
9
特集:情報数学の演習問題• 2005 年度の定期試験問題の解答を解説します。
2006 年度の諸君の勉強の参考にして下さい。• 次の事実に注意してください。
2004 年度の金曜日(前半)の担当は上田和紀教授、 2005 年度から担当を交代して後藤滋樹です。
• 本日の授業では3題を解説します。残り2題は来週以降に解説する予定。
10
問1.集合 A = { 2, 3, 4, 5 }, 集合 B={ 1, 3, 5, 7 } とするとき、次の (1-1) ~ (1-6) の集合を外延的に表現せよ。
• ヒント: 記号の意味を覚えておく必要がある
)(2)61(
)51(
)41(
)31(
)21(
)11(
B
BA
BA
BA
BA
BA
B
11
問1.解答
• ヒント: 各集合の要素の数を考えてみる
7,5,3,1,7,5,3,7,5,1,7,3,1,5,3,1
,7,5,7,3,5,3,7,1,5,1,3,1,7,5,3,1,
)(2)61(
4,2)51(
7,1,5,1,3,1,1,1,5,0,4,0,3,0,2,0)41(
7,5,5,5,3,5,1,5,7,4,5,4,3,4,1,4
7,3,5,3,3,3,1,3,7,2,5,2,3,2,1,2)31(
5,3)21(
}7,5,4,3,2,1)11(
B
BA
BA
BA
BA
BA
B
12
問2.自然数の集合 N は無限集合である。このとき集合 N 2 が可算無限集合 (enumerable set, countable set) であることを示せ。
• ヒント: N 2 という表記法を誤解しないように
13
問 2 .解答
2}3){( 2 yxyx NNN2
NN は自然数の集合の直積である。
の要素 <x,y> に自然数 を対応づける関数は全単射である。よって と とは対等で同じ濃度をもつ。 集合 が可算無限集合であるから も可算 無限集合である。
N
2NNNNN2
14
問3.次の (3-1) ~ (3-3) で定義する各々の二項関係は、( a )反対称律、( r )反射律、( s )対称律、( t )推移律のどれを満たすか? (3-1) ~ (3-3) の各々について、満たす性質すべてを記号( a, r, s, t )で答えよ。
15
問3.
(3-1) A は 2 次元平面上のすべての点の集合で、関係 R は「点 x は点 y よりも原点より遠くない」と定義される。
(3-2) A は 2 次元平面上のすべての直線の集合で、関係 R は「直線 x と直線 y が平行である」と定義される。
(3-3) 有限集合 A={0, 1, 2, 3, 4} の上で R は R={<0,0>,<1,1,>,<2,2>,<3,3>,<4,4>} と
いうグラフで定義される。
17
レポートの提出方法 (2006 年度 後藤担当)
• レポート用紙を下記の URL からプリントするhttp://www.goto.info.waseda.ac.jp/~goto/infomath.html
1班 ( 奇数班 ), と2班 ( 偶数班 ) で用紙が異なる• 提出場所は、 60 号館 2 階の
CS 学科事務所前の BOXBOX 番号は掲示による
• 締切厳守のこと提出期間は、 2006 年 5 月 22 日 ( 月 ) ~ 26 日 ( 金 ) の間
18
問1 集合の要素• 次の集合に属するすべての要素を列挙せよ。
例:
[1-1] ( または P (P (f g )) )
[1-2]
aaa ,1,,0}{}1,0{
{}22
}}{,{}}}{,{},{,{ aaaaaa
ヒント: [1-2] では+の左と右の集合の要素の数を、まず数えてみる。 これは有限集合である。
20
問3 集合の濃度(可算集合)• 自然数の集合 N={0,1,2,…} の直積 N2=N×N
から N への関数 f(x,y)={(x+y)2+3x+y}÷2 を
考える。
(3-1) f(0,0), f(0,1), f(1,0) ,f(0,2), f(1,1), f(2,0)
の値を計算せよ。
(3-2) N2 は可算集合であることを説明せよ。