Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
2020年度前期 画像情報論
椙山女学園大学非常勤講師岩堀祐之(いわほりゆうじ)[email protected]
1
http://www.cvl.cs.chubu.ac.jp/~iwahori/sugi/imageproc.pdf
http://www.cvl.cs.chubu.ac.jp/~iwahori/sugi/imageproc.pptx
画像系技術分野の名称
•CG (Computer Graphics) 3次元モデルから画像生成・CV (Computer Vision) 画像から3次元モデルを推定:CGとCVは逆の目的である。
•MR (Mixed Reality) 複合現実感・VR (Virtual Reality) 仮想現実感:CGとCVの融合を目指す技術
•PR (Pattern Recognition) 文字・音声・画像認識 OCR 光学的文字読み取り装置
• IP (Image Processing) 画像処理:ディジタル画像をもとに加工や変換をする技術
2
ディジタル化とは
•ディジタル化とは、アナログ(Analog)信号をディジタル(Digital)信号に変換すること。アナログとは「連続」、ディジタルとは「離散」。
•P.33 ディジタル化は「標本化」(サンプリング)→「量子化」→「符号化」(2進数のコード化)の過程をいう。
3
ディジタル画像・2値画像
•ディジタル画像は2次元の縦横からなる情報である。縦横にメッシュ状にいくつかのマス目からなり、各マス目のことを( )という。
•P.34 2値画像とは各画素ごとに真っ白か真っ⿊かいずれかの状態からなる画像のこと。画素の値として真っ白は( )、真っ⿊が( )という状態に対応する。
4
グレイスケール画像
•実際には白⿊(モノクロ;monochrome)濃淡画像は「グレースケール画像(gray scale image)」ともいい、各画素の値が8ビットの情報からなっている。
•各画素8ビット(2進数8けた)の情報で( )とおりの表現が可能で値としては0から( )までをとる。
•8ビットの場合、値( )が真っ⿊、値( )が真っ白に対応する。
5
フルカラー画像
•カラー画像の場合には、RGB(⾚緑⻘)表⾊系で表され、各画素ごとにR成分8ビット、G成分8ビット、B成分8ビットの計( )ビットの情報からなる。
•そのようなカラー画像をフルカラー画像という。フルカラー画像では各画素ごとに(2の( )乗=256の( )乗=約( )とおりの⾊表現が可能になる。
6
BMP画像とJPEG画像
•WindowsパソコンではBMP( )画像がフルカラー画像に対応する。
•デジカメでは一般にサイズ圧縮した形式のJPEG( )画像が記録に使われる。高級一眼デジカメではJPEGだけでなくRAW画像(生の形式の画像)で記録できるものもある。
7
画素数と情報量
•縦2000画素,横3000画素からなるディジタル画像は全部で( ① )画素あり( ② )メガピクセルの画像である.
•グレイスケール画像では1画素( ③ )バイトであり,上の場合,全部で( ④ )バイトの画像となる.
•同じ画素数からなるフルカラー画像の場合には1画素( ⑤ )バイトであり,上の場合,全部で( ⑥ )バイトの画像となる.
8
アフィン変換
•p.16 画像を表示するための幾何学変換には、「 ① 」「 ② 」「 ③ 」「スキュー」などがある。これらの合成変換のことをアフィン変換という。
•ゴム膜状に引き延ばす変換を「 」という。•アフィン変換には2次元と3次元がある。
9
2次元アフィン変換
2次元アフィン変換は= +
または 同次座標系 では
=
と表すことができる.2次元空間での回転や拡大縮小を表す変換である.
10
(2次元)回転行列と平行移動
•原点Oを中心に点 をθ回転して点 に移る回転変換は
=で表される。
• がそれぞれ 方向に だけ平行移動して に移る変換は
=と表せる。
11
2次元アフィン変換
先の=
は同次座標系を用いると
=
と表される。同次座標系表現は平行移動のようなベクトルの和を行列の積和で吸収できるという特徴がある。
12
3次元アフィン変換
3次元アフィン変換は
= +
または 同次座標系 では
=
と表すことができる.3次元空間での回転や拡大縮小を表す変換である.
13
シャッター速度とレンズの絞り
•p.44 シャッター速度が速いと動きが止まった画像が得られる。レンズの絞り(目の瞳孔に相当)を絞ると光量を減らす、絞りを開くと光量を増やす効果がある。
•レンズの絞りの数字の例F1.4 2 2.8 4 5.6 8 11 16左(数字が小さい)ほど絞りが開いた状態右(数字が大きい)ほど絞りを絞った状態数字の意味は右へ1段ずつで光量が1/2になる
•√2 √4 √8 √16 √32 √64 √128√256 14
レンズの絞り
• レンズの直径(口径)がこれらの数字の逆数に比例している。半径、直径を√2倍にすると光量(開口面積)は( ① )倍になるということになる。
• 焦点距離が大きいレンズは望遠レンズ、焦点距離が小さいレンズは広角レンズ、望遠レンズは画角が( ② )、広角レンズは画角が( ③ )。
• レンズの絞りの数字が大きいほど光量は( ④ )。レンズの絞りの数字が小さいほど「ぼけ」が( ⑤ )。速いシャッター速度にしたければレンズの絞りを( ⑥ )ことになり、つまり絞りの数字を( ⑦ )することになる。ピントのあう範囲を被写界深度という。ぼけが少ない=被写界深度が深い(大きい)ということになる。光量を半分にするには口径の半径を( ⑧ )にする。=絞りの数字を1段( ⑨ )数字にする。
15
画像の投影変換−平行投影−
• P.23 物体の各点から画像面に対しての投影線が光軸と平行に投影される。望遠レンズになればなるほど平行投影に近い状態に近似される。遠近感は出ずに距離感がない(のっぺりした感じ)になる。P.23の図1.26の[b] [d]が平行投影の例
16
画像の投影変換−平行投影−
17
画像の投影変換−透視投影−
• 物体の各点から視点(投影中心)の1点に対して投影される。遠近感が出る。広角レンズになるほど遠近感が効いてくる。P.23の図1.26の[a] [c] が透視投影の例
18
画像の投影変換−透視投影−
19
透視投影の考え方(写る大きさ)
カメラは実際にはこのようにフィルムに写る。
•⾝⻑180cmの人を5m離れたところから焦点距離50mmのレンズで写したとき、フィルム面(画像面)には( ① )cmとして写る。
•⾝⻑170cmの人を4m離れたところから焦点距離30mmのレンズで写したとき、フィルム面(画像面)には( ② )cmとして写る。
20
f
透視投影の考え方(焦点距離と画角の関係)
・レンズの焦点距離が50mmで画像サイズが24mm×36mmの場合画角は( ③ )度と表される.・画角が60度となるためには,焦点距離は( ④ )となるはずである.図で画角は⾚い線のなす角を,焦点距離は⻘い線の⻑さを表す.
21
描画の際の座標変換
•p.27 部屋のどこかに物体を置いてそれをどこかから見る。このときにいろいろな座標系がある。これらの座標系を相互に変換して描画する。
•ワールド座標系(世界座標系)•物体座標系(物体上に原点)•カメラ座標系(視点座標系)•これらの相互変換は、回転、平行移動、拡大縮小などの変換(アフィン変換)になる。
22
#03
投影変換とビューポート変換
•投影変換(3次元世界を2次元図形として表示する変換のこと)p.28
•ビューポート変換(指定したウィンドウ範囲の部分を表示する変換)
23
3次元アフィン変換(平行移動)
�� = � + ���� = � + �
� = + ��
����
�
=100
010
001
��
+��
�
��
• 同次座標系 では����
�1
=1 00 1
0 ��
0 �
0 00 0
1 ��
0 1
��1
• と表すことができる.3次元空間での回転や拡大縮小を表す変換である.
24
②
平行移動は以下のような変換である.
3次元アフィン変換(拡大縮小)
�� = ����� = ��� = ��
����
�
=��
00
0�
0
00��
��
+000
• 同次座標系 では����
�1
=�� 00 �
0 00 0
0 00 0
�� 00 1
��1
• と表すことができる.3次元空間での回転や拡大縮小を表す変換である.
25
③
拡大縮小は以下のような変換である.
以下の変換を同次座標で表せ
26
Hint: 平行移動,回転,平行移動を行い,アフィン変換で表すことができ行列の積の形を用いて表すことができる.
④
����1
=
1 0 −��
0 1 −��
0 0 1
��1
平行移動 回 転 平行移動
のように通常のパラメータ(この場合 x, y)に加えて 1 を付加して表現する座標系のこと.意義としては平行移動の「加算」を「行列の積」の形で吸収することができる
3次元空間での点の回転
27
右手座標系で3次元での点の回転行列を考える.3つの回転のうち,ここでは,X 軸についてα回転を考える.回転前の点の座標を
とし,X軸について
α回転後の座標を
とする.
3次元空間での点の回転
28
このとき, ��
から �’�’
への変換に着目したときの関係をもとに,回転前後において,
同次座標���1
から�����’1
に変
換する4×4の回転行列をその過程とともに示せ.
⑤まず2次元に着目してその回転行列はどうなるか.⑥4×4の同次座標系ではどうなるか.
#04
3次元空間での点の回転
29
ここでは,Y 軸についてβ回転を考える.このとき,2次元の変換に着目したときの関係をもとに,回転前後において,同次座標
���1
から�����’1
に変換する
4×4の回転行列をその過程とともに示せ.
①2次元に着目した回転行列はどうなるか.②3次元に着目した回転行列はどうなるか.
3次元空間での点の回転
30
ここでは,左手座標系とし,Z 軸についてγ回転を考える.このとき,2次元の変換に着目したときの関係をもとに,回転前後において,同次座標
���1
から�����’1
に変換する
4×4の回転行列をその過程とともに示せ.
③2次元に着目した回転行列はどうなるか.④3次元に着目した回転行列はどうなるか.
イメージモザイキング
•p.41 イメージモザイキング:複数の画像の貼り合わせ処理のこと(位置合わせ、⾊合わせ)
31
クリッピングとビューボリューム
•p.25 クリッピング:CGで描画する範囲を制限すること
•ビューボリューム:描画する範囲を制限して構成される六面体のこと
32
画像の画素数と情報量
•p.34 横640画素×縦480画素の画像の規格を( ① )という。( ① )のグレイスケール画像は全部で( ② )ビット=( ③ )バイトとなる。
•800×600画素の大きさの画像の規格を( ④ )という。
•地上波デジタル放送のフルハイビジョンとは( ⑤ )×( ⑥ )の画像をいう。
33
テレビの進化
•ハイビジョン(従来の4:3のアスペクト比から( ① : ② )のアスペクト比に)フルハイビジョン(FHD)の解像度は( ③ )×( ④ )
•3DーTVが出てきた(普及せず)さらにはこれからFTV(Free ViewPoint TV)自由視点テレビの時代になると思われる。
34
視点を変えた画像
•アフィン変換はGoogle Earthなどでも表示で用いられている。ある物体を視点(カメラの位置)を変えてみた画像は、視点を固定するかわりに物体を回転させて表示した画像と等価になる。
•実際には3次元空間で物体を回転させてそれをある視点で画像に投影することで画像として表示する。
35
点の運動(自由度)
•空間中の点の運動(motion)の自由度は、回転3+平行移動3の合計6自由度である。英語ではDOF (Degree of Freedom)という。
•回転の3自由度はX軸、Y軸、Z軸のまわりの回転を意味し、平行移動の自由度はX軸、Y軸、Z軸にそれぞれいくつずつずらすかという意味である。
36
エイリアシングとは
•ディジタル信号の標本化(サンプリング)の関係からエイリアシング(縞模様)が発生することがある。P.37
37
ポリゴン (Polygon) とは
•ポリゴン (polygon) とは、分割多角形の微小平面のこと。P.61
•実際には3角形の微小平面(3角形パッチ)がよく用いられる。
38
ポリゴン (Polygon) の進化
グラフィックス技術の進化を反映
39
ポリゴン (Polygon) の意義
1. 任意の形状を分割多角形の貼り合わせで表現できる。
2. ポリゴンを小さくしていくと形状の近似精度が上がる。カクカクからツルツルになる。
40
RGB表色系とCMY表色系
• p.29−p.30• RGB表⾊系 光の3原⾊で加法混⾊表現 レッド、グリーン、
ブルー( p.29 図1.38 左の図)
• CMY表⾊系 カラープリンタの表⾊系 減法混⾊ シアン、マゼンダ、イエロー (p.29 図1.39 右の図)
41
HSV表色系(マンセル表色系)
• HSV表⾊系 Hは⾊相(Hue)、Sは彩度(Saturation)、Vは明度(Value)という。
• ⾊相は本来の⾊情報を抽出するときに用いる。彩度はコントラストを上げたりするときに用いる。明度は明るさ情報。マンセル表⾊系ともいう。P.30 図1.40
• RGB→HSVの変換もよく用いられる。• クロマキー(ブルーバック)マスク処理は肌⾊と⻘が逆の⾊相
になるから。
42
クロマキー(マスク処理)• p.160のクロマキーによ
るマスク処理(⻘バックで写すと肌⾊をうまく抽出できる)
43
バイリニア補間(双一次補間)Bi-linear Interpolation • p.40 2点の値からその中間点の値(補間値)を直線で結んで
得る方法を線形補間という。• 2点ずつ縦方向と横方向に線形補間して4点の値から補間値を得
る方法をバイリニア補間(双一次補間)という。(図1.55)
44
バイリニア補間(双一次補間)
• A,B,C,Dの4点の値を各々100、120、70、100としてP点の補間値をバイリニア補間で求めたい。まずAとBの間を7対3の距離の比で割った点をE点とするとE点の値は( ① )になる。同様にCとDの間を7対3の距離の比で割った点をF点とするとF点の値は( ② )になる。E点とF点を2対3の距離の比で割った点をP点とすると、P点の値は( ③ )になる。
45
バイリニア補間(双一次補間)• A,B,C,Dの4点の値を各々100,120,70,100としてP点の補間値をバイリニア補間で求めたい.まずAとBの間を7対3の距離の比で割った点をE点とするとE点の値は( ⑩ )になる.同様にCとDの間を7対3の距離の比で割った点をF点とするとF点の値は( ⑪ )になる.E点とF点を2対3の距離の比で割った点をP点とすると,P点の値は( ⑫ )になる.
46
A B
C D
E
F
P
ランバート(Lambert)モデル
• p.32 拡散反射のモデル• 面の傾きベクトル n(法線ベクトル)と光源方向ベクトル s と
のなす角 α(図1.43)のコサイン(cos α)に面の明るさが比例する反射特性モデル
47
影との境界線 (i=90度) ではE=0となる。
明るさ最大の点ではn=s(i=0)である。
Lambertモデルの明るさ分布
Phongモデル
• 鏡面反射のモデル
48
影との境界線 (i=90度) ではE=0となる。
明るさ最大の点ではn=s(i=0)である。
Lambertモデルの明るさ分布
ステレオビジョン
• 2つのカメラで奥行き分布を復元する技術(三角測量の原理)視差を利用して対応点を見つけることで三角測量
49
明るさ解析(陰影解析)
• 照明のもとで反射光の明るさ変化から対象の形状を復元する技術
• Shape from Shading (B. K. P. Horn)• Photometric Stereo (Robert J. Woodham)
照度差ステレオ• ニューラルネットワークベース(Neural Network)照度差ステレ
オ(Yuji Iwahori)• ニューラルネットワークベースレンダリング(Rendering)
(Yuji Iwahori)
50
ヒストグラム
• p.132 ヒストグラムは度数分布ともいい、画像のヒストグラムは、値いくつの画素が画像中に何画素あるかを示す分布であり、横軸が画素の値、縦軸が頻度(画像中の画素数)の分布である。
• 画像の統計的な性質を表す情報になる。ヒストグラムはモノクロ画像の場合は1つで、カラー画像の場合は3つ(RGBそれぞれのヒストグラム)ある。(p.133)
51
ヒストグラム• 明るい画像はヒストグラムが[ ]の分布に• 暗い画像はヒストグラムが[ ]の分布になる。
52
ダイナミックレンジの変換
• ダイナミックレンジの拡大処理(コントラストが高い画像に変換する処理)
• ヒストグラムの横幅を広くしてダイナミックレンジを拡大する。
53
��� ��� 0 255
画像fのヒストグラム 画像gのヒストグラム
ダイナミックレンジの変換
•変換前の画像の値をf、変換後の画像の値をgとしてfからgに変換する。
•minは0に、maxは255に変換される。•gはfをもとにどのような変換式で表されるか。
54
��� ��� 0 255
画像fのヒストグラム 画像gのヒストグラムf g
ダイナミックレンジの拡大
入力画像の画素値fを出力画像の画素値gに変換したい。入力画像のmin(最小値)を出力画像では値0に、入力画像のmax(最大値)を出力画像では値255に変換したい。つまり①が①’に、②が②’に対応するように変換すればよい。このとき
①は( )と表される。①’は( )と表される。②は( )と表される。②’は( )と表される。
これらから ①:①’=②:②’ として、fをもとにgは以下のような変換式で表される。
変換式 g=( )55
ダイナミックレンジの変換•maxが150、minが50のときにはf=120に対してg=( ① ) となる。実際には8ビットの濃淡画像のため小数点以下切り捨てされて( ② )となり整数となる。
•maxが100、minが40のとき変換後のgの値が127になったとするともとのfの値は( ③ )であったことになる。
56
空間フィルタリング
•p.145 空間フィルタリング(フィルタリング処理)とは画像の加工をする処理である。
•平滑化フィルタ(平均化フィルタ)はスムージングをするのに使う
•ある画素を中心とした9点分の画素値の平均値を処理後の画素値とする。
•多くのフィルタリング処理は重み係数と対応画素との「積和計算」を行う
57
積和計算とは
•積和計算とは p.146の上の図(重要)ある点を中心とした3×3の大きさのフィルタ係数(重み係数)によって元画像のある点を中心とした3×3の画素値とそれぞれ対応するフィルタ係数を掛け合わせてそれらを足し込んで処理後の画素値を求める。
58
平滑化フィルタの場合もとの画像のある点とその周りの点の画素値がいま
80 85 9090 100 110
100 105 120として (1) 平滑化フィルタのフィルタ係数が
1/9 1/9 1/91/9 1/9 1/91/9 1/9 1/9
のとき、中心画素のこのフィルタ適用後の値を求めよ。 59
鮮鋭化フィルタの場合もとの画像のある点とその周りの点の画素値がいま
80 85 9090 100 110
100 105 120として (2) 鮮鋭化フィルタのフィルタ係数が
-1 -1 -1-1 9 -1-1 -1 -1
のとき、中心画素のこのフィルタ適用後の値を求めよ。
60
フィルタリング処理
•積和計算の結果が負の値になった場合には結果は0とする。あるいは結果が255を超えてしまう場合には255とする。
•フィルタ係数(重み係数)は処理の目的によって異なりいろいろある。
•上に示した (1) 平滑化フィルタ、(2) 鮮鋭化フィルタ、のほか、(3) ラプラシアンフィルタ,ソーベルフィルタ(エッジを抽出するためのフィルタ)などがある。このほか、積和演算のフィルタではないが、ごま塩ノイズの除去を目的にメディアンフィルタがある。
61
ある画素(i, j)と周りの画素との関係
f(i-1, j-1) f(i-1, j) f(i-1, j+1)
f(i, j-1) f(i, j) f(i, j+1)
f(i+1, j-1) f(i+1, j) f(i+1, j+1)
62
i-1
i
i+1
j-1 j j+1
プログラムでは i とか j という変数を用いてある画素と隣接画素を指定する.f (i,j) という表記は画素(i,j)の値を表す.
ラプラシアンフィルタの場合ある画素の周りが
40 50 6070 70 90
100 110 120このとき中心画素 70 はラプラシアンフィルタの処理後に( ① )となる。もとの画像を f として処理後の画像を gとして、もとの画像のある画素 (i, j) の値を f (i,j)とする。処理後の画像の値を g (i,j)とする。このとき中心ー4、上下左右+1の重み係数のラプラシアンフィルタの場合、g (i,j) を f(i,j) で表す式を考えると
g(i,j)= f(i-1,j)+f(i+1,j)+f(i,j-1)+f(i,j+1) -4* f(i,j)
のように表すことができる.fが元画像でgが新たな画像という意味である. 63
ラプラシアンフィルタの意味
ラプラシアンフィルタは縦横両方向の2次微分フィルタである。縦方向(i方向)の2次微分は
{ f(i+1,j)-f(i,j) } - { f(i,j)-f(i-1,j) }すなわち{ f(i+1,j)-2f(i,j)+f(i-1,j) } …①
横方向(j方向)の2次微分は{ f(i,j+1)-f(i,j) } - { f(i,j)-f(i,j-1) }
すなわち{ f(i,j+1)-2f(i,j)+f(i,j-1) } …②i方向とj方向を足すことで得られる。
f(i+1,j)+f(i-1,j) +f(i,j+1)+f(i,j-1)-4 f(i,j)
64
鮮鋭化フィルタの意味
ラプラシアンフィルタはg(i,j)=f(i+1,j)+f(i-1,j) +f(i,j+1)+f(i,j-1)-4 f(i,j) であり、元画像からこのラプラシアンフィルタの結果を引いた結果が鮮鋭化フィルタである。g(i,j)=f(i,j)-{f(i+1,j)+f(i-1,j) +f(i,j+1)+f(i,j-1)
-4 f(i,j) }=5 f(i,j) -{f(i+1,j)+f(i-1,j) +f(i,j+1)+f(i,j-
1)}となる。
65
鮮鋭化フィルタの場合
先の(2) 鮮鋭化フィルタの場合にはg(i,j)= 9*f(i,j) – f(i-1,j-1)-f(i-1,j)-f(i-1,j+1)-f(i,j-1)-f(i,j+1)-f(i+1,j-1)-f(i+1,j)-f(i+1,j+1)
と表すことができる。
66
f(i-1,j-1)
f(i-1,j) f(i-1,j+1)
f(i,j-1) f(i,j) f(i,j+1)
f(i+1,j-1)
f(i+1,j) f(i+1,j+1)
−1 −1 −1
−1
−1 −1 −1
−1+9
積和計算フィルタの確認
http://www.cvl.cs.chubu.ac.jpのSimulator for understanding …をクリック、その中の「お試し」をクリック、その中の「画像処理」をクリック
Photofunia(面白ソフト)紹介!
67
メディアンフィルタ(中央値フィルタ)
ある点の9近傍(3*3)の画素値を並べ替えて、その中央値(メディアン)をある点の処理後の値とするフィルタ。メディアンフィルタは積和演算フィルタではない。並べ替えの例としてバブルソートを⿊板で示し、その様子を理解し、自分でも並べ替えができるようにしておくこと。
68
メディアンフィルタ
ある画素の周りの9点の値の並べ替えを行ってその中央値(5番目になる値)を新たな値とする。例えば
45 50 5548 47 5150 54 46
であるとき 45 50 55 48 47 51 50 54 46 をもとに並べ替えを行い、その結果は45 46 47 48 50 50 51 54 55となる。現在f(i,j)が47のときメディアンフィルタ適用後の新たな画像のg(i,j)は50となる。 69
メディアンフィルタ
ある画素の周りの9点の値の並べ替えを行ってその中央値(5番目になる値)を新たな値とする。いま
56 52 4551 48 4754 53 46
であるとき,並べ替えを行い、その様子を示すとともに,メディアンフィルタ適用後の値はいくつになるか.
70
スムーズシェーディング p.85•コンスタントシェーディング
スムーズシェーディングではないポリゴン内明るさ一定
•グローのスムーズシェーディングポリゴン頂点の明るさから補間
•フォンのスムーズシェーディングポリゴン頂点の法線ベクトルから補間法線ベクトルから明るさ計算
•フォンのスムーズシェーディングのほうがハイライトを表現(写実的な表現)できている。
71
スムーズシェーディング
分割した点A)と点B(2点を7:3に分割した点B)での明るさはそれぞれ(① )と(② )になる。(b)の場合、↑の点での向き(法線ベクトルの角度)が左から各々135度、100度、80度、45度としたとき、それらをもとに図のように線形補間をしたとすると、点A(2点を3:2の分割した点A)と点B(2点を7:3に分割した点B)で向き(法線ベクトルの角度)はそれぞれ(③ )と(④ )になる。(a)は明るさそのものの補間による方法、(b)は法線ベクトルの補間により明るさを計算する方法であるが、(a)と(b)では(⑤ )のほうが出来上がる画像の明るさ分布の写実的な(光沢をより反映した)画像となる。
72
(a)グローシェーディングと(b)フォンシェーディングを考える.(a)の場合、↑の点での頂点の明るさが左から各々90, 120, 100, 70であり、それらをもとに図のように線形補間をしたとすると、点A(2点を3:2の
画像の2点間の距離
•2点の座標を(2,3)と(7,9)とするとき、2点の1)ユークリッド距離2)市街区距離3)チェス盤距離はいくつになるか.またそれぞれの経路の例を図で示せ。
73
画像の2点間の距離
•ユークリッド距離は2点を直線で結んだときの距離
•ユークリッド距離は( )となる。
74
画像の2点間の距離
•市街区距離は2点を上下左右のマス目で結んだ距離(片側に立って上下左右方向にもう片側まで何歩でいけるかという距離)
•市街区距離は( )となる。•チェス盤距離は上下左右のほかに斜めも含めて8方向にマス目で結んだ距離(片側に立って8方向にもう片側まで何歩でいけるかという距離)
•チェス盤距離は( )となる。75
距離の例(図)
76
距離の問題
• 下の例で点(2,6)と点(9,3)とがあるとき、(1)2点のユークリッド距離はいくつになるか。(2)市街区距離はいくつになるか、そしてパスの例を示せ。(3)チェス盤距離はいくつになるか、そしてパスの例を示せ。
(1)ユークリッド距離(式を示して解答する)
77
市街区距離
78
チェス盤距離
79
3次元のユークリッド距離
3次元の座標からなる点 � � �と � � � のユークリッド距離dを式で表せ.
� ��
� ��
� ���
パターン認識では,パターンの特徴は点の座標として一般にn次元ベクトルで表すことができ,点の距離が近いほど,パターンが近い.手順としては特徴抽出をして認識という過程からなる.
80
Shading(陰影付け)基礎問題
81
平行光線照明とし、sを天頂角α、方位角βで表すとs= (sinαcosβ, sinαsinβ, cosα)で表される。またn= (−p,−q, 1)/r, 但しr = !� + "� + 1
� とする。このとき完全拡散反射モデル(Lambertモデル)の面の明るさEをsとnの各成分を用いて表せ。解答例:Lambertモデルではn とsを用いて①となり,これをもとに(p,q)で表すと② #$ %&' ( )*% + #, %&' ( %&' +-)*% (
$.-,.-��
のように表すことができる.(このあたりは難しいかもしれませんね)
面の傾きパラメータ(p,q)
82
X,Y,Z座標系で中心 (0,0,0)、半径rの球を想定したとき、球の方程式をもとに、ZをXとYでそれぞれ偏微分した傾きパラメータ p, q = (
34
35,
34
36) を求めたい。球の各点(X,Y)の傾
きパラメータ p, q はそれぞれどのような形になるかを導出せよ。解答例:上の場合の球の方程式は③ �� + �� + �� = 8�
となり,左辺をZとすれば④ � = 8� − �� − ���
となる.pはZをXで偏微分,qはZをYで偏微分して各々⑤ ! =
34
35=
�
�8� − �� − �� #
9
. −2� = −5
4
q =34
36=
�
�8� − �� − �� #
9
. −2� = −6
4
となる.(このあたりは難しいかもしれませんね)
問題物体面上のある点での光源方向ベクトルをs,面の傾きベクトルをn,視線方向ベクトルをvとし,いずれも「単位ベクトル」とする.Z軸方向からカメラで観測する(視線方向がZ軸方向にある)とき,ベクトルvはv=(0,0,1)とする.(1) 原点Oを中心とした右手座標系において上方向(天
頂方向)をZ軸とする.sとnのベクトル成分表示を各々s= (Sx,Sy,Sz), n= (−p,−q, 1)/r, 但しr =
!� + "� + 1� とする.このとき完全拡散反射モデル(Lambertモデル)の面の明るさEをsとnの各成分を用いて表せ.
(2) Lambertモデルで明るさEが最大となる点はどのような点か.そのような点ではsとnの各成分の関係式を示せ.
83
解答例:
(1) E=(s,n)= : ; <
. .�
(2) s = nの点でEは最大となるので,以下の条件のときとなる.
= �
ここで � ��
84
画像情報論用語整理(プリント)
http://www.cvl.cs.chubu.ac.jp/~iwahori/sugi/some_of_words.pdf
85
コンピュータビジョン研究紹介•トリケップスセミナー 2012.03.27
3次元物体認識とその応用•https://www.dropbox.com/s/qcr9a5d2mx0t1ht/triceps_20120327.pptx
• Invited Talk at UBC Computer Science (2013.03.04)
3D Shape Analysis and Object Detection in Computer Vision
•https://www.dropbox.com/s/yfp2zg6sru6qegz/UBC2013_Iwahori_talk.pptx
86