2020年度前期画像情報論 - chubu-univiwahori/sugi/imageproc.pdf画像系技術分野の名称 •CG (Computer Graphics) ∬次元⋻⋠ ≱⊯画像昏昅・CV (Computer Vision)

2020年度前期画像情報論

椙山女学園大学非常勤講師岩堀祐之（いわほりゆうじ）[email protected]

1

http://www.cvl.cs.chubu.ac.jp/~iwahori/sugi/imageproc.pdf

http://www.cvl.cs.chubu.ac.jp/~iwahori/sugi/imageproc.pptx

画像系技術分野の名称

•CG (Computer Graphics) ３次元モデルから画像生成・CV (Computer Vision) 画像から３次元モデルを推定：CGとCVは逆の目的である。

•MR (Mixed Reality) 複合現実感・VR (Virtual Reality) 仮想現実感：CGとCVの融合を目指す技術

•PR (Pattern Recognition) 文字・音声・画像認識 OCR 光学的文字読み取り装置

• IP (Image Processing) 画像処理：ディジタル画像をもとに加工や変換をする技術

2

ディジタル化とは

•ディジタル化とは、アナログ（Analog）信号をディジタル（Digital）信号に変換すること。アナログとは「連続」、ディジタルとは「離散」。

•P.33 ディジタル化は「標本化」（サンプリング）→「量子化」→「符号化」（２進数のコード化）の過程をいう。

3

ディジタル画像・２値画像

•ディジタル画像は２次元の縦横からなる情報である。縦横にメッシュ状にいくつかのマス目からなり、各マス目のことを（）という。

•P.34 ２値画像とは各画素ごとに真っ白か真っ⿊かいずれかの状態からなる画像のこと。画素の値として真っ白は（）、真っ⿊が（）という状態に対応する。

4

グレイスケール画像

•実際には白⿊（モノクロ；monochrome）濃淡画像は「グレースケール画像（gray scale image）」ともいい、各画素の値が８ビットの情報からなっている。

•各画素８ビット（２進数８けた）の情報で（）とおりの表現が可能で値としては０から（）までをとる。

•８ビットの場合、値（）が真っ⿊、値（）が真っ白に対応する。

5

フルカラー画像

•カラー画像の場合には、RGB（⾚緑⻘）表⾊系で表され、各画素ごとにR成分８ビット、G成分８ビット、B成分８ビットの計（）ビットの情報からなる。

•そのようなカラー画像をフルカラー画像という。フルカラー画像では各画素ごとに（２の（）乗＝２５６の（）乗＝約（）とおりの⾊表現が可能になる。

6

BMP画像とJPEG画像

•WindowsパソコンではBMP（）画像がフルカラー画像に対応する。

•デジカメでは一般にサイズ圧縮した形式のJPEG（）画像が記録に使われる。高級一眼デジカメではJPEGだけでなくRAW画像（生の形式の画像）で記録できるものもある。

7

画素数と情報量

•縦２０００画素，横３０００画素からなるディジタル画像は全部で（ ① ）画素あり（ ② ）メガピクセルの画像である．

•グレイスケール画像では１画素（ ③ ）バイトであり，上の場合，全部で（ ④ ）バイトの画像となる．

•同じ画素数からなるフルカラー画像の場合には１画素（ ⑤ ）バイトであり，上の場合，全部で（ ⑥ ）バイトの画像となる．

8

アフィン変換

•p.16 画像を表示するための幾何学変換には、「 ① 」「 ② 」「 ③ 」「スキュー」などがある。これらの合成変換のことをアフィン変換という。

•ゴム膜状に引き延ばす変換を「」という。•アフィン変換には２次元と３次元がある。

9

２次元アフィン変換

２次元アフィン変換は= +

または同次座標系では

=

と表すことができる．２次元空間での回転や拡大縮小を表す変換である．

10

（２次元）回転行列と平行移動

•原点Oを中心に点をθ回転して点に移る回転変換は

=で表される。

• がそれぞれ方向にだけ平行移動してに移る変換は

=と表せる。

11

２次元アフィン変換

先の=

は同次座標系を用いると

=

と表される。同次座標系表現は平行移動のようなベクトルの和を行列の積和で吸収できるという特徴がある。

12

３次元アフィン変換

３次元アフィン変換は

= +

または同次座標系では

=

と表すことができる．３次元空間での回転や拡大縮小を表す変換である．

13

シャッター速度とレンズの絞り

•p.44 シャッター速度が速いと動きが止まった画像が得られる。レンズの絞り（目の瞳孔に相当）を絞ると光量を減らす、絞りを開くと光量を増やす効果がある。

•レンズの絞りの数字の例F1.4 2 2.8 4 5.6 8 11 16左（数字が小さい）ほど絞りが開いた状態右（数字が大きい）ほど絞りを絞った状態数字の意味は右へ1段ずつで光量が1/2になる

•√2 √4 √8 √16 √32 √64 √128√256 14

レンズの絞り

• レンズの直径（口径）がこれらの数字の逆数に比例している。半径、直径を√2倍にすると光量（開口面積）は（ ① ）倍になるということになる。

• 焦点距離が大きいレンズは望遠レンズ、焦点距離が小さいレンズは広角レンズ、望遠レンズは画角が（ ② ）、広角レンズは画角が（ ③ ）。

• レンズの絞りの数字が大きいほど光量は（ ④ ）。レンズの絞りの数字が小さいほど「ぼけ」が（ ⑤ ）。速いシャッター速度にしたければレンズの絞りを（ ⑥ ）ことになり、つまり絞りの数字を（ ⑦ ）することになる。ピントのあう範囲を被写界深度という。ぼけが少ない＝被写界深度が深い（大きい）ということになる。光量を半分にするには口径の半径を（ ⑧ ）にする。＝絞りの数字を１段（ ⑨ ）数字にする。

15

画像の投影変換−平行投影−

• P.23 物体の各点から画像面に対しての投影線が光軸と平行に投影される。望遠レンズになればなるほど平行投影に近い状態に近似される。遠近感は出ずに距離感がない（のっぺりした感じ）になる。P.23の図1.26の[b] [d]が平行投影の例

16

画像の投影変換−平行投影−

17

画像の投影変換−透視投影−

• 物体の各点から視点（投影中心）の１点に対して投影される。遠近感が出る。広角レンズになるほど遠近感が効いてくる。P.23の図1.26の[a] [c] が透視投影の例

18

画像の投影変換−透視投影−

19

透視投影の考え方（写る大きさ）

カメラは実際にはこのようにフィルムに写る。

•⾝⻑180cmの人を5m離れたところから焦点距離50ｍｍのレンズで写したとき、フィルム面（画像面）には（ ① ）cmとして写る。

•⾝⻑170cmの人を4m離れたところから焦点距離30ｍｍのレンズで写したとき、フィルム面（画像面）には（ ② ）cmとして写る。

20

f

透視投影の考え方（焦点距離と画角の関係）

・レンズの焦点距離が50mmで画像サイズが24mm×36mmの場合画角は（ ③ ）度と表される．・画角が60度となるためには，焦点距離は（ ④ ）となるはずである．図で画角は⾚い線のなす角を，焦点距離は⻘い線の⻑さを表す．

21

描画の際の座標変換

•p.27 部屋のどこかに物体を置いてそれをどこかから見る。このときにいろいろな座標系がある。これらの座標系を相互に変換して描画する。

•ワールド座標系（世界座標系）•物体座標系（物体上に原点）•カメラ座標系（視点座標系）•これらの相互変換は、回転、平行移動、拡大縮小などの変換（アフィン変換）になる。

22

#03

投影変換とビューポート変換

•投影変換（３次元世界を２次元図形として表示する変換のこと）p.28

•ビューポート変換（指定したウィンドウ範囲の部分を表示する変換）

23

３次元アフィン変換（平行移動）

�� = � + �� = � + �

� = + ��

��

�

=100

010

001

��

+��

�

��

• 同次座標系では��

�1

=1 00 1

0 ��

0 �

0 00 0

1 ��

0 1

��1

• と表すことができる．３次元空間での回転や拡大縮小を表す変換である．

24

②

平行移動は以下のような変換である．

３次元アフィン変換（拡大縮小）

�� = �� = �� = ��

��

�

=��

00

0�

0

00��

��

+000

• 同次座標系では��

�1

=�� 00 �

0 00 0

0 00 0

�� 00 1

��1

• と表すことができる．３次元空間での回転や拡大縮小を表す変換である．

25

③

拡大縮小は以下のような変換である．

以下の変換を同次座標で表せ

26

Hint: 平行移動，回転，平行移動を行い，アフィン変換で表すことができ行列の積の形を用いて表すことができる．

④

��1

=

1 0 −��

0 1 −��

0 0 1

��1

平行移動回転平行移動

のように通常のパラメータ（この場合 x, y）に加えて 1 を付加して表現する座標系のこと．意義としては平行移動の「加算」を「行列の積」の形で吸収することができる

３次元空間での点の回転

27

右手座標系で３次元での点の回転行列を考える．３つの回転のうち，ここでは，X 軸についてα回転を考える．回転前の点の座標を

とし，X軸について

α回転後の座標を

とする．


28

このとき， ��

から �’�’

への変換に着目したときの関係をもとに，回転前後において，

同次座標��1

から��’1

に変

換する４×４の回転行列をその過程とともに示せ．

⑤まず２次元に着目してその回転行列はどうなるか．⑥４×４の同次座標系ではどうなるか．

#04


29

ここでは，Y 軸についてβ回転を考える．このとき，２次元の変換に着目したときの関係をもとに，回転前後において，同次座標

��1

から��’1

に変換する

４×４の回転行列をその過程とともに示せ．

①２次元に着目した回転行列はどうなるか．②３次元に着目した回転行列はどうなるか．


30

ここでは，左手座標系とし，Z 軸についてγ回転を考える．このとき，２次元の変換に着目したときの関係をもとに，回転前後において，同次座標

��1

から��’1

に変換する

４×４の回転行列をその過程とともに示せ．

③２次元に着目した回転行列はどうなるか．④３次元に着目した回転行列はどうなるか．

イメージモザイキング

•p.41 イメージモザイキング：複数の画像の貼り合わせ処理のこと（位置合わせ、⾊合わせ）

31

クリッピングとビューボリューム

•p.25 クリッピング：CGで描画する範囲を制限すること

•ビューボリューム：描画する範囲を制限して構成される六面体のこと

32

画像の画素数と情報量

•p.34 横640画素×縦480画素の画像の規格を（ ① ）という。（ ① ）のグレイスケール画像は全部で（ ② ）ビット=（ ③ ）バイトとなる。

•800×600画素の大きさの画像の規格を（ ④ ）という。

•地上波デジタル放送のフルハイビジョンとは（ ⑤ ）×（ ⑥ ）の画像をいう。

33

テレビの進化

•ハイビジョン（従来の４：３のアスペクト比から（ ① ： ② ）のアスペクト比に）フルハイビジョン（FHD)の解像度は（ ③ ）×（ ④ ）

•３DｰTVが出てきた（普及せず）さらにはこれからFTV（Free ViewPoint TV）自由視点テレビの時代になると思われる。

34

視点を変えた画像

•アフィン変換はGoogle Earthなどでも表示で用いられている。ある物体を視点（カメラの位置）を変えてみた画像は、視点を固定するかわりに物体を回転させて表示した画像と等価になる。

•実際には３次元空間で物体を回転させてそれをある視点で画像に投影することで画像として表示する。

35

点の運動（自由度）

•空間中の点の運動（motion）の自由度は、回転３＋平行移動３の合計６自由度である。英語ではDOF (Degree of Freedom)という。

•回転の３自由度はX軸、Y軸、Z軸のまわりの回転を意味し、平行移動の自由度はX軸、Y軸、Z軸にそれぞれいくつずつずらすかという意味である。

36

エイリアシングとは

•ディジタル信号の標本化（サンプリング）の関係からエイリアシング（縞模様）が発生することがある。P.37

37

ポリゴン (Polygon) とは

•ポリゴン (polygon) とは、分割多角形の微小平面のこと。P.61

•実際には３角形の微小平面（３角形パッチ）がよく用いられる。

38

ポリゴン (Polygon) の進化

グラフィックス技術の進化を反映

39

ポリゴン (Polygon) の意義

1. 任意の形状を分割多角形の貼り合わせで表現できる。

2. ポリゴンを小さくしていくと形状の近似精度が上がる。カクカクからツルツルになる。

40

RGB表色系とCMY表色系

• p.29−p.30• RGB表⾊系光の３原⾊で加法混⾊表現レッド、グリーン、

ブルー( p.29 図1.38 左の図)

• CMY表⾊系カラープリンタの表⾊系減法混⾊シアン、マゼンダ、イエロー (p.29 図1.39 右の図)

41

HSV表色系（マンセル表色系）

• HSV表⾊系 Hは⾊相(Hue)、Sは彩度(Saturation)、Vは明度(Value)という。

• ⾊相は本来の⾊情報を抽出するときに用いる。彩度はコントラストを上げたりするときに用いる。明度は明るさ情報。マンセル表⾊系ともいう。P.30 図1.40

• RGB→HSVの変換もよく用いられる。• クロマキー（ブルーバック）マスク処理は肌⾊と⻘が逆の⾊相

になるから。

42

クロマキー（マスク処理）• p.160のクロマキーによ

るマスク処理（⻘バックで写すと肌⾊をうまく抽出できる）

43

バイリニア補間（双一次補間）Bi-linear Interpolation • p.40 2点の値からその中間点の値（補間値）を直線で結んで

得る方法を線形補間という。• 2点ずつ縦方向と横方向に線形補間して4点の値から補間値を得

る方法をバイリニア補間（双一次補間）という。(図1.55)

44

バイリニア補間（双一次補間）

• Ａ，Ｂ，Ｃ，Ｄの４点の値を各々１００、１２０、７０、１００としてＰ点の補間値をバイリニア補間で求めたい。まずＡとＢの間を７対３の距離の比で割った点をＥ点とするとＥ点の値は（ ① ）になる。同様にＣとＤの間を７対３の距離の比で割った点をＦ点とするとＦ点の値は（ ② ）になる。Ｅ点とＦ点を２対３の距離の比で割った点をＰ点とすると、Ｐ点の値は（ ③ ）になる。

45

バイリニア補間（双一次補間）• Ａ，Ｂ，Ｃ，Ｄの４点の値を各々１００，１２０，７０，１００としてＰ点の補間値をバイリニア補間で求めたい．まずＡとＢの間を７対３の距離の比で割った点をＥ点とするとＥ点の値は（ ⑩ ）になる．同様にＣとＤの間を７対３の距離の比で割った点をＦ点とするとＦ点の値は（ ⑪ ）になる．Ｅ点とＦ点を２対３の距離の比で割った点をＰ点とすると，Ｐ点の値は（ ⑫ ）になる．

46

A B

C D

E

F

P

ランバート(Lambert)モデル

• p.32 拡散反射のモデル• 面の傾きベクトル n（法線ベクトル）と光源方向ベクトル s と

のなす角 α（図1.43）のコサイン(cos α)に面の明るさが比例する反射特性モデル

47

影との境界線 (i=90度) ではE=0となる。

明るさ最大の点ではn=s（i=0）である。

Lambertモデルの明るさ分布

Phongモデル

• 鏡面反射のモデル

48

影との境界線 (i=90度) ではE=0となる。

明るさ最大の点ではn=s（i=0）である。

Lambertモデルの明るさ分布

ステレオビジョン

• ２つのカメラで奥行き分布を復元する技術（三角測量の原理）視差を利用して対応点を見つけることで三角測量

49

明るさ解析（陰影解析）

• 照明のもとで反射光の明るさ変化から対象の形状を復元する技術

• Shape from Shading (B. K. P. Horn)• Photometric Stereo (Robert J. Woodham)

照度差ステレオ• ニューラルネットワークベース(Neural Network)照度差ステレ

オ（Yuji Iwahori)• ニューラルネットワークベースレンダリング(Rendering)

（Yuji Iwahori）

50

ヒストグラム

• p.132 ヒスﾄグラムは度数分布ともいい、画像のヒストグラムは、値いくつの画素が画像中に何画素あるかを示す分布であり、横軸が画素の値、縦軸が頻度（画像中の画素数）の分布である。

• 画像の統計的な性質を表す情報になる。ヒストグラムはモノクロ画像の場合は１つで、カラー画像の場合は３つ（RGBそれぞれのヒストグラム）ある。（p.133）

51

ヒストグラム• 明るい画像はヒストグラムが[ ]の分布に• 暗い画像はヒストグラムが[ ]の分布になる。

52

ダイナミックレンジの変換

• ダイナミックレンジの拡大処理（コントラストが高い画像に変換する処理）

• ヒストグラムの横幅を広くしてダイナミックレンジを拡大する。

53

�� 0 255

画像fのヒストグラム画像gのヒストグラム

ダイナミックレンジの変換

•変換前の画像の値をｆ、変換後の画像の値をgとしてfからgに変換する。

•minは0に、maxは255に変換される。•gはfをもとにどのような変換式で表されるか。

54

�� 0 255

画像fのヒストグラム画像gのヒストグラムf g

ダイナミックレンジの拡大

入力画像の画素値ｆを出力画像の画素値ｇに変換したい。入力画像のmin（最小値）を出力画像では値0に、入力画像のmax（最大値）を出力画像では値255に変換したい。つまり①が①’に、②が②’に対応するように変換すればよい。このとき

①は（）と表される。①’は（）と表される。②は（）と表される。②’は（）と表される。

これらから ①：①’＝②：②’ として、ｆをもとにｇは以下のような変換式で表される。

変換式ｇ＝（）55

ダイナミックレンジの変換•maxが150、minが50のときにはf=120に対してg=( ① ) となる。実際には８ビットの濃淡画像のため小数点以下切り捨てされて( ② )となり整数となる。

•maxが100、minが40のとき変換後のｇの値が127になったとするともとのｆの値は（ ③ ）であったことになる。

56

空間フィルタリング

•p.145 空間フィルタリング（フィルタリング処理）とは画像の加工をする処理である。

•平滑化フィルタ（平均化フィルタ）はスムージングをするのに使う

•ある画素を中心とした９点分の画素値の平均値を処理後の画素値とする。

•多くのフィルタリング処理は重み係数と対応画素との「積和計算」を行う

57

積和計算とは

•積和計算とは p.146の上の図（重要）ある点を中心とした３×３の大きさのフィルタ係数（重み係数）によって元画像のある点を中心とした３×３の画素値とそれぞれ対応するフィルタ係数を掛け合わせてそれらを足し込んで処理後の画素値を求める。

58

平滑化フィルタの場合もとの画像のある点とその周りの点の画素値がいま

80 85 9090 100 110

100 105 120として (1) 平滑化フィルタのフィルタ係数が

1/9 1/9 1/91/9 1/9 1/91/9 1/9 1/9

のとき、中心画素のこのフィルタ適用後の値を求めよ。 59

鮮鋭化フィルタの場合もとの画像のある点とその周りの点の画素値がいま

80 85 9090 100 110

100 105 120として (2) 鮮鋭化フィルタのフィルタ係数が

-1 -1 -1-1 9 -1-1 -1 -1

のとき、中心画素のこのフィルタ適用後の値を求めよ。

60

フィルタリング処理

•積和計算の結果が負の値になった場合には結果は０とする。あるいは結果が255を超えてしまう場合には255とする。

•フィルタ係数（重み係数）は処理の目的によって異なりいろいろある。

•上に示した (1) 平滑化フィルタ、(2) 鮮鋭化フィルタ、のほか、(3) ラプラシアンフィルタ，ソーベルフィルタ（エッジを抽出するためのフィルタ）などがある。このほか、積和演算のフィルタではないが、ごま塩ノイズの除去を目的にメディアンフィルタがある。

61

ある画素(i, j)と周りの画素との関係

f(i-1, j-1) f(i-1, j) f(i-1, j+1)

f(i, j-1) f(i, j) f(i, j+1)

f(i+1, j-1) f(i+1, j) f(i+1, j+1)

62

i-1

i

i+1

j-1 j j+1

プログラムでは i とか j という変数を用いてある画素と隣接画素を指定する．f (i,j) という表記は画素(i,j)の値を表す．

ラプラシアンフィルタの場合ある画素の周りが

40 50 6070 70 90

100 110 120このとき中心画素 70 はラプラシアンフィルタの処理後に( ① )となる。もとの画像を f として処理後の画像を gとして、もとの画像のある画素 (i, j) の値を f (i,j)とする。処理後の画像の値を g (i,j)とする。このとき中心ー４、上下左右＋１の重み係数のラプラシアンフィルタの場合、g (i,j) を f(i,j) で表す式を考えると

g(i,j)= f(i-1,j)+f(i+1,j)+f(i,j-1)+f(i,j+1) -4* f(i,j)

のように表すことができる．fが元画像でgが新たな画像という意味である． 63

ラプラシアンフィルタの意味

ラプラシアンフィルタは縦横両方向の２次微分フィルタである。縦方向（i方向）の2次微分は

{ f(i+1,j)-f(i,j) } - { f(i,j)-f(i-1,j) }すなわち{ f(i+1,j)-2f(i,j)+f(i-1,j) } …①

横方向（j方向）の2次微分は{ f(i,j+1)-f(i,j) } - { f(i,j)-f(i,j-1) }

すなわち{ f(i,j+1)-2f(i,j)+f(i,j-1) } …②i方向とj方向を足すことで得られる。

f(i+1,j)+f(i-1,j) +f(i,j+1)+f(i,j-1)-4 f(i,j)

64

鮮鋭化フィルタの意味

ラプラシアンフィルタはg(i,j)=f(i+1,j)+f(i-1,j) +f(i,j+1)+f(i,j-1)-4 f(i,j) であり、元画像からこのラプラシアンフィルタの結果を引いた結果が鮮鋭化フィルタである。g(i,j)=f(i,j)-{f(i+1,j)+f(i-1,j) +f(i,j+1)+f(i,j-1)

-4 f(i,j) }=5 f(i,j) -{f(i+1,j)+f(i-1,j) +f(i,j+1)+f(i,j-

1)}となる。

65

鮮鋭化フィルタの場合

先の(2) 鮮鋭化フィルタの場合にはg(i,j)= 9*f(i,j) – f(i-1,j-1)-f(i-1,j)-f(i-1,j+1)-f(i,j-1)-f(i,j+1)-f(i+1,j-1)-f(i+1,j)-f(i+1,j+1)

と表すことができる。

66

f(i-1,j-1)

f(i-1,j) f(i-1,j+1)

f(i,j-1) f(i,j) f(i,j+1)

f(i+1,j-1)

f(i+1,j) f(i+1,j+1)

−１ −１ −１

−１

−１ −１ −１

−１＋９

積和計算フィルタの確認

http://www.cvl.cs.chubu.ac.jpのSimulator for understanding …をクリック、その中の「お試し」をクリック、その中の「画像処理」をクリック

Photofunia（面白ソフト）紹介！

67

メディアンフィルタ（中央値フィルタ）

ある点の９近傍（３＊３）の画素値を並べ替えて、その中央値（メディアン）をある点の処理後の値とするフィルタ。メディアンフィルタは積和演算フィルタではない。並べ替えの例としてバブルソートを⿊板で示し、その様子を理解し、自分でも並べ替えができるようにしておくこと。

68

メディアンフィルタ

ある画素の周りの９点の値の並べ替えを行ってその中央値（５番目になる値）を新たな値とする。例えば

４５５０５５４８４７５１５０５４４６

であるとき 45 50 55 48 47 51 50 54 46 をもとに並べ替えを行い、その結果は45 46 47 48 50 50 51 54 55となる。現在f(i,j)が47のときメディアンフィルタ適用後の新たな画像のg(i,j)は50となる。 69

メディアンフィルタ

ある画素の周りの９点の値の並べ替えを行ってその中央値（５番目になる値）を新たな値とする。いま

５６５２４５５１４８４７５４５３４６

であるとき，並べ替えを行い、その様子を示すとともに，メディアンフィルタ適用後の値はいくつになるか．

70

スムーズシェーディング p.85•コンスタントシェーディング

スムーズシェーディングではないポリゴン内明るさ一定

•グローのスムーズシェーディングポリゴン頂点の明るさから補間

•フォンのスムーズシェーディングポリゴン頂点の法線ベクトルから補間法線ベクトルから明るさ計算

•フォンのスムーズシェーディングのほうがハイライトを表現（写実的な表現）できている。

71

スムーズシェーディング

分割した点A）と点B（２点を7：3に分割した点B）での明るさはそれぞれ（① ）と（② ）になる。（ｂ）の場合、↑の点での向き（法線ベクトルの角度）が左から各々135度、100度、80度、45度としたとき、それらをもとに図のように線形補間をしたとすると、点A（２点を3：2の分割した点A）と点B（２点を7：3に分割した点B）で向き（法線ベクトルの角度）はそれぞれ（③ ）と（④ ）になる。（ａ）は明るさそのものの補間による方法、（ｂ）は法線ベクトルの補間により明るさを計算する方法であるが、（ａ）と（ｂ）では（⑤ ）のほうが出来上がる画像の明るさ分布の写実的な（光沢をより反映した）画像となる。

72

（ａ）グローシェーディングと（ｂ）フォンシェーディングを考える．（ａ）の場合、↑の点での頂点の明るさが左から各々90, 120, 100, 70であり、それらをもとに図のように線形補間をしたとすると、点A（２点を3：2の

画像の２点間の距離

•２点の座標を（２，３）と（７，９）とするとき、２点の１）ユークリッド距離２）市街区距離３）チェス盤距離はいくつになるか．またそれぞれの経路の例を図で示せ。

73


•ユークリッド距離は２点を直線で結んだときの距離

•ユークリッド距離は（）となる。

74


•市街区距離は２点を上下左右のマス目で結んだ距離（片側に立って上下左右方向にもう片側まで何歩でいけるかという距離）

•市街区距離は（）となる。•チェス盤距離は上下左右のほかに斜めも含めて８方向にマス目で結んだ距離（片側に立って８方向にもう片側まで何歩でいけるかという距離）

•チェス盤距離は（）となる。75

距離の例（図）

76

距離の問題

• 下の例で点（２，６）と点（９，３）とがあるとき、（１）２点のユークリッド距離はいくつになるか。（２）市街区距離はいくつになるか、そしてパスの例を示せ。（３）チェス盤距離はいくつになるか、そしてパスの例を示せ。

（１）ユークリッド距離（式を示して解答する）

77

市街区距離

78

チェス盤距離

79

３次元のユークリッド距離

３次元の座標からなる点 � � �と � � � のユークリッド距離dを式で表せ．

� ��

� ��

� ��

パターン認識では，パターンの特徴は点の座標として一般にn次元ベクトルで表すことができ，点の距離が近いほど，パターンが近い．手順としては特徴抽出をして認識という過程からなる．

80

Shading（陰影付け）基礎問題

81

平行光線照明とし、sを天頂角α、方位角βで表すとs= (sinαcosβ, sinαsinβ, cosα)で表される。またn= (−p,−q, １)/ｒ, 但しr = !� + "� + 1

� とする。このとき完全拡散反射モデル（Lambertモデル）の面の明るさEをsとｎの各成分を用いて表せ。解答例：Lambertモデルではn とsを用いて①となり，これをもとに(p,q)で表すと② #$ %&' ( )*% + #, %&' ( %&' +-)*% (

$.-,.-��

のように表すことができる．（このあたりは難しいかもしれませんね）

面の傾きパラメータ（p,q)

82

X,Y,Z座標系で中心 (0,0,0)、半径rの球を想定したとき、球の方程式をもとに、ZをXとYでそれぞれ偏微分した傾きパラメータ p, q = (

34

35,

34

36) を求めたい。球の各点(X,Y)の傾

きパラメータ p, q はそれぞれどのような形になるかを導出せよ。解答例：上の場合の球の方程式は③ �� + �� + �� = 8�

となり，左辺をＺとすれば④ � = 8� − �� − ��

となる．pはZをXで偏微分，qはZをYで偏微分して各々⑤ ! =

34

35=

�

�8� − �� − �� #

9

. −2� = −5

4

q =34

36=

�

�8� − �� − �� #

9

. −2� = −6

4

となる．（このあたりは難しいかもしれませんね）

問題物体面上のある点での光源方向ベクトルをｓ，面の傾きベクトルをｎ，視線方向ベクトルをvとし，いずれも「単位ベクトル」とする．Z軸方向からカメラで観測する（視線方向がZ軸方向にある）とき，ベクトルvはv=(0,0,1)とする．(1) 原点Oを中心とした右手座標系において上方向（天

頂方向）をZ軸とする．ｓとｎのベクトル成分表示を各々ｓ= (Sx,Sy,Sz), n= (−p,−q, １)/ｒ, 但しr =

!� + "� + 1� とする．このとき完全拡散反射モデル（Lambertモデル）の面の明るさEをsとｎの各成分を用いて表せ．

(2) Lambertモデルで明るさEが最大となる点はどのような点か．そのような点ではｓとnの各成分の関係式を示せ．

83

解答例：

(1) E=（ｓ，n）= : ; <

. .�

(2) ｓ = nの点でEは最大となるので，以下の条件のときとなる．

= �

ここで � ��

84

画像情報論用語整理（プリント）

http://www.cvl.cs.chubu.ac.jp/~iwahori/sugi/some_of_words.pdf

85

コンピュータビジョン研究紹介•トリケップスセミナー 2012.03.27

3次元物体認識とその応用•https://www.dropbox.com/s/qcr9a5d2mx0t1ht/triceps_20120327.pptx

• Invited Talk at UBC Computer Science (2013.03.04)

3D Shape Analysis and Object Detection in Computer Vision

•https://www.dropbox.com/s/yfp2zg6sru6qegz/UBC2013_Iwahori_talk.pptx

86

Documents

2020年度前期画像情報論 - chubu-univiwahori/sugi/imageproc.pdf画像系技術分野の名称 •CG (Computer Graphics) ∬次元⋻⋠ ≱⊯画 像昏昅・CV (Computer Vision)

2020年度前期画像情報論 - chubu-univiwahori/sugi/imageproc.pdf画像系技術分野の名称 •CG (Computer Graphics) ∬次元⋻⋠ ≱⊯画像昏昅・CV (Computer Vision)