サポートベクトルマシンを用いた自動人相判別の検討統計数理研究所 玉森聡,松井知子国文学研究資料館 相田満
はじめに( 1/2 )• 観相とは 身体・容貌・声・気色を観察し,性質や禍福を見通すこと ⇒ 代表例は「人相見」• 観相の裾野の広がり医学:望診,絵画:肖像画の描き分けのための教養• 日本における観相の知識体系相書の残存数は世界随一(伊藤 ; 2010 )• 現代の占術界における人相見の衰退確度が低く,他の術法が主流⇒人相専門の術者は希少
はじめに( 2/2 )• 観相トピックマップ( http://goo.gl/NfRgWZ )
– 古典籍原本に基づく観相の知識体系の整理 ⇒ 観相学が表現活動に及ぼした影響の研究– 相書から相の解説と絵を切り取ってデータベース化– 現在 9 種の相書に書かれる相を構造化 ⇒ 顔の各部位(耳,目,眉,鼻,口)の画像が含まれる
• 研究の目的相データの応用可能性を模索する学際的研究の一環顔の各部位画像を用いた機械学習による観相(人相見)の自動処理の可能性の検討⇒ 本研究では識別器にサポートベクトルマシンを適用
観相トピックマップのデータ例• 目
観相トピックマップのデータ例• 目
観相トピックマップのデータ例• 眉
観相トピックマップのデータ例• 鼻
観相トピックマップのデータ例• 口
サポートベクトルマシン( SVM )• 機械学習・パターン認識の分野で広く用いられる 2 クラス分類器の一つ• 種々の特徴
– 局所最適解の心配がない– 未知データに対する予測誤差が小さくなるような学習
• 派生手法– ソフトマージン SVM ⇒学習データの識別誤りを許容– 非線形 SVM ⇒高次元空間に写像して マージン最大化 クラス
A
クラスB
マージン
サポートベクトル
SVM を用いた観相の自動処理( 1/2 )• 顔の各部位の SVM の学習
特徴量抽出( SIFT, BoF )
顔の各部位の学習用画像データ
SVM の学習観相を自動処理する SVM
相のラベルデータ(人手で付与)
SIFT および BoF :画像認識の分野で標準的な画像特徴量
SVM を用いた観相の自動処理( 2/2 )• SVM による相の識別
特徴量抽出( SIFT , BoF )顔の各部位の評価用画像データ
SVM による識別
相の識別結果
学習済の顔の各部位の SVM
相の識別実験( 1/2 )• 実験条件
– SVM のフリーソフトウェアである LIBSVM を利用– データ量(枚数)
左向きと右向きでデータ数が同じ理由 ⇒片方の向きしかない場合、それを反転して作成
部位\向き 左 右 正面耳 84 84 --
目 227 227
眉 122 122 --
鼻 59 59 56
口 -- -- 78
相の識別実験( 2/2 )• 実験条件
• データを 2 分割して学習とテストに利用 ⇒ クロスバリデーション( 2-fold )による性能評価
項目 内容BoF 特徴量の抽出に必要なクラスタ数
32 , 64 , 128 , 256 , 512 ,1024
カーネル関数 RBFカーネルカーネル関数のハイパパラメータ 0.1 , 0.01 , 0.001 , 0.0001
SVM のペナルティパラメータ 0.1, 1, 5, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 1000
SVM の重みパラメータ 1/128 , 1/64 , 1/8 , 1/4 , 1/2, 2 , 4 , 8 , 16
相のラベル 吉( 1 )と凶( 0 )
実験結果および考察( 1/2 )• 各部位の識別率( % )
–平均識別率 71.8%– 鼻(正面)の識別率が 82.3% と最高値– 口の識別率が 68.0% で最低値
部位\向き 左 右 正面耳 71.1 69.2 --
目 68.8 68.1 --
眉 73.5 71.8 --
鼻 74.2 71.4 82.3
口 -- -- 68.0
実験結果および考察( 2/2 )• 鼻(正面)は吉凶の自動判別に有効である可能性 江戸時代の浮世絵師 西川祐信曰く: 「顔の中心である鼻を定めることにより人物の面体が 定まるため,人物の画法において非常に重要」(要約)• 目は他の部位と比較して識別率は低い結果画像データ数を増やすことで今後向上する可能性
まとめ• SVM を用いた観相(人相見)の自動処理の検討
– 観相トピックマップに含まれる顔の各部位画像を利用–平均識別率は 71.8%– 鼻(正面)の識別率が 82.3% と最高値
• 今後の検討課題– データ量をさらに増やした場合の識別性能– 他の識別手法との比較( k-means, ランダムフォレスト)–吉・凶のラベルを自動付与する方法の検討 ⇒ 現在は人手で付与しているためコスト大– 実社会へのアプリケーションの検討