60
1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 – 12:00 知能情報論 原田研究室 助教 金崎朝子

3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

Embed Size (px)

Citation preview

Page 1: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

1

MILMachine Intelligence Lab.

3D物体認識と

弱教師付き学習

2014/06/18 10:30 – 12:00

知能情報論

原田研究室 助教 金崎朝子

Page 2: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

2

MILMachine Intelligence Lab.

• 2008年3月 東京大学工学部機械情報工学科

國吉・原田研にて 学部卒業

• 2010年3月 國吉・原田研にて 修士課程修了(情報理工学)

• 2013年3月 國吉・原田研にて 博士課程修了(情報理工学)

• 2013年4月 原田研誕生

• 2013年4月~11月 (株)東芝研究開発センター 正規職員

• 2013年12月~ 原田研の助教

自己紹介

Page 3: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

3

MILMachine Intelligence Lab.

ロボットによる生活支援(掃除とか)

モチベーション

チョット通リマスヨ

サッ

理想

現実

人のためにロボットがお片付けする

ロボットのために人がお片付けする

⇒何とかしたい⇒周囲の物体認識が重要

Page 4: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

4

MILMachine Intelligence Lab.

どうやって認識するの?

→ 3D物体認識 …… 前半どうやって学習するの?

→ 弱教師付き学習 …… 後半

ごちゃごちゃ物体認識

cf.)一般画像認識

Page 5: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

5

MILMachine Intelligence Lab.

SHREC

• Shape Retrieval Contest http://www.aimatshape.net/event/SHREC/

• 3D物体認識の研究分野を支えてきたコンペティション(2006~)

• SHREC ’14の内訳1. Automatic Location of Landmarks used in Manual Anthropometry

2. Shape Retrieval of Non-Rigid 3D Human Models

3. Retrieval and Classification on Textured 3D Models

4. Extended Large Scale Sketch-Based 3D Shape Retrieval

5. Large Scale Comprehensive 3D Shape Retrieval

1. Automatic Location of Landmarks used in Manual Anthropometry

http://www.andreagiachetti.it/shrec14/

Page 6: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

6

MILMachine Intelligence Lab.

SHREC

• Shape Retrieval Contest http://www.aimatshape.net/event/SHREC/

• 3D物体認識の研究分野を支えてきたコンペティション(2006~)

• SHREC ’14の内訳1. Automatic Location of Landmarks used in Manual Anthropometry

2. Shape Retrieval of Non-Rigid 3D Human Models

3. Retrieval and Classification on Textured 3D Models

4. Extended Large Scale Sketch-Based 3D Shape Retrieval

5. Large Scale Comprehensive 3D Shape Retrieval

2. Shape Retrieval of Non-Rigid 3D Human Models

非剛体物体ポーズが変わっても同じ物体であることをどう認識するか?

http://www.cs.cf.ac.uk/shaperetrieval/shrec14/index.html

Page 7: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

7

MILMachine Intelligence Lab.

SHREC

• Shape Retrieval Contest http://www.aimatshape.net/event/SHREC/

• 3D物体認識の研究分野を支えてきたコンペティション(2006~)

• SHREC ’14の内訳1. Automatic Location of Landmarks used in Manual Anthropometry

2. Shape Retrieval of Non-Rigid 3D Human Models

3. Retrieval and Classification on Textured 3D Models

4. Extended Large Scale Sketch-Based 3D Shape Retrieval

5. Large Scale Comprehensive 3D Shape Retrieval

3. Retrieval and Classification on Textured 3D Models

http://saturno.ge.imati.cnr.it/ima/smg/Shrec2013/texture.pdf

Page 8: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

8

MILMachine Intelligence Lab.

SHREC

• Shape Retrieval Contest http://www.aimatshape.net/event/SHREC/

• 3D物体認識の研究分野を支えてきたコンペティション(2006~)

• SHREC ’14の内訳1. Automatic Location of Landmarks used in Manual Anthropometry

2. Shape Retrieval of Non-Rigid 3D Human Models

3. Retrieval and Classification on Textured 3D Models

4. Extended Large Scale Sketch-Based 3D Shape Retrieval

5. Large Scale Comprehensive 3D Shape Retrieval

4. Extended Large Scale Sketch-Based 3D Shape Retrieval スケッチを入力して3D物体検索

http://www.itl.nist.gov/iad/vug/sharp/contest/2014/SBR/

Page 9: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

9

MILMachine Intelligence Lab.

SHREC

• Shape Retrieval Contest http://www.aimatshape.net/event/SHREC/

• 3D物体認識の研究分野を支えてきたコンペティション(2006~)

• SHREC ’14の内訳1. Automatic Location of Landmarks used in Manual Anthropometry

2. Shape Retrieval of Non-Rigid 3D Human Models

3. Retrieval and Classification on Textured 3D Models

4. Extended Large Scale Sketch-Based 3D Shape Retrieval

5. Large Scale Comprehensive 3D Shape Retrieval 5. Large Scale Comprehensive 3D Shape Retrieval

8,987 modelscategorized into 171 classes

(画像に比べてだいぶまだ小規模である)

http://www.itl.nist.gov/iad/vug/sharp/contest/2014/SBR/

Page 10: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

10

MILMachine Intelligence Lab.

3D物体認識の手法 –古典なもの

• ヒストグラムベース

• 関数ベース

• 2Dベース

Ankerst, M., Kastenmüller, G., Kriegel, H. P., & Seidl, T. (1999, January). 3D shape histograms for similarity search and classification in spatial databases. In Advances in Spatial Databases (pp. 207-226), 1999.

3D Shape Histograms

Page 11: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

11

MILMachine Intelligence Lab.

3D物体認識の手法 –古典なもの

• ヒストグラムベース

• 関数ベース

• 2Dベース

Kazhdan, M., Funkhouser, T., & Rusinkiewicz, S. Rotation invariant spherical harmonic representation of 3D shape descriptors. In Proceedings of the Eurographics/ACM SIGGRAPH symposium on Geometry processing (pp. 156-164), 2003.

Spherical Harmonic Representations

0

),(),(l

l

lm

m

l

m

l Ycf

Page 12: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

12

MILMachine Intelligence Lab.

3D物体認識の手法 –古典なもの

• ヒストグラムベース

• 関数ベース

• 2Dベース

Ding-Yun Chen, Xiao-Pei Tian, Yu-Te Shen and Ming Ouhyoung, "On Visual Similarity Based 3D Model Retrieval", Computer Graphics Forum (EUROGRAPHICS'03), Vol. 22, No. 3, pp. 223-232, Sept. 2003.

Light Field Descriptor

ぐるぐるいっぱい回転させて比較する

Page 13: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

13

MILMachine Intelligence Lab.

実世界向け3D物体認識の手法 –古典なもの

Johnson, Andrew E., and Martial Hebert. "Using spin images for efficient object recognition in cluttered 3D scenes." Pattern Analysis and Machine Intelligence, IEEE Transactions on 21.5 (1999): 433-449.

Spin Image 超有名特徴量

局所記述子・回転不変

Page 14: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

14

MILMachine Intelligence Lab.

2009年当時の私の研究@國吉・原田研

• こんなのやってました。

• Color-CHLAC特徴カラーボクセルデータを扱い、各ボクセルのRGB値の相関を一定領域内で積分

=

Object

x7272

13

11

21

18

x13

x11

x21

x18

Page 15: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

15

MILMachine Intelligence Lab.

2009年当時の私の研究@國吉・原田研

MESA SR-4000 TOF sensorPointGray Flea2 camera

176×144 pixel、100万円くらい

もっと良いセンサはないか…?

光切断法

・精度は良いが・部屋暗くする・時間かかる

Page 16: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

16

MILMachine Intelligence Lab.

2010年 11月 Kinect登場

Page 17: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

17

MILMachine Intelligence Lab.

Kinectショック① ~つくってみた~

• 世界各地でボーントラッキング試したとか

アプリ作ったとかで動画がうpされる

• 特にロボット研究界隈で盛り上がりを見せる

– ROS 3D Contestとか

http://wiki.ros.org/openni/Contests/ROS%203D

1st place $3000

“Customizable Buttons”

http://wiki.ros.org/openni/Contests/ROS%203D/Customizable%20Buttons

Most Useful 1st place $2000

“RGBD-6D-SLAM”

http://wiki.ros.org/openni/Contests/ROS%203D/RGBD-6D-SLAM

• KinectFusion [Izadi et al., 2011]

– Microsoft発、SLAMのすごいやつ。ICP+GPU。すぐ使える?

世界中がお祭り騒ぎに。

Page 18: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

18

MILMachine Intelligence Lab.

Kinectショック➁ ~ICRA 2011~

up to $10,000 dollars will be awarded exponentially starting at $3.50 for a first prize winner who achieves 80% recognition and increasing exponentially from there.

その後続かなかった…

• Best Vision Paper: Sparse Distance Learning for Object Recognition Combining RGB and Depth Information

Kevin Lai, Liefeng Bo, Xiaofeng Ren, and Dieter Fox

Intelとの共同研究で、RGB-D Object Dataset公開

• NIST and Willow Garage: Solutions in Perception Challenge

• Fast Object Detection for Robots in a Cluttered Indoor Environment Using Integral 3D Feature Table. Asako Kanezaki, Takahiro Suzuki, Tatsuya Harada, and Yasuo Kuniyoshi.

初のKinect論文

Page 19: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

19

MILMachine Intelligence Lab.

Kinectショック③ ~RGBDが流行語に?~

2011 2012 2013 2014

CVPR 0 1 7 7

ICCV 0 - 10 -

ICRA 3 8 7 8

• タイトルにRGB-Dが入っている論文の数(※金崎調べ/アバウト)

ビジョン系

ビジョン系

ロボット系

キーワードにRGBD Perceptionが入っている論文が43件

• 純粋なビジョン系でも受け入れられるようになったし、ロボットビジョンではもうRGBDがデフォと言ってもいいくらい

Page 20: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

20

MILMachine Intelligence Lab.

RGBD:SLAM

KinectFusion

Andrew Davison

Faculty of Engineering, Department of ComputingProfessor of Robot Vision

TUM RGB-D

F. Steinbruecker J. Sturm D. Cremers

要チェック研究機関

↑さっきのRGBD-6D-SLAMをやってた人

単眼カメラVisual SLAMのプロPTAM、DTAM

Page 21: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

21

MILMachine Intelligence Lab.

RGBD:三次元物体(環境)認識

Assistant Professor

Silvio SavareseComputer Science Department

Kevin Lai

RGBDデータセット作ったり、いろいろ。

CEO and Co-Founder at Fyusion, IncPresident and CEO - Open Perception, Inc.

Radu B. Rusu

要チェック研究機関

ProfessorDieter Fox

Spin Image、spectral graph matching等、3Dやる上で重要な論文をたくさん書いている

セマンティックマッピング等

※PCLとはPoint Cloud Library点群処理オープンソースOpenCVの3D版的な。

Page 22: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

22

MILMachine Intelligence Lab.

物体認識の対象とするデータ

色なし

色あり

2次元 2.5次元 3次元

線画 距離データ

形状データ

RGB画像 RGBD画像 テクスチャ付形状データ

http://nicolas.burrus.name/uploads/Research/viewer_output_view3d_triangles.png

Vision

Robot

Graphics

D次元が増えた

Partialdata

色がついた

http://shape.cs.princeton.edu/benchmark/

Page 23: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

23

MILMachine Intelligence Lab.

マルチモーダルフュージョン的なアプローチ

• Bar-Hillel, Aharon, Dmitri Hanukaev, and Dan Levi.

"Fusing visual and range imaging for object class recognition."

IEEE ICCV, 2011.

• We have presented a system fusing depth and visual information which reduces classification error by more than 60% compared to using the visual image alone, and close to 20% compared to depth alone.

D次元が増えた

RGB画像

Page 24: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

24

MILMachine Intelligence Lab.

マルチモーダルフュージョン的なアプローチ

Multimodal templates for real-time detection of texture-less objects in heavily cluttered scenes

D次元が増えた

RGB画像

Stefan Hinterstoisser, Stefan Holzer, Cedric Cagniart, Slobodan Ilic,

Kurt Konolige, Nassir Navab, Vincent Lepetit. IEEE ICCV, 2011.

輝度勾配 in 色画像 法線 in 距離画像 テンプレート

Stefanの考えた最強のテンプレートマッチング

テクスチャレスな物体を表現するのに表面形状の情報(法線)で補おう

can parse a VGA

image with over 3000 templateswith about 10 fps

on the CPU

テンプレートマッチングのプロ

Page 25: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

25

MILMachine Intelligence Lab.

(カラー)点群特徴量

• SHOT記述子 [Federico Tombari et al., ECCV2010]

– 今の世代のSpin Image(と私は思っている)

– デファクトスタンダードな3D点群記述子

– PCLにも入っているよ

• CSHOT記述子 [Federico Tombari et al., ICIP2011]

– SHOTのカラー版

色がついた

距離画像

Federico氏:他にも3Dキーポイント徹底比較論文とかいろいろやられている

各点まわりの局所領域を 8 x 2 x 2 に分割各領域の法線ベクトル𝒏𝑣𝑖と

点の法線ベクトル𝒏𝑢の内積𝑐𝑜𝑠𝜃𝑖 = 𝒏𝑣𝑖 ∙ 𝒏𝑢のヒストグラム

F. Tombari, S. Salti, L. Di Stefano. "Unique signatures of Histograms for local surface description", ECCV 2010.

F. Tombari, S. Salti, L. Di Stefano. "A combined texture-shape descriptor for enhanced 3D feature matching", ICIP 2010.

Page 26: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

26

MILMachine Intelligence Lab.

Partialな3Dモデル特徴量

The Partial View Heat Kernel Descriptor for 3D Object Representation [Brandao et al., ICRA2014]

– Heat Kernel Signature (HKS) 記述子 [Bronstein and Kokkinos, CVPR2010]を、Partial Viewなデータの記述向けに拡張した。

Partialdata

3Dモデル

c.f.) Heat Kernel Signature (HKS)全周モデル向け。(non-rigidにもrigidにも使える)各点の記述子は、物体全体の表面形状から計算される。⇒視点が変わると見えてる部分が変わるので、HKSも変わる

𝑘 𝑣𝑗 , 𝑣𝑠, 𝑡 =

𝑖=1

𝑁

𝑒−𝜆𝑖𝑡𝜙𝑖,𝑗𝜙𝑖,𝑠

+テクスチャも考慮

物体全体表面のLaplace-Beltrami作用素の固有値と固有ベクトル←partial viewになると変化。

超有名特徴量

←HKSも

双子のBronstein先生s

Page 27: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

27

MILMachine Intelligence Lab.

3Dセマンティックマッピング(1/2)

Semantic Structure From Motion (SSFM)• S. Yingze Bao and S. Savarese, Semantic Structure from Motion,

IEEE CVPR, 2011

– jointly estimating 3D objects, 3D points and camera poses from multiple images

• S. Yingze Bao, M. Bagra, Y. Chao, and S. Savarese, Semantic Structure from Motion with Points, Regions, and Objects, IEEE CVPR, 2012

3D 2D

Page 28: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

28

MILMachine Intelligence Lab.

3Dセマンティックマッピング(2/2)

Dense 3D Semantic Mapping of Indoor Scenes from RGB-D Images [Hermans et al., ICRA 2014] Best Vision Paper! (ICRA 2014)

Ren et al. [7] obtain better results for all classes, but their complexapproach takes over a minute per image.

[7] X. Ren, L. Bo, and D. Fox, “RGB-(D) scene labeling: Features and algorithms,” in CVPR, 2012.

• 2D-3D label transfer• 3D refinementは毎フレームやる必要ない⇒ 4Hz出た

動画

Page 29: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

29

MILMachine Intelligence Lab.

リアルタイムってかっこいい

• RGBD SLAMの三年後を見てみましょう

This work is inspired by our recent finding [16] that data fusion in an octree runs extremely fast on a GPU (>200 Hz), so that real-time processing on CPU comes back into reach.

Our method fuses incoming RGB-D images in real-time at 45 Hz and outputs up-to-date triangle meshes at approximately 1 Hz at 5 mm resolution at the finest level.

Large-Scale Multi-Resolution Surface Reconstruction from RGB-D Sequences

(F. Steinbruecker, C. Kerl, J. Sturm, D. Cremers), In IEEE ICCV, 2013.

computed from more than 24.000 RGB-D images. The reconstruction run at more than 200 Hz on a GTX680. The finest resolution was 5mm and the entire scene fit into approximately 2.5 GB of GPURAM, including color.

GPUで200Hzは、やり過ぎました。CPUで実装します。

Volumetric 3D Mapping in Real-Time on a CPU

(F. Steinbruecker, J. Sturm, D. Cremers), In IEEE ICRA, 2014.

TUMの例のグループ。毎年RGBD SLAMのすごい論文を出している

動画

Page 30: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

30

MILMachine Intelligence Lab.

Google タンゴ https://www.google.com/atap/projecttango/#project

Page 31: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

31

MILMachine Intelligence Lab.

3D物体認識のまとめ

• Kinectの登場が研究界を変えた。

• Computer Vision界、Robot Vision界、Computer Graphics界の知識が集結する。– マルチモーダルフュージョン的アプローチ

– (カラー)点群特徴量

– Partialな3Dモデルの扱い

• ふつうの写真と同じような感覚でRGBD画像を扱える時代はもうすぐそこ。

Page 32: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

32

MILMachine Intelligence Lab.

本当に3Dは必要かな?(1/2)

Single Image 3D Object Detection and Pose Estimation for Grasping[Zhu et al., ICRA2014]

• 普通に一枚の画像があれば3D姿勢推定までできてロボットが物体把持できる

普通の画像 → シルエットからDPMで物体検出 → superpixels segmentation → 姿勢推定

Page 33: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

33

MILMachine Intelligence Lab.

本当に3Dは必要かな?(2/2)

Size Matters: Metric Visual Search Constraints from Monocular Metadata.

Fritz, Mario, Kate Saenko, and Trevor Darrell. NIPS, 2010.

– “2.1D” local feature

– combines traditional appearance gradient statistics with an estimate of average absolute depth within the local window

– EXIFタグから物体の大きさが分かるよ

カメラの内部パラメタの他、しばしばFocus distanceまで分かる→ 物体の深度が推定できる!

学習時:Web画像だけ使用時:一応距離センサ使ってる

Page 34: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

34

MILMachine Intelligence Lab.

私の考え

次に、(3Dの情報を用いた)弱教師付き学習の話にうつります

ごちゃごちゃしたとこでは3Dの情報が必要じゃないかなぁ

Page 35: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

35

MILMachine Intelligence Lab.

• 学習データセット作り– 物体の外観(画像)と名前(ラベル)の対応を教える。

システムが物体を学習するために人がやらねばならないこと

Coffee cup

ひとつのやり方は、Web画像から知識を得ること。しかし、

世の中はまだよく分からないもので溢れている

⇒人間がシステムにいちいち教える必要がある。

天ぷら寿司

Page 36: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

36

MILMachine Intelligence Lab.

• 教師付き学習と弱教師付き学習

システムが物体を学習するために人がやらねばならないこと

Supervision Weak Supervision

displaydisplay

pole

bagmascot

bag

penguincup bag towel

displaypole

mascot

penguincup

bag

towel

Page 37: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

37

MILMachine Intelligence Lab.

弱教師付き学習をする提案システムの概要

mascot

shoulderbag

mascot

shoulder bag

cup dollcup

mascotcup

mascot

brand bag

basket

hand bag brand bag

shoulderbag

basket

basket

• 例:mascotのセグメンテーションの学習

Page 38: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

38

MILMachine Intelligence Lab.

• 例:mascotのセグメンテーションの学習

弱教師付き学習をする提案システムの概要

mascot

shoulderbag

mascot

shoulder bag

cup dollcup

mascotcup

mascot

brand bag

basket

hand bag brand bag

shoulderbag

basket

basket

1. mascotラベルのついた画像を正、それ以外を負とする

2. 正画像にのみ共通して存在するセグメントを発見する

Page 39: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

39

MILMachine Intelligence Lab.

• Multiple Instance Learning [Dietterich et al., 1997]

弱教師付き学習をする提案システムの概要

正 bag少なくとも一つ以上の正インスタンスを含む

負 bag負インスタンスのみを含む

Page 40: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

40

MILMachine Intelligence Lab.

Multiple Instance Learningの定義

• Positive bag contains at least one positive instance

• Negative bag contains only negative instances

C

positive positive negative

何匹いるか知らないけどカピバラがいるよ

カピバラはいないよ

例: カピバラ識別器を作ろう!

Page 41: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

41

MILMachine Intelligence Lab.

•タスク2:Bagの識別

C→ positive? negative?

Multiple Instance Learningタスク

•タスク1:Instanceの識別

→ positive? negative?

※タスクによって識別器学習のアプローチが若干異なる

※Multiple Instance Classification (MIC)とも

Page 42: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

42

MILMachine Intelligence Lab.

• Drug activity predictionの問題でMultiple Instance Learningを提唱

• The musk data sets(香料データセット)公開

[Dietterich et al. 1997]

Drug 1

Positive bag Negative bag instance

分子 低エネルギー構造体

… …

特徴量

特徴量musk(香料)になれる?なれない?

Solving the multiple instance problem with axis-parallel rectangles

最初の論文

Page 43: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

43

MILMachine Intelligence Lab.

[Dietterich et al. 1997]APR

2次元なら 3次元なら

APRを求める3つのアルゴリズム

1. standard 2. outside-in 3. inside-out

APRよりもこんなのとか

こんなのとか

Positive bagのInstanceを全部含む最小のAPR

standardから始めfalse positiveを除いて縮小

一点から始め他のpositive bagのinstanceを吸収拡大

Solving the multiple instance problem with axis-parallel rectangles

最初の論文

Page 44: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

44

MILMachine Intelligence Lab.

今回紹介する手法

• Diverse Density[Maron and Lozano-Perez, 1998]

• mi-SVMとMI-SVM[Andrews et al., 2002]

• citation-kNN[Wang and Zucker, 2000]

学習しません

確率モデル

識別モデル

最近傍探索

Page 45: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

45

MILMachine Intelligence Lab.

HighDiverseDensity

1 2 3 … n … : Positive bag nのinstance: Negative bagのinstance

Diverse Density [Maron and Lozano-Perez, 1998]~多様性密度~Oded Maron , Tomás Lozano-Pérez, A framework for multiple-instance learning, Proc. of the 1997 Conf. on Advances in Neural Information Processing Systems 10, p.570-576, 1998.

Page 46: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

46

MILMachine Intelligence Lab.

• DDを最大にするconcept point を探す。t

mn

xBBBBtx ,,,,,Prmaxarg 11

txBBBB mnx

,,,,,Prmaxarg 11

i

i

i

ix

txBtxB PrPrmaxarg

i

i

i

ix

BtxBtx PrPrmaxarg

iB : Positive bag

iB : Negative bag

ベイズ則

ベイズ則

各バッグが条件付独立と仮定

Diverse Density [Maron and Lozano-Perez, 1998]~多様性密度~

Page 47: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

47

MILMachine Intelligence Lab.

i

i

i

ix

BtxBtx PrPrmaxarg

ijkB : 𝑖番目のバッグ

𝑗番目のインスタンス

𝑘次元めの特徴

noisy-or model

特徴量の各次元の重み も同時に最適化

i j

ij

i j

ijx

BtxBtx Pr1Pr11maxarg

ijBtxPr が に近いほど高い値 )exp(2

xBij ijB t

))(exp()exp(22

2

k

kijkkij xBsxB

2

ks

OUTPUT

• DDを最大にするconcept point を探す。t

Diverse Density [Maron and Lozano-Perez, 1998]~多様性密度~

Page 48: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

48

MILMachine Intelligence Lab.

mi-SVM

when I =positive bag

when I =negative bag

MI-SVM

I I

IiIYI

max: I I

mi-SVMとMI-SVM [Andrews et al., 2002]

インスタンスラベル も更新して同時に最適化してくところがポイント初期値は = が推奨されてる

↑バッグラベルIY

S. Andrews, I. Tsochantaridis, T. Hofmann. Support Vector Machines for Multiple-Instance Learning. NIPS 2002.

Page 49: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

49

MILMachine Intelligence Lab.

MI-SVM

実は・・・MI-SVMはDeformable Part Models (DPM)で使われる(有名な)Latent SVMと同義

z :パーツの配置latent value完全に一致

mi-SVMとMI-SVM [Andrews et al., 2002]

I I

IiIYI

max: I I

P. Felzenszwalb, D. McAllester, D. Ramanan. A Discriminatively Trained, Multiscale, Deformable Part Model. IEEE CVPR, 2008

Page 50: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

50

MILMachine Intelligence Lab.Positive Negative

P1 P2

P3 N1

N2

N3

• タスク2Multiple Instance Classification(MIC)向け

• まずはバッグ同士の距離を定義

• MICでは、ふつうのkNNが通用しない!

いろいろあるが、結果的には最近傍の点間の距離がいちばんよかった

本当はNegativeなのにPositiveに判断される。。。

Positive bagにNegative instanceが含まれることが問題!

Citation-kNN [Wang and Zucker, 2000]

J. Wang and J.-D. Zucker. Solving the multiple-instance problem: a lazy learning approach. Proc. 17th Int'l Conf. on Machine Learning, pp. 1119-1125, 2000.

Page 51: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

51

MILMachine Intelligence Lab.Positive Negative

カレーの調理過程におけるラジカル捕捉活性の変化

カレーの機能性The Antioxidant Properties of Natural Spices

例:k=2References = {P2, P3}Citers = {N1,N2,N3}

Nの数≧Pの数 ⇒ Negativeと判断される

Citer Reference

P1 P2

P3 N1

N2

N3

Citation-kNN [Wang and Zucker, 2000]

Aさんカレーの作り方をGoogle Scholarで検索してしまった

Page 52: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

52

MILMachine Intelligence Lab.

Multiple Instance Learning (MIL) いろいろ

• Iterated-discrim APR [Dietterich et al., 1997]

• Diverse Density (DD) [Maron and Lozano-Perez, 1998]

• Citation-kNN for MIL [Wang and Zucker, 2000]

• Multiple-decision tree [Zucker and Chevaleyre, 2001]

• Multi-instance Regression [Ray and Page, 2001]

• EM-DD [Zhang and Goldman, 2001]

• mi-SVM and MI-SVM [Andrews et al., 2002]

• Neural Networks for MIL [Zhou and Zhang, 2002]

• DD-SVM [Chen and Wang, 2004]

• MIL-Boost [Viola et al., 2006]

• Multiple Instance Ranking [Hu et al., 2008] [Bergeron et al., 2008]

などなど、ほんとうにたくさん。

←これオススメ♡

Page 53: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

53

MILMachine Intelligence Lab.

• Diverse Density (DD)の定義をちょっと変えてEMアルゴリズム

EM-DD [Zhang and Goldman, 2001]

i

ijj

i

ijjx

BtxBtx Prmax1Prmaxmaxarg

正bagと 𝑡の近さ 負bagと 𝑡の遠さ

i j

ij

i j

ijx

BtxBtx Pr1Pr11maxarg

𝑖番めのbag

𝑗番めのinstance

(DDの定義)

各bagで最も正なinstance選び(Expectation)と

concept pointの最適化(Maximization)を交互に行っていく。高速

Q. Zhang and S. A. Goldman. EM-DD: An improved multiple-instance learning technique. In Neural Information Processing Systems 14, 2001.

Page 54: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

54

MILMachine Intelligence Lab.

物体トラッキング “MIL Track”• Visual Tracking with Online Multiple Instance Learning

MIL-Boost [Viola et al.,

NIPS2006]を改良したOnline MIL-Boost

・オクルージョンにも強い

{ }

急にこうなった時

ふつうのTrackはこれから無理やり特徴抽出

MIL Trackは近傍のパッチの中から良いのを選べる

最先端コンピュータビジョンでのMIL応用(1)

[Babenko et al., CVPR2009]

Page 55: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

55

MILMachine Intelligence Lab.

物体検出• Scene Recognition and Weakly Supervised Object Localization

with Deformable Part-Based Models [Pandey and Lazebnik, ICCV2011]

初期の物体モデル 繰り返し学習後のモデル

• 物体検出手法のデファクトスタンダードであるDeformable Part Models [Felzenszwalb et al., CVPR2008]を使用

最先端コンピュータビジョンでのMIL応用(2)

Page 56: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

56

MILMachine Intelligence Lab.

物体検出• Scale and Rotation Invariant Color Features for Weakly-Supervised

Object Learning in 3D Space [Kanezaki et al., ICCVWS 2011]

最先端コンピュータビジョンでのMIL応用(3)

入力画像+

距離画像

法線情報を使って多層セグメンテーション

Page 57: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

57

MILMachine Intelligence Lab.

カラー特徴 grayscale特徴 形状曲率特徴 全特徴使用 [Pandey and Lazebnik 2011]

RGB-D Scenes Dataset [Lai et al., 2011]で試したよ→

対象物体

最先端コンピュータビジョンでのMIL応用(3)

物体検出• 多種類の三次元特徴量を用いた物体セグメンテーションの弱教師付き学習 [金崎ら, MIRU2012]

3D特徴量 やはり、ごちゃごちゃ環境下で2Dだけではうまくいかない

Page 58: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

58

MILMachine Intelligence Lab.

Ground Truth

Learned Objects

最先端コンピュータビジョンでのMIL応用(3)

物体検出• Weakly-supervised Multi-class Object Detection Using Multi-type 3D Features.

[Kanezaki et al., ACMMM2013]

• 物体100個を学習• データセット公開

Page 59: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

59

MILMachine Intelligence Lab.

Multiple Instance Learningまとめ

• Multiple Instance Learningを使うときの注意・・・

どんな手法がいいか、データにかなり依る

- bag内のinstanceの総数

- positive instanceとnegative instanceの比 etc.

また、反復計算のものが多く初期値に依存しがち

• ソフトウェア・・・

今回紹介した手法は全部MILL に入ってる(MATLAB)

http://www.cs.cmu.edu/~juny/MILL/

※今回の資料づくりもここを大変参考にしました。

Page 60: 3D物体認識と 弱教師付き学習 - mi.t.u-tokyo.ac.jp · PDF file1 MIL Machine Intelligence Lab. 3D物体認識と 弱教師付き学習 2014/06/18 10:30 –12:00 知能情報論

60

MILMachine Intelligence Lab.

• 3D物体認識の歴史を紹介– 3D特徴量

– RGBD SLAM

– セマンティックマッピング

etc.

• 弱教師付き学習 –特にMultiple Instance Learning (MIL)を紹介– Diverse Density (DD)、EM-DD

– mi-SVM、MI-SVM

– Citation kNN

授業のまとめ

ご清聴ありがとうございました!