22
Copyright © 2016 OPTiM Co. All Rights Reserved. OPTiM インターンシップ最終報告 機械学習による画像の領域分割 大阪大学大学院 情報科学研究科 M1 H.S 1 2016/10/01

Optim インターンシップ 機械学習による画像の領域分割

Embed Size (px)

Citation preview

Page 1: Optim インターンシップ 機械学習による画像の領域分割

Copyright © 2016 OPTiM Co. All Rights Reserved.

OPTiM インターンシップ最終報告機械学習による画像の領域分割

大阪大学大学院

情報科学研究科 M1

H.S

1

2016/10/01

Page 2: Optim インターンシップ 機械学習による画像の領域分割

• 名前:H.S 修士1年

• 所属:大阪大学大学院情報科学研究科マルチメディア工学専攻

• 機械学習・最適化・コンピュータビジョン

• 研究テーマ:

• 「プライバシに配慮した屋内位置推定」

• 「微細形状の高精細3次元推定」

• サークル:NHK大学ロボコン(制御担当)

• 趣味:スキューバダイビング・エレクトーン

2

自己紹介

Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 3: Optim インターンシップ 機械学習による画像の領域分割

背景・目的

3Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 4: Optim インターンシップ 機械学習による画像の領域分割

4

背景 -画像処理における物体認識

物体カテゴリ認識 物体検出 物体領域抽出

顔の位置 顔(人体)の領域

輪郭

画像が顔を含むか否か

Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 5: Optim インターンシップ 機械学習による画像の領域分割

• ピクセルごとのラベリングを畳み込み層のみ(DCNN)で実装

5

背景 -論文紹介 - SegNet

Badrinarayanan, Vijay, Ankur Handa, and Roberto Cipolla. "Segnet: A deep convolutional encoder-decoder

architecture for robust semantic pixel-wise labelling." arXiv preprint arXiv:1505.07293 (2015).

Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 6: Optim インターンシップ 機械学習による画像の領域分割

• 空撮画像によるセグメンテーション

• カラー画像、高度画像

• 農業

• 農作物と雑草などを分離

• 測量

• 地面や道路、森林など、車両などを分離

6

目的 -空撮画像のセグメンテーション

Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 7: Optim インターンシップ 機械学習による画像の領域分割

提案手法

7Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 8: Optim インターンシップ 機械学習による画像の領域分割

• 画像をウィンドウに分割

• ウィンドウごとにラベリング

• 分類問題として解く

• PROS

• 機械学習の代表的なアプローチ

(多数の手法が提案されている)

• CONS

• “分類”に適さない入出力関係

• ピクセルごとに推定→ 処理時間が増大

8

提案手法 -概要

Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 9: Optim インターンシップ 機械学習による画像の領域分割

9

提案手法 -詳細

最大の面積を占めるラベル↓

入力画像のラベル

INPUT Max Pooling

Fully Connected

102

123

ネットワーク構造(CNN

Convolution1(5x5)

Convolution2(5x5) + Max Pooling

1x32x32 16x32x32

16x16x16

16x16x16

16x8x8

Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 10: Optim インターンシップ 機械学習による画像の領域分割

評価

10Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 11: Optim インターンシップ 機械学習による画像の領域分割

• NVIDIA Jetson TK1 開発者用キット

• GPU:326GFlops (VRAM:2GB)

• CPU:64GFlops (Cortex-A15)

• TDP:10W程度

11

評価 -実行環境

DNNの計算は行列演算の繰り返し-> GPUによる高速化

Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 12: Optim インターンシップ 機械学習による画像の領域分割

• データセット

• A/B の2個の画像

• トレーニングデータ

• Aからランダムに5000枚のバッチを切り出す

• 評価

• 学習方法による精度への影響

• 処理時間

12

評価 -概要

Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 13: Optim インターンシップ 機械学習による画像の領域分割

BA• 地面

• acc:0.959

• recall:0.909

• 森林

• acc:0.779

• recall:0.905

• その他

• acc:0.992

• recall:0.978

• 平均

• acc:0.910

• recall:0.930

13

評価 -推定結果

Copyright © 2016 OPTiM Co. All Rights Reserved.

• 地面

• acc:0.991

• recall:0.980

• 森林

• acc:0.956

• recall:0.850

• その他

• acc:0.577

• recall:0.837

• 平均

• acc:0.841

• recall:0.889

Page 14: Optim インターンシップ 機械学習による画像の領域分割

• Iter 1000: 学習不足

• Iter 4000: 学習がうまく進んでいた

• Iter 8000: 過学習が見受けられた

14

評価 -イテレーション回数の影響

Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 15: Optim インターンシップ 機械学習による画像の領域分割

• トレーニングデータの正規化

• 深度画像をそのまま用いると過学習を招く

• バッチごとに平均が0になるように正規化

(分散はそのまま)

15

評価 -過学習の解消

Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 16: Optim インターンシップ 機械学習による画像の領域分割

• 正規化を導入することで過学習を防げた (Iter: 8000)

16

評価 -トレーニングデータ正規化の効果

Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 17: Optim インターンシップ 機械学習による画像の領域分割

• 学習時間

• CPU (Jetson) : 1.3iter / sec

• GPU (Jetson) : 17.5iter / sec

• 推定時間

• CPU (Jetson) : 8.0ms / image

• GPU (Jetson) : 7.5ms / image

17

評価 -処理速度

13倍

※A全体を推定するのに60,000枚, 10分程度

※推定ではミニバッチが活用できていない

Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 18: Optim インターンシップ 機械学習による画像の領域分割

今後の課題

18Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 19: Optim インターンシップ 機械学習による画像の領域分割

• ネットワーク構造 (アップサンプリング系のレイヤー)

• 入力データ (RGB画像、点群…)

• 前処理 (データの性質に合わせた処理)

• トレーニングデータ(手動、擬似生成、シミュレーション)

19

今後の課題

Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 20: Optim インターンシップ 機械学習による画像の領域分割

インターンシップの感想

20Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 21: Optim インターンシップ 機械学習による画像の領域分割

• 勉強会のSDK開発のお話は、まさに個人や大学における開発と企

業における開発の違いだと感じたので興味深かった

• 菅谷社長とお話できて非常に勉強になりました

• まだまだ試してみたいことがたくさんあります

• 前処理ひとつで精度が左右されるDNNの難しさを実感しました

• これでうまくいった、うまくいかなかった、改善した、しなかっ

たというひとつひとつの経験が興味深かった

• とても短い2週間でした

21

インターンシップの感想

Copyright © 2016 OPTiM Co. All Rights Reserved.

Page 22: Optim インターンシップ 機械学習による画像の領域分割

www.optim.co.jp

22Copyright © 2016 OPTiM Co. All Rights Reserved.