Click here to load reader
Upload
hirokatsu-kataoka
View
4.401
Download
0
Embed Size (px)
Citation preview
CVPR2016 速報–2015と2016の差分 –
片岡 裕雄 http://www.hirokatsukataoka.net/
概要
• CV分野のトップ会議CVPR–2015/2016の差分– CVPR2016(本会議2016/6/27–2016/6/30)の速報
– CVPR2015とCVPR2016の差分をまとめました
– 前提としてCVPR2015の論文もしくはまとめ資料全てに目を通し
た※&CVPR2016に参加した※cvpaper.challenge(h=p://www.slideshare.net/cvpaperchallenge)より
– 速報性を重視したためメモ程度であることにご注意
CNNの扱いについて– DeepLearningはもはや当たり前となったので、あまり気にしなく
なっている• 論文検索でタイトルや内容検索すると約400件/643件
• 発表で聞いている感じだと80~85%はCNN/RNNなど使っている印象
• もちろん,この先どうするか?という議論は絶えない
– RNNが昨年よりも確実に増えた• 2015年は画像生成文や一部の動画処理だった
• 2016年は画像生成文,質問回答(VisualQuesMonAnswering;VQA)をはじ
め動画処理や画像解析(ImageParsing)など文脈を考慮するモデルなら
RNNを用いるという傾向
激戦区?– 物体検出• 文字通り画像内の位置を求める問題で,現在ではクラスも含めて位置を
推定
– セマンティックセグメンテーション• 物体検出からさらに踏み込んで,ピクセルレベルで位置を推定,もちろん
クラスも推定
– 画像解析• 画像認識が高精度にできたことで,画像解析(ImageParsing)も徐々に増え
た• 静止画から総合的な画像の理解を求める問題が増えた
CNNと並列に用いられる手法– MRF/CRFやRandomForests• セグメンテーションや文脈解析などはMRF/CRFが根強く残る
• RandomForestsは並列処理も可能でCPUでの実応用に耐えうるから?
• 両者の理論は未だに面白いため,洗練されたものであれば査読を突破す
ることが可能
オーラル発表から(1)– VisualQuesMonAnswering(VQA)が初日オーラルの一番最初の
ひとつに• 言語とビジョンがひとつのトレンド
• もちろん画像説明文は健在
• 画像説明文からの派生も含まれる (動画応用、アプリケーション等)
オーラル発表から(2)– ボリュームデータの活用• 時系列解析,動画像
• 3次元データ処理
• 両者が昨年よりも目立っている気がする
時系列解析– 行動認識
– イベント認識
– 一人称ビジョン
– ビデオサマライズ
など
3次元解析– 物体検出
– 属性推定
– セマンティック解析
– ポイントクラウド
など
人物解析– 顔認識
– 検出
– 追跡
– 姿勢推定
– 再同定
– 属性推定
– 行動認識
など
自動運転への取り組み– セッションは特別なかったが,アプリケーションとして自動運転へ
向けた取り組みが見られた• 歩行者検出
• 物体検出
• 環境認識
• セマンティックセグメンテーション
• (セマンティック)オプティカルフロー
• ステレオ視
• トラッキング
• 属性解析
など
根強く残る研究– デバイスや光,センシングを用いる研究枠は変わらず残る
– ComputaMonalPhotography
データセット– 相変わらず巨大化する傾向にある
– 面白いデータセットを提供するグループも
新しい問題– 最近の問題のフォロー含む
– 物理量の変換
– 地図検索
– UAV– その他,個別分野で提案
今後の方針?(1)
• やはり問題設定を作ることが重要
– CNNはツールとして用いる
– 一時期のHOGやSIFTなどと同様
今後の方針?(2)
• データセットを作る– 問題と同時にデータセットを自分で作る
– 覚悟する!
– データの作成が新規性のひとつとして論文に書ける
今後の方針?(3)
• 新規性をうまくアプリケーションとして見せる– 昔のBuildingRomeinaDay(ICCV2009)のようなイメージ
– 今回のCVPRだとFace2Faceなど
– 少しの差分でもその違いで見える未来を(分かりやすく)説明
– 分かりやすく,というところが重要
今後の方針?(4)
• ロストアイディアを復活できないか– DeepLearningにより(一時的に)消されたアイディアを復活
– もちろん,今風にアレンジ
– 可能性があるにも関わらず,消えたアイディアという意味