1
手法: 局所点群ごとに推定&クラスタリング+ rNNAttention 局所点群ごとに推定& 重心座標でクラスタリング: 任意個数の物体に 対応するための アプローチ 重心座標が比較的 安定して推定できる ことを利用する rNNによる局所点群抽出: 計測される点群の 実スケール性を重視し, kNNではなくrNNを採用 Attentionの導入: 二点ペアに対して Attentionに似た重み付けを採用し,相対関係が似ているペアが 近い重みになるように学習させる 研究報告概要 目標: ロボットによるばら積みピッキング なんでもみえる三次元ロボットビジョン 研究課題: プロジェクタ・カメラ間の輝度伝達行列の推定に基づく三次元計測法 早稲田大学 理工学術院総合研究所 尾形研究室 次席研究員 / オムロンサイニックエックス Project Researcher 千葉 直也 研究成果の詳細 問題点: 計測ができない ハンドリングできない 例) ACT-I先端研究フォーラム~「情報と未来」研究者講演会~ - ACT-I 1期生加速フェーズ・3期生成果発表会 - 3Dセンサの低価格化・PCの高性能化 工業における三次元ベースの物体ハンドリング需要 計測結果の例 一画素照射&エピポーラ幾何 直接反射成分を取り出す 金属・プラスチックの計測が できる可能性がある アプローチ: 輝度伝達行列(LTM=一画素照射応答を まとめた行列 を「高速に推定」すると 直接反射光を抽出可能 プロジェクタ・カメラ解像度: 256x256 Gray Code Phase Shift 提案法 計測シーン 成果1: LTM推定とLTMによる三次元形状計測 成果2: 低密度点群でのインスタンス認識と位置・姿勢推定 LTM推定は計測する点群の密度に応じて計算時間が大きく変化 点群深層学習の手法で,低密度な点群でインスタンス認識, 位置・姿勢推定を行うことでピッキング全体を高速化 点群深層学習: PointNet (CVPR2017)DeepSets (NIPS2017) 以降,急速に 発展している,点群をニューラルネットワークで直接扱う手法 インスタンス認識: 点群から各物体を認識, 教師なしクラスタリング 手法を応用 位置・姿勢推定: インスタンス認識した 物体の回転・並進を 推定する手法 金属物体のインスタンス認識と位置・姿勢推定例 0 [sec] 5 [sec] 10 [sec] 15 [sec] 20 [sec] 25 [sec] 30 [sec] 35 [sec] 40 [sec] プロジェクタ・カメラ解像度: 128x128(最大点数16,384点) → 背景除去などの前処理をして点群深層学習で認識 → ロボットで把持 ピッキング実験 構築したピッキングシステム 実行時間の内訳 LTM推定の高速化・高解像度化 計算時間 照射・撮影枚数 解像度 LTM推定(ナイーブな手法) 1132 16x16 行分解推定 3864 32x32 多段解像度推定 182265 128x128 5.8114 256x256 SMW公式適用 5.26.165 128x128 複数行同時推定 4.85.265 128x128 222397 256x256 行分解推定: 部分問題に分解して推定しても解が一致することを示した 多段解像度推定: LTMの持つ構造を利用,Coarse-to-FineLTMを推定 SMW公式適用: 白飛び対応/白飛び・黒つぶれ対応のスパース推定手法にも SMW公式を適用し高速化 複数行同時推定: 行分解推定と多段解像度推定を組み合わせた際の トレードオフを指摘し高速化 インスタンス認識,位置・姿勢推定 手法: スパース推定の高速化・高解像度化とロバスト化 スパース推定: LTMにはゼロ要素が多い→ すべての要素を計測せずに推定 高速化・高解像度化: LTMの持つ性質をうまく使い,LTMの推定を高速化 ロバスト化: 白飛び・黒つぶれ環境下でもスパース推定できるような手法を提案

研究報告概要 - JST · 2020. 5. 8. · 研究報告概要 目標: ロボットによるばら積みピッキング なんでもみえる三次元ロボットビジョン. 研究課題:

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 研究報告概要 - JST · 2020. 5. 8. · 研究報告概要 目標: ロボットによるばら積みピッキング なんでもみえる三次元ロボットビジョン. 研究課題:

手法: 局所点群ごとに推定&クラスタリング+rNN+Attention局所点群ごとに推定&重心座標でクラスタリング:

任意個数の物体に対応するためのアプローチ重心座標が比較的安定して推定できることを利用する

rNNによる局所点群抽出:計測される点群の実スケール性を重視し,kNNではなくrNNを採用

Attentionの導入:二点ペアに対してAttentionに似た重み付けを採用し,相対関係が似ているペアが近い重みになるように学習させる

研究報告概要

目標: ロボットによるばら積みピッキング

なんでもみえる三次元ロボットビジョン研究課題: プロジェクタ・カメラ間の輝度伝達行列の推定に基づく三次元計測法早稲田大学 理工学術院総合研究所 尾形研究室 次席研究員 / オムロンサイニックエックス Project Researcher 千葉 直也

研究成果の詳細

問題点: 計測ができない→ ハンドリングできない

例)

ACT-I先端研究フォーラム~「情報と未来」研究者講演会~ - ACT-I 1期生加速フェーズ・3期生成果発表会 -

3Dセンサの低価格化・PCの高性能化→ 工業における三次元ベースの物体ハンドリング需要

計測結果の例

一画素照射&エピポーラ幾何で直接反射成分を取り出す→ 金属・プラスチックの計測が

できる可能性がある

アプローチ:輝度伝達行列(LTM)=一画素照射応答を

まとめた行列を「高速に推定」すると直接反射光を抽出可能

プロジェクタ・カメラ解像度: 256x256

Gray CodePhase Shift

提案法計測シーン

成果1: LTM推定とLTMによる三次元形状計測

成果2: 低密度点群でのインスタンス認識と位置・姿勢推定

LTM推定は計測する点群の密度に応じて計算時間が大きく変化→ 点群深層学習の手法で,低密度な点群でインスタンス認識,

位置・姿勢推定を行うことでピッキング全体を高速化

点群深層学習:PointNet (CVPR2017),DeepSets (NIPS2017) 以降,急速に発展している,点群をニューラルネットワークで直接扱う手法

インスタンス認識:点群から各物体を認識,教師なしクラスタリング手法を応用

位置・姿勢推定:インスタンス認識した物体の回転・並進を推定する手法

金属物体のインスタンス認識と位置・姿勢推定例

0 [sec] 5 [sec] 10 [sec] 15 [sec] 20 [sec] 25 [sec] 30 [sec] 35 [sec] 40 [sec]

プロジェクタ・カメラ解像度: 128x128(最大点数16,384点)→ 背景除去などの前処理をして点群深層学習で認識 → ロボットで把持

ピッキング実験

構築したピッキングシステム実行時間の内訳

LTM推定の高速化・高解像度化計算時間 照射・撮影枚数 解像度

LTM推定(ナイーブな手法) 11分 32 16x16

行分解推定 38分 64 32x32

多段解像度推定18~22秒 65 128x128

5.8分 114 256x256

SMW公式適用 5.2~6.1秒 65 128x128

複数行同時推定4.8~5.2秒 65 128x128

22~23秒 97 256x256

行分解推定:部分問題に分解して推定しても解が一致することを示した

多段解像度推定:LTMの持つ構造を利用,Coarse-to-FineにLTMを推定

SMW公式適用:白飛び対応/白飛び・黒つぶれ対応のスパース推定手法にもSMW公式を適用し高速化

複数行同時推定:行分解推定と多段解像度推定を組み合わせた際のトレードオフを指摘し高速化

インスタンス認識,位置・姿勢推定

手法: スパース推定の高速化・高解像度化とロバスト化スパース推定:

LTMにはゼロ要素が多い→ すべての要素を計測せずに推定高速化・高解像度化:

LTMの持つ性質をうまく使い,LTMの推定を高速化ロバスト化:

白飛び・黒つぶれ環境下でもスパース推定できるような手法を提案