4
Meiji University Title Author(s) �,Citation URL http://hdl.handle.net/10291/20866 Rights Issue Date 2020 Text version ETD Type Thesis or Dissertation DOI https://m-repo.lib.meiji.ac.jp/

2019 年度理工学研究科 博士学位請求論文 要旨 スポーツ映像解析 …€¦ · 用することで,fppi が0.1 であるときにmr が0.3% という実用に十分耐え得る精度を得ることができた.

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 2019 年度理工学研究科 博士学位請求論文 要旨 スポーツ映像解析 …€¦ · 用することで,fppi が0.1 であるときにmr が0.3% という実用に十分耐え得る精度を得ることができた.

Meiji University

 

Title スポーツ映像解析のための特定物体検出に関する研究

Author(s) 大木,琢郎

Citation

URL http://hdl.handle.net/10291/20866

Rights

Issue Date 2020

Text version ETD

Type Thesis or Dissertation

DOI

                           https://m-repo.lib.meiji.ac.jp/

Page 2: 2019 年度理工学研究科 博士学位請求論文 要旨 スポーツ映像解析 …€¦ · 用することで,fppi が0.1 であるときにmr が0.3% という実用に十分耐え得る精度を得ることができた.

2019年度 理工学研究科

博士学位請求論文 (要旨)

スポーツ映像解析のための特定物体検出に関する研究

A Study on Single-Category Object Detection for Sports Scene Analysis

情報科学専攻

大木 琢郎

1 問題意識と目的

著者は現在,近い将来において毎日のヘルスケアの実践が一般化された社会を構築することを目指し,そ

のために不可欠な生体情報をリアルタイムにモニタリング可能なシステムの構築に関する研究に取り組んで

いる.本研究開発における主要な目的としては次の 2つが挙げられる.

• 小・中学校などの幼少時期から,児童に生体情報センシング機器を装着させ,生体情報の意義を児童自身に理解させることによるヘルスリテラシーの醸成.

• 運動中の選手の生体情報をリアルタイムにモニタリングすることによる,熱中症を始めとする疾病の予防及び,選手養成の分野における適切な負荷の設定によるトレーニングの効率化.

著者が実現を目指すモニタリングシステムにおいては,運動中の選手に生体情報を取得可能なセンサデバ

イスを装着し,デバイス間でマルチホップネットワークの構築を行うことで,データ収集を行うノードへバ

ケツリレー方式で生体情報の通信が行われる.この際,リアルタイムかつ高信頼な通信を行うためには,セ

ンサノードの位置情報に基づく適切な通信経路の設定が必要であるが,センサノードの高速な移動や局所的

な高密度化の影響によって,受信電波強度に基づく従来手法が上手く機能しないという問題が存在する.

著者はこの問題に対して,画像処理及び認識の技術を用いた新たなルーティング方式である Image Assisted

Routing(IAR) の提案を行うことで解決を図る.IARでは,図 1に示されるように,競技場の周辺に固定設置

された,あるいは UAVに搭載されたカメラから撮影された映像を用いて,運動中の選手 (センサノード)の

認識及び位置推定を行い,得られた位置情報に基づいてネットワークの構築を行うことを考える.

本論文では,前述した IAR システムにおいて実用上最も重要であると考えられる高精度かつ実時間処理可

能な物体検出技術に着目し,その実現のために次章に記すような様々な提案及び検証を行った.

図 1 Image Assisted Routing のシステム概要図

1

Page 3: 2019 年度理工学研究科 博士学位請求論文 要旨 スポーツ映像解析 …€¦ · 用することで,fppi が0.1 であるときにmr が0.3% という実用に十分耐え得る精度を得ることができた.

2 構成及び各章の要約

1 章においては,始めに著者らが現在取り組んでいる運動中の選手から生体情報をリアルタイムにモニタ

リング可能なシステムの概要について述べ,提案モニタリングシステムの実現が,本研究における最大の

目的である一般社会への日常生活における健康管理の重要性の認知とその定着に帰着する理由について述

べる.その後,提案モニタリングシステムを構成する技術についての詳細な解説及び実現に向けた課題の

提示を行い,その解決のために著者らが提案した画像情報に基づく新たなルーティング手法である Image

Assisted Routing(IAR) についての解説を行う.本論文における研究目的は,IAR の実現に向けて不可欠な

要素である高精度かつ実時間処理可能な選手検出手法の提案であり,以降の章において同研究目的達成のた

めに行われた様々な取り組みについて述べていく.

2 章においては,本論文において著者らが取り組む IAR の実現において重要であると考えられる,画像情

報に基づく物体検出の技術や既存研究について網羅的に述べていく.まず,一般的に周知されている物体検

出というタスクが,今日において活発に取り扱われるに至った経緯について,その歴史的背景を踏まえた解

説を行っていく.しかし本論文において著者が取り組むタスクは,この一般物な物体検出とは異なり,特定

のカテゴリに属する物体のみを対象とする特定物体検出と呼ばれるタスクであるため,前述の一般的な物体

検出について述べた後,その研究背景,処理方式及び著名な既存研究についてより踏み込んだ解説を行う.

3 章においては,IAR の実現に必要不可欠な選手検出手法の提案を行う.著者は,IAR が適用される環境

においては背景領域のパターンがある程度限定されること,及び空撮映像の利用によって検出精度低下の原

因となる物体遮蔽の影響が軽減されることを考慮することで,計算コストの高い輝度勾配情報を検出の手が

かりとする従来手法を用いなくとも,特徴表現の方法を工夫することで,実用上十分な精度の達成が可能で

あると考え,物体の統計的な形状情報に基づいた特徴設計を行う Informed-Filtersの考え方を取り入れた,計

算コストの低い色空間特徴のみを用いた選出検出向けの手法の提案を行った.一般に公開されているデータ

セットである PET2003を用いて検出性能の検証を行った結果,提案手法は FPPI (画像当たりの平均誤検出

数)が 0.1 であるときにMR(検出見逃し率)が 1.28%であるような非常に高い精度で検出を行うことが可能で

あることを示した.また輝度勾配情報を用いた手法との比較を行った結果,提案手法は,同程度の精度を達

成しながら約 3倍の高速化を実現することが出来た.

4 章においては,IAR が適用される実際の環境を想定したデータセットの作成を行い,同データセットに

対しても提案手法が有効に機能するかについての検証を行った.作成したデータセットは二種類あり,一つ

は 3 次元仮想空間内に複数の視点を配置した作成した多視点データセットで,もう一つは競技場周辺にカメ

ラを搭載した UAV を配置し,実際に運動している選手の映像から作成された実画像データセットである.

多視点データセットでは,視点の配置による提案手法の検出精度への影響についての検証を行った.検証

を行った結果,全体として高い精度を示したが,特に競技場の真上より 15◦-30◦ の範囲に視点を配置するこ

とで安定して高い検出精度を示すことがわかった.これは視点が多少傾くことによって,真上からの視点よ

りも識別に有効な検出対象の形状情報を表す特徴表現を得られるためであると考えられる.一方で傾きが過

剰に大きくなることで,物体遮蔽の影響が強くなることによる精度の低下が見られた.IARのような空撮映

像が利用可能な環境においては,視点の位置によって変化する検出対象の形状を表現する情報の量と物体遮

蔽の強さはトレードオフの関係にあることが考えられるため,双方のバランスを考慮した配置を行うことが

重要であると考えられる.また同データセットを用いて,深層学習に基づく手法で近年の物体検出の分野で

State-of-the-art な精度を達成している YOLOv3 との性能比較を行った結果,YOLOv3 では多くの誤検出が

見られ,提案手法の方がより優れた手法であることが示された.

実画像データセットを用いた検証においては,実用に耐え得る精度を保ちながら計算コストを可能な限り

削減することを目的として,弱識別器の数を 5から 200個までの計 11 種類の識別器を構築し,それぞれにつ

いて精度評価による検証を行った.検証の結果,実画像を用いた場合でも,弱識別器の個数は 125 個程度使

2

Page 4: 2019 年度理工学研究科 博士学位請求論文 要旨 スポーツ映像解析 …€¦ · 用することで,fppi が0.1 であるときにmr が0.3% という実用に十分耐え得る精度を得ることができた.

用することで,FPPI が 0.1であるときにMR が 0.3%という実用に十分耐え得る精度を得ることができた.

4章までで得られた検証結果より,いずれのデータセットにおいても優れた性能を示している提案手法は

IARへの高い適応性を保持していると考えられる.そのため 5 章においては,提案手法の機構を UAV上に

搭載する目的として,小型開発ボードである Jetson への移植を目的とした提案手法の GPU 並列実装を行っ

た.提案実装においては,特徴計算時に使用される”Binary”あるいは”Ternary”と呼ばれる複合矩形特徴に対

して,複合矩形の最小数分割処理を適用することによってレイテンシの増大を引き起こす画素へのランダム

アクセス回数を大幅に削減可能な実装手法の提案を行い,GPUによる並列実装と組み合わせることによっ

て提案手法の高速化を図っている.検出精度及び処理速度による性能評価を行った結果,提案実装は精度劣

化なしに約 18 倍の高速化を実現した.また Jetsonへの移植を行った結果,2560× 1352 画素の画像に対して

約 40 fpsで動作可能であるという結果が得られ,提案手法は使用可能な計算リソースが限られる場合でも実

時間での実行が可能であることが確認された.

6 章においては,特定物体検出のより一般的な課題である識別器の学習に使用される訓練サンプルの不均

衡問題の解決に向けた手法の提案を行った.物体検出のさらなる精度向上のための鍵の一つに,正例の数に

比べて負例の数が非常に多くなるという学習データの不均衡の問題の解決が挙げられ,学習サンプルが不

均衡であるデータセットを用いて学習を行う場合,学習速度の低下やモデルの偏りを引き起こす可能性が

ある.同章ではこの問題を解決するべく,高速且つ高精度な識別器の構築のために広く使われているカス

ケード識別器の考え方を取り入れた新たなネットワークアーキテクチャ”CasNet”の提案を行った.PASCAL

VOC2012 から作成したデータセットを用いた性能評価の結果,CasNetによって,学習の効率化及び最大で

8.71%の精度向上が確認され,提案手法による不均衡問題の解決に向けたアプローチは単純でありながら有

効に機能することが示された.

ここまでの研究成果より,IAR において不可欠な技術要素である,高精度でありながら実時間での動作が

可能な選手検出手法の提案を行い,様々な観点から多角的な検証を行うことによって,提案手法の高い有効

性及び実用性を確認することができた.この成果は IAR の実用化に向けて大きく寄与するものであると考

えられ,ひいては IAR が適用される生体情報モニタリングシステムの実現による,将来の日本における日常

的なヘルスケア実践の定着という,本研究の最終的な目的への貢献となることが期待される.

また検証の過程において,物体検出の対象となるアプリケーションの性質を十分に考慮し,さらに特徴表

現方法や高速化の工夫を行うことによって,提案手法のような古典的物体検出方式に基づく手法が,深層学

習に基づいた手法を凌ぐ性能を達成し,実用上有効である場合が存在するという知見を得ることができた.

これは近年の物体検出に関する研究において,あるいはその技術の産業への応用を考えるに際して主流と

なっている深層学習の安易な利用に対して一考の必要性があることを示唆していると考える.

3