11
20205研究室紹介 機械学習と 統計的データ解析 機械学習と 統計的データ解析 杉山・本多・横矢研究室 {sugi, jhonda, yokoya}@k.u-tokyo.ac.jp http://www.ms.k.u-tokyo.ac.jp

研究室紹介 2020年5月 機械学習と 統計的データ解析 · 研究 室紹介 2020年5月 ... Microsoft PowerPoint - LabIntro-jp.pptx Author: sugi Created Date: 5/11/2020

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 研究室紹介 2020年5月 機械学習と 統計的データ解析 · 研究 室紹介 2020年5月 ... Microsoft PowerPoint - LabIntro-jp.pptx Author: sugi Created Date: 5/11/2020

2020年5月研究室紹介

機械学習と統計的データ解析

機械学習と統計的データ解析

杉山・本多・横矢研究室

{sugi, jhonda, yokoya}@k.u-tokyo.ac.jphttp://www.ms.k.u-tokyo.ac.jp

Page 2: 研究室紹介 2020年5月 機械学習と 統計的データ解析 · 研究 室紹介 2020年5月 ... Microsoft PowerPoint - LabIntro-jp.pptx Author: sugi Created Date: 5/11/2020

コンピュータはどこまで賢くなれるのか?

我々の研究室では,機械学習の研究を行っています:

基礎理論の構築

実用的なアルゴリズムの開発

実問題への応用

2

Page 3: 研究室紹介 2020年5月 機械学習と 統計的データ解析 · 研究 室紹介 2020年5月 ... Microsoft PowerPoint - LabIntro-jp.pptx Author: sugi Created Date: 5/11/2020

教職員

杉山 将(教授):

頻度系機械学習,産業応用など

本多 淳也(講師):

バンディット理論,情報理論など

横矢 直人(講師):

画像処理,リモートセンシングなど

山根 一航(特任研究員):

マルチタスク学習,因果推論など

3

Page 4: 研究室紹介 2020年5月 機械学習と 統計的データ解析 · 研究 室紹介 2020年5月 ... Microsoft PowerPoint - LabIntro-jp.pptx Author: sugi Created Date: 5/11/2020

教職員の所属 大学院新領域創成科学研究科

複雑理工学専攻(柏)

大学院情報理工学系研究科コンピュータ科学専攻(本郷)

理学部情報科学科(本郷)

ニューロインテリジェンス国際研究機構(本郷)

理化学研究所革新知能統合研究センター(日本橋)

4

本郷

日本橋

所属学生数博士課程:21名修士課程:26名研究生:2名

(旧佐藤研の学生を含む)

Page 5: 研究室紹介 2020年5月 機械学習と 統計的データ解析 · 研究 室紹介 2020年5月 ... Microsoft PowerPoint - LabIntro-jp.pptx Author: sugi Created Date: 5/11/2020

最近の主な研究テーマ

弱教師付き学習:

データのラベル付けは高コスト

しかし,小データからの学習は一般には難しい

容易に入手できる弱いデータを活用する新しい枠組みを開発

例:PU, PNU, Pconf, UU, SDU,補ラベル学習など

5

Page 6: 研究室紹介 2020年5月 機械学習と 統計的データ解析 · 研究 室紹介 2020年5月 ... Microsoft PowerPoint - LabIntro-jp.pptx Author: sugi Created Date: 5/11/2020

最近の主な研究テーマロバストで信頼性の高い学習:

実世界のデータには,雑音,異常値,非定常性などが含まれることが多い.

標準的な機械学習技術では,そのようなデータからうまく学習できない

そのようなデータに対しても有効な,新しい学習技術を開発

例:共教示,ラベルノイズ学習,棄却付き分類,転移学習など

6

Page 7: 研究室紹介 2020年5月 機械学習と 統計的データ解析 · 研究 室紹介 2020年5月 ... Microsoft PowerPoint - LabIntro-jp.pptx Author: sugi Created Date: 5/11/2020

最近の主な研究テーマ

動的な意思決定アルゴリズム:

広告配信や医療,科学実験など,データが試行錯誤を通じてのみ得られる場合がしばしば現れる

そういった状況では,得られる知識と利益のバランスを考えながら次の試行対象を決定する必要がある.

例: バンディット問題,実験計画など

7

Page 8: 研究室紹介 2020年5月 機械学習と 統計的データ解析 · 研究 室紹介 2020年5月 ... Microsoft PowerPoint - LabIntro-jp.pptx Author: sugi Created Date: 5/11/2020

最近の主な研究テーマ

定性的データのための意思決定アルゴリズム

人間の選好・評価が関わるデータは多くの場合定量的でなく定性的 (良い/まあまあ/悪い, AはBより良い,…)

まず各候補の「良さ」を定量化し,そのうえで推定精度改善のための候補を適切に選択する必要がある.

例: 比較バンディット,部分観測問題など

8

fully cured improved worsened

learner environment

action

feedback

or ?

1st: xx 2nd: yy 3rd: zz

Page 9: 研究室紹介 2020年5月 機械学習と 統計的データ解析 · 研究 室紹介 2020年5月 ... Microsoft PowerPoint - LabIntro-jp.pptx Author: sugi Created Date: 5/11/2020

最近の主な研究テーマ 9

不完全データの復元

計測データは不完全であることが多い(例:ノイズ,欠損,低解像度など)

教示データなしで不完全データを復元する

例:Deep image prior,低ランクテンソル解析など

Page 10: 研究室紹介 2020年5月 機械学習と 統計的データ解析 · 研究 室紹介 2020年5月 ... Microsoft PowerPoint - LabIntro-jp.pptx Author: sugi Created Date: 5/11/2020

最近の主な研究テーマ 10

意味的変化検出

実世界で何がどう変化したかについてのアノテーションはコストが高く時間がかかる

人のアノテーションなしで変化を理解する

例:合成データからの学習,サイド情報を使用した学習,クロスモーダル学習など

Page 11: 研究室紹介 2020年5月 機械学習と 統計的データ解析 · 研究 室紹介 2020年5月 ... Microsoft PowerPoint - LabIntro-jp.pptx Author: sugi Created Date: 5/11/2020

杉山・本多・横矢研究室:機械学習と統計的データ解析

目標:人間のように学習するコンピュータを作る

教師付き学習:人間が直接コンピュータの学習を手伝う

教師なし学習:人間はコンピュータの学習を手伝わない

強化学習:人間が間接的にコンピュータの学習を手伝う

研究の観点:

理論:確率論,統計学,最適化,情報理論など

アルゴリズム:有効性,効率性,実用性など

応用:信号,画像,センサ,ウェブ,言語,ロボット,生命,脳,医療など

11