20
古崎研究室の紹介 大阪電気通信大学 情報通信工学部 情報工学科 2019/9/20 1 研究室見学(2019(こざき)

古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

古崎研究室の紹介

大阪電気通信大学

情報通信工学部 情報工学科

2019/9/20 1

研究室見学(2019年)

(こざき)

Page 2: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

古崎研究室の概要

◼ 構成員

◼ 教授 古崎 晃司 (2019年4月着任)

◼ 専門分野:オントロジー工学(情報科学・人工知能)

◼ 主な担当科目:人工知能,データマイニング

◼ 学生 学部4年生:6名

◼ 研究室の場所

◼ M号館3階 M308

◼ 研究テーマ

◼ オントロジー工学とLOD(Linked Open Data)・知識グラフを基盤としたセマンティック(意味処理)技術によるAIシステムの開発

2019/9/20 2

研究成果として公開中のソフト

Page 3: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

古崎研で扱う基盤技術

セマンティック技術

◼ オントロジー工学

◼知識グラフ(ナレッジグラフ)・LOD(Linked Open Data)

2019/9/20 3

Page 4: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

セマンティック技術の位置づけ

◼ 人工知能研究における2つのアプローチ

◼ データ駆動型AI

:大量のデータから,数理モデルやアルゴリズム等に基づいて,法則性や関係性を導出するアプローチ.

◼例)機械学習,深層学習,パターン認識,データマイニング,統計解析,…

◼ 知識型AI

:計算機上に表現された知識に基づいて,必要な解答や知識を導出するアプローチ

◼例)知識表現,ルールベース,オントロジー,セマンティックウェブ,知識グラフ…

42019/9/20 セマンティック技術

Page 5: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

2019/9/20 5

オントロジー工学

◼ オントロジー(Ontology)

◼ 哲学用語:「存在論」

◼ 人工知能分野:「概念化の明示的記述」 [Gruber 1993]

◼ オントロジー工学(1992-)

◼ “対象世界をどのように捉えるか?”を計算機と人間が共有できる形で明確化・体系化する,理論・手法を研究する分野 [オントロジー工学:溝口理一郎,2005]

対象世界<item rdf:about="http://www.kanzaki.com/bass/">

<title>コントラバスの話</title>

<link>http://www.kanzaki.com/bass/</link>

<description>

コントラバスに関する基礎知識、エッセイなどを集めた楽しくてためになるセクション</description>

</item>

<channel rdf:about="http://www.kanzaki.com/info/rss.rdf">

…省略…

<items> <rdf:Seq>

<rdf:li rdf:resource="http://www.kanzaki.com/bass/"/>

…省略…</rdf:Seq></items> </channel>

オントロジー

知識知識記述

概念化

An explicit specification of conceptualization

AI/知識システムに「意味処理」の基盤を与える

Page 6: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

オントロジー構築利用環境「法造」

◼ オントロジー工学の基礎理論に基づいて開発された,オントロジー(=法)の構築(=造)および利用を支援するソフトウェア

◼ 1996年より開発

◼ http://www.hozo.jpにてフリーソフトウェアとして公開

◼ 登録ユーザ数:約5,000

◼ ダウンロード数:約12,000(共に,国内外含む)

◼ 研究室内外のオントロジー開発プロジェクトでの多数の利用実績あり

2019/9/20 6

法造の画面例

Page 7: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

プレゼミ内容①(予定)オントロジー構築演習

◼ 課題内容

◼ 「法造」の使い方を勉強して,各自で設定した内容に関するオントロジーを構築する.

◼ 構築したオントロジーの例

◼ 楽器

◼ コーヒー

◼ 軍事作戦

◼ 戦車

◼ 酒(アルコール飲料)

◼ 鉄道

2019/9/20 7

デモ:説明担当の学生さんが構築したオントロジーの紹介

Page 8: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

知識グラフ(ナレッジグラフ)

◼ 知識グラフとは

◼ さまざまな「知識」の関係(つながり)をグラフ構造で表したもの.

◼ 知的システム開発の基盤となるデータベース(知識ベース)として用いられる.

◼ 知識グラフの例

◼ Linked Data(2007-)

◼ Web技術に基づいて公開された知識グラフ

◼ Google Knowledge Graph(2012-):説明動画

2019/9/20 8

Page 9: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

LOD(Linked Open Data)◼ Linked Data

◼ Webの仕組みを用いてデータを“リンク”することにより,「データの新たな価値の創出」をめざした技術

◼ LOD(Linked Open Data)◼ オープンデータ(誰でも自由に利用可能なデータ)を

Linked Dataとして公開したもの.

◼ この10年で多くのLODが公開されている

2019/9/20 9Linking Open Data cloud diagram,http://lod-cloud.net/

2007/5 12データセット 2017/2 1,139データセット

Page 10: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

LODの例:Wikidata(ウィキデータ)

2019/9/20 10

• ウィキメディア財団が運営するWikipediaの「データ版」

• 誰でも編集可能なフリーな知識ベース• すべてのWikipediaの記事とリンク

Page 11: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

Wikipedia-Wikidataのリンク

2019/9/20 11

Wikipediaでの「大阪電気通信大学」の記事

Wikidataでの「大阪電気通信大学」のデータ

Wikipediaの各記事からWikidataのデータへのリンク

Page 12: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

プレゼミ内容②(予定)SPARQL演習

◼ 課題内容

◼ LOD(知識グラフ)を検索するためのクエリ言語SPARQLの使い方を練習する.

◼ 作成したSPARQLクエリの例◼ Wikidataを使って鉄道会社ごとの総路線長をランキングしてみるhttps://qiita.com/RK-miha/items/6d94f425871c4e9f5f73

◼ 日本の声優さんの一覧と、その出身校のリストhttps://w.wiki/4MZ

◼ 声優の出身校別ランキング https://w.wiki/4ZC

◼ アニメ制作会社の本部所在地 https://w.wiki/4h3

2019/9/20 12

Page 13: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

卒業研究のテーマ例

◼ ホームズのような推理ができるAIシステムの開発

◼知識グラフを用いたQAシステム

2019/9/20 13

Page 14: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

ホームズのような推理ができるAIシステムの開発

2019/9/20 14

「ホームズ」の小説 「知識グラフ」としてデータ化

犯人はXX!なぜなら…

動機は…

トリックは…

捜査手法

動機DB

….

さまざまな「知識」を用いて犯人を推理しその理由を説明するAIシステムの開発

ナレッジグラフ推論チャレンジ

シャーロック・ホームズのような“推理”(推論)ができるAIシステムの開発を目指した技術コンテスト

可視化

Page 15: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

プレゼミ内容③(予定)セマンティック技術の利用

◼ 課題内容

◼ オントロジー,LOD(知識グラフ)/SPARQLなどを含めた,セマンティック技術を利用した(簡単な)プログラム開発を行う.

◼ ナレッジグラフ推論チャレンジが提供している推理小説の「知識グラフ」を例題とすることも検討中.

◼ 良いものができたら「推論チャレンジ」に応募する?

◼ 使用するプログラミング言語は,Java,もしくは,Java Script を想定

2019/9/20 15

Page 16: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

卒業研究テーマ例知識グラフを用いたQAシステム

2019/9/20 16

ウィキデータを用いた「なんでもQA」システム

ウィキデータウィキデータのように「知識」をみんなで編集できる知識ベース

「天気の子」の監督は?

「新海誠」です

日本で一番高いビルは?

「あべのハルカス」です

DEMO

Page 17: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

知識グラフを用いたQAシステム

2019/9/20 17

デモ https://www.osakac.ac.jp/labs/kozaki/KG.html

Page 18: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

2019年度の卒業研究テーマ

◼ ホームズのような推理ができるAIシステム

◼ 登場人物に関する情報の推論手法の開発

◼ ウィキデータを用いた「なんでもQA」システム

◼ 質問文とウィキデータのマッピング技術の開発

◼ 知識グラフ構築プロセスの支援ツールの開発

◼ 知識グラフ(ウィキデータ)の可視化手法

◼ 高分子材料オントロジーの構築

◼ オントロジーに基づく地域課題の検索支援システムの開発

2019/9/20 18

Page 19: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

まとめ

◼ 古崎研の研究テーマ

◼ オントロジー工学とLOD(Linked Open Data)・知識グラフを基盤としたセマンティック(意味処理)技術によるAIシステムの開発

◼ プレゼミ/研究室で学ぶ技術

◼ オントロジーの構築・利用

◼ →「法造」を使ったオントロジー構築演習

◼ 知識グラフ(LOD)の構築・検索

◼ →SPARQLによる検索演習

◼ これららの技術を用いたシステム開発

◼ →簡単なプログラム開発の演習

2019/9/20 19

Page 20: 古崎研究室の紹介古崎研で扱う基盤技術 セマンティック技術 オントロジー工学 知識グラフ(ナレッジグラフ) ・LOD(Linked Open Data)

古崎研のWebサイト

◼ https://www.osakac.ac.jp/labs/kozaki/

2019/9/20 20