19
生物学辞書のLinked Open Data化 とその応用 加藤 文彦,南 佳孝,神保 宇嗣,川本 祥子,武田 英明 (共)情報・システム研究機構 第48回人工知能学会 分子生物情報研究会, 2012/03/23

生物学辞書のLinked Open Data化とその応用

Embed Size (px)

DESCRIPTION

2012/03/23 第48回 SIG-MBI

Citation preview

Page 1: 生物学辞書のLinked Open Data化とその応用

生物学辞書のLinked Open Data化とその応用

加藤 文彦,南 佳孝,神保 宇嗣,川本 祥子,武田 英明(共)情報・システム研究機構

第48回人工知能学会 分子生物情報研究会, 2012/03/23

Page 2: 生物学辞書のLinked Open Data化とその応用

背景

•LODAC Project

•学術LOD基盤構築•論文, 研究者, 美術品, 標本, 図鑑, ...•生物学分野にも結び付けたい

Page 3: 生物学辞書のLinked Open Data化とその応用

Photo of Papilio xuthus: 北九州市立自然史・歴史博物館

Papilio xuthus

標本種の同定

採集者

採集場所

命名文献

言及

著者

シーケンス

著者

Page 4: 生物学辞書のLinked Open Data化とその応用

種標本データ 外部情報

LOD Cloud

Page 5: 生物学辞書のLinked Open Data化とその応用

生物種の問題

種名・分類体系の名寄せ問題

ある生物種に関する資料やデータを収集

• 表記揺れ: Papilio xuthus, P. xuthus, ...• 種名の変更: 分類学的研究の発展に伴う学名や分類体系の変更 和名のほうが安定している場合も

• 種名や分類体系が一義的でない: 複数の分類体系,複数の和名・英名,…

Page 6: 生物学辞書のLinked Open Data化とその応用

要件

• LODで使用する•リンクしやすくしたい•様々な種名・分類体系を扱いたい

名称典拠を作成するだけでは不十分

Page 7: 生物学辞書のLinked Open Data化とその応用

アプローチ•種名・分類体系のグラフ•緩やかに関係を辿れるように•リンクのルーティング

ナミアゲハ

Papilio xuthusLinnaeus, 1767

Chinese Swallowtail

Papilio

Papilio xuthus

in

out

Page 8: 生物学辞書のLinked Open Data化とその応用

和名・学名リスト•図鑑等の文献•生物学辞書•生物標本情報•国立科学博物館サイエンス・ミュージアムネット,生物学辞書

•専門家が管理しているリスト•日本昆虫学会 日本産蝶類和名学名便覧

Page 9: 生物学辞書のLinked Open Data化とその応用

LODAC BDLS

生物学辞書 http://lifesciencedb.jp/bdls/100近くの出典元から集めた種名・用語の辞書

種名: 和名と学名用語: 日本語と英語種名や用語の関係を抽出した出典元を明記

種名や用語の関係をグラフに

Page 10: 生物学辞書のLinked Open Data化とその応用

データモデル

Page 11: 生物学辞書のLinked Open Data化とその応用

6,366,545トリプル

Page 12: 生物学辞書のLinked Open Data化とその応用
Page 13: 生物学辞書のLinked Open Data化とその応用
Page 14: 生物学辞書のLinked Open Data化とその応用
Page 15: 生物学辞書のLinked Open Data化とその応用
Page 16: 生物学辞書のLinked Open Data化とその応用
Page 17: 生物学辞書のLinked Open Data化とその応用
Page 18: 生物学辞書のLinked Open Data化とその応用

Future Work• データの整備• 生物学辞書自体とLODAC BDLS• 専門家の種名データとの関係• LODAC Species• リンク or 統合• 学術データから/へのリンク• CiNii, LODAC Museum, PubMed, DOI,...

Page 19: 生物学辞書のLinked Open Data化とその応用

まとめ

•生物学辞書のLOD化•種名の名寄せに貢献•種名を学術と科学のハブに