View
483
Download
4
Category
Preview:
DESCRIPTION
情報組織化研究グループ 2014年10月月例会発表資料 国際連合食糧農業機関(FAO)においては、文献データベースAGRISやシソーラスAGROVOCの提供をはじめとする農業関連の科学技術情報の提供を行っており、近年ではLinked Open Data(LOD)を活用した事例も見られる。 本発表においては、FAOによる書誌データのLOD化への勧告、LODE-BD(Linked Open Data(LOD)-enabled bibliographical data)などの事例を紹介するほか、国内の書誌データ、研究データ等との連係の可能性について検討する。
Citation preview
「つながるデータ」へ向けた研究情報の提供:
農業情報を事例として
国際農林水産業研究センター
林賢紀
tzhaya@affrc.go.jp
情報組織化研究グループ 2014年10月月例研究会 2014年10月25日(土)14:30-17:00弁天町ORC200生涯学習センター 第2研修室
私事
• 2014年4月から独立行政法人国際農林水産業研究センター企画調整部情報広報室情報管理科で勤務しています
• 図書館業務全般とWebサイトを担当しています
• 絵に描いたようなワンパーソンライブラリーです
• 引き続きよろしくお願いいたします
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 2
国際農林水産業研究センター?
• 茨城県つくば市と沖縄県石垣市に所在
• 熱帯又は亜熱帯に属する地域その他開発途上地域における農林水産業の研究を包括的に行う研究機関
–国際的な食料・環境問題の解決に向けた農林水産技術の研究開発
–国際的な食料・農林水産業及び農山漁村に関する動向把握のための情報の収集・分析及び提供
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 3
研究成果の例
パパイヤ品種「石垣珊瑚」の
開発
オイルパーム廃棄木からのバイオエタノールの抽出
熱帯アジアのイネの収量を増加する遺伝資源の発見
屋内型エビ生産システムで飼育されたバナメイエビの
おいしさ
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 4
今日の概要
農業情報とLinked Open Data
• LODにするためのツールや勧告を概説
• 主として農学分野を対象としているが、LOD化の手法は他分野でも参考となる
FAO(国際連合食糧農業機関)などにおける取組
• AGRIS
• AGROVOC
• LODE-BD(Linked Open Data (LOD)-Enabled Bibliographical Data)
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 5
AGRIS
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 6
AGRISとは?
農業関連の科学技術情報の共有のための国際的な書誌情報データベース
• 1979年から構築、760万件以上が蓄積
•世界65か国の150以上の機関による共同構築
•日本では農林水産研究情報総合センターから国内文献を年間約7,000件の書誌情報を送信
学術論文のほか、書籍、会議録、学位論文、灰色文献が含まれる
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 7
AGRIS構築のしくみ
A国インプットセンターA国インプットセンター
A国インプットセンター各国のインプットセンター
各国のインプットセンターのデータをFAOで集約、DB構築
自国の農業関連の科学技術情報を収集、目録データを作成
http://agris.fao.org/
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 8
AGRISが目指すもの
各国のインプットセンター
FAOでDBの構築とインプットセ
ンター上の全文、他の関連する情報資源へリンク
インプットセンターで書誌情報と全文を収集、
リポジトリを構築
リポジトリ
GBIF
世界銀行
DBpedia
農業情報へのアクセスを容易にし、特に発展途上国における農業研究へ貢献
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 9
AGRISの検索結果例
該当文献と抄録
GBIF上の遺伝資源情報
IFPRI(国際食料政
策研究所)上の各国概要
Googleによる関連文献
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 10
FAOの役割
ルール整備
• メタデータ語彙(AGRIS Application Profile)
•シソーラス(AGROVOC)
•書誌記述の勧告(LODE-BD)
ツール提供
• AgriMetamaker(小規模なメタデータ作成)
• AgriDrupal(Webサイト構築)
• AgriOceanDspace(リポジトリ構築)
ポータル構築
• AIMS (Agricultural Information Management Standards)
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 11
AGRIS Application Profile
農業情報の標準化のために、FAOがこれまでのAGRISのデータフォーマットを再構成
• Dublin Core (DC)
• Australian Government Locator Service Metadata (AGLS)
• Agricultural Metadata Element Set (AgMES)
標準的な語彙はDublinCore、AGRIS特有の語彙はAgMES(FAOで定義)を使用
過去の資産をできるだけ生かす
http://www.fao.org/docrep/008/ae909e/ae909e00.htm情報組織化研究グループ 2014年10月
月例研究会2014/10/25 12
Mappingの例
• “Appendix B: AGRIS to AGRIS AP mapping”より
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 13
AGROVOC
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 14
AGROVOC
農学分野のシソーラスとして1980年代から運用
• 2009年にLOD化
多言語への対応
•当初は英語、フランス語、スペイン語(国連公用語の一部)
•その後、日本語を含む21言語3.2万ワードまで拡大
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 15
AGROVOCからつながるデータ
LCSH
NAL Thesaurus
DDC
DBpedia
GeoNamesGeopolicalOntology
AGROVOC
http://aims.fao.org/standards/agrovoc/linked-open-dataを元に作成情報組織化研究グループ 2014年10月
月例研究会2014/10/25 16
2014/10/25情報組織化研究グループ 2014年10月
月例研究会17
NHK. NHK連続テレビ小説「マッサン」http://www.nhk.or.jp/massan/ 背景画像より(accessed 2014-10-24)
https://twitter.com/Dominique_Domon/status/517307378488709120
AGROVOCのリンクの例
2014/10/25情報組織化研究グループ 2014年10月
月例研究会18
「オオムギ」で検索してみた
2014/10/25情報組織化研究グループ 2014年10月
月例研究会19
http://aims.fao.org/standards/agrovoc/functionalities/search
HTMLでの表示例
2014/10/25情報組織化研究グループ 2014年10月
月例研究会20
http://aims.fao.org/aos/agrovoc/c_823.html
上位語、下位語、多言語の表現
2014/10/25情報組織化研究グループ 2014年10月
月例研究会21
AV:c_1474
穀物@ja
Cereals@en
skosxl:prefLabel
AV:c_823
オオムギ@ja
Barley@en
skosxl:prefLabel
AV: c_25485
麦芽用大麦@ja
Malting barley@en
skosxl:prefLabel
skos:narrower
skos:broader
SKOSによるAGROVOCの表現例
下位
トウモロコシ
デントコーン
異名
http://aims.fao.org/standards/agrovoc/concept-schemeより情報組織化研究グループ 2014年10月月例研究会
2014/10/25 22
入力ツール
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 23
様々なツールを提供
AGRIMetamaker
• AGRISへのデータ搭載用のメタデータ作成ツール
• FAOがホスティング
AgriOcean Dspace
• 機関リポジトリ構築ツール
• DspaceをFAOとUNESCO-IOC/IODEでカスタマイ
AgriDrupal
• CMS(Contents Management System)
• DrupalにRDFやAGROVOC対応のモジュールを付与
2014/10/25情報組織化研究グループ 2014年10月
月例研究会24
いずれもメタデータにはAGRIS AP、統制語彙としてAGROVOCが容易に付与できるようカスタマイズされている
ツールの例:AgriDrupal
• FAO,CGIAR(国際農業研究協議グループ)等が開発・パッケージングしたDrupalの拡張モジュール
• Drupalのコアモジュールに加えてインストールするだけで使用可能
• 農学分野のコミュニティにおける基礎的な情報交換用のプラットフォームとして開発– 標準的なメタデータと統制語彙(AGROVOCなど)の採用– 文献データベース AGRIS の入力とFAOへのデータ送信ツールとして使用できる
• CMSであるDrupalでのWebサイト管理と,文献情報,ニュース,求人,会議などの情報の組織化,管理,発信ツールとして利用できる
• ダウンロード: http://aims.fao.org/tools/agridrupal• 参考:AgriDrupal: general presentation
http://www.slideshare.net/valeriap/agridrupal-general-presentation
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 25
図書の入力例(1)
• Drupal標準の入力画面
• 資料種別、タイトルとタイトル言語を入力
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 26
図書の入力例(2)
• 著者、出版事項などを入力
• 著者はシステム内の典拠データを参照あるいは作成してリンク
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 27
図書の入力例(3)• AGROVOCのキーワード(自動検索)とAGRIS
Subject Category code(分野コード)を入力
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 28
Webで見る
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 29
RDF的に見る
http://192.168.50.129/agridrupal/node/47135
「沖縄シマ豆腐」物語dcterm:title
Subject Property Object
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 30
LODE-BE
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 31
LODE-BDとは
• Linked Open Data (LOD)-Enabled Bibliographical Data
• LODE-BD Recommendations 2.0として公開• http://aims.fao.org/lode/bd
• 共有可能な書誌データ作成に適したLODによる符号化を支援
• 冊子体、電子媒体、論文、報告書など書誌情報の記述に適用
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 32
LODE-BD Recommendationsの構成
•問題意識、この文書の目的、LODE-BDの原則概要
•議論の対象、メタデータ語彙の概要General
Recommendations
• フローチャートによる語彙やプロパティの判断手法Decision Trees
•今後の展開、参考文献References
•用語説明、schema.orgとのクロスウォークなどAppendixes
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 33
問題意識
書誌データをLODとして公開するためには、どのようなメタデータ基準に準拠すればよいか
データを共有するために書誌データセットに組み込む最低限のプロパティは何か
書誌データの作成に直接利用できるメタデータモデルやアプリケーションプロファイルはあるか
これまで使用してきた統制語彙がLinked Dataで利用できる場合、どのような値で概念を交換すればよいか
Linked Dataのデータセットに移行するためには、どのようにデータを符号化すればよいか
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 34
LODE-BD Recommendationsの原則
1. 既定のメタデータ基準やLODで用いられる語彙の利用を促進
2. 典拠データ、統制語彙の適用
3. 可能であれば資源のURIをデータ値として適用
4. データ交換や再利用が可能な符号化のための選択プロセスを簡易化
5. Linked Dataコミュニティのニーズから発生した、新たなプロパティやメタデータ語彙へのリファレンスの提供
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 35
議論の対象
1. 書誌情報の記述やアクセスに関する実態、関係
– 3つの実体をベースとする簡易なモデルを使用
Resource
• 論文など実体
Agent
• コンテンツの作成などに責任を持つ主体
Thema
• 記事の主題や論題
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 36
議論の対象
2. 検討すべきプロパティ
–すでに標準化されているプロパティについて検討し、9つのグループを構築
タイトル 責任表示 物理的特性
配架・位置情報
主題に関する情報
コンテンツの詳細情報
権利情報 利用方法 相互の関係
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 37
議論の対象
3. プロパティに適したメタデータ語彙
–広く利用されているメタデータ語彙を選定
– フローチャートによる決定方法の提示
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 38
タイトル
• 本タイトル、並列タイトル、翻訳タイトルなどの別にプロパティを決定
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 39
責任表示(例は著者)
• 典拠データの有無を判断
• 典拠データがあり、かつLinked Dataである場合はURIで記述
• 寄与者、出版者も同様に判断
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 40
物理的特性(例は識別子)
• ローカル/グローバルのいずれの識別子についても考慮
–値が同じでも共存できるように
• 記述規則にのっとっているか否か
• 識別子の種類を区別するか
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 41
配架・位置情報
• 配架場所、住所などを想定
• 標準的な語彙に準拠しているか否か
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 42
主題に関する情報
• 統制語彙か否か、すでにLinked Dataに
なっているか否かで文字列かURIで表す
かを、またプロパティを選択
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 43
コンテンツの詳細情報
• 目次、要約、注釈など内容の表示とこれらを識別するプロパティを選択
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 44
権利情報
• 権利の主体やライセンスの種類の記述を想定
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 45
利用方法
• 利用対象や教育レベルなどのプロパティを選択
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 46
相互の関係(例はresource間)
• resourceそのもの、
また相互の関係を表すプロパティを選択
• agentについては所属やfounderの記述を想定
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 47
まとめ
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 48
今日のまとめ
• 農業情報提供に関するFAOの取り組みを概観した• シソーラスAGROVOCを介して様々な情報資源とのリンクを実現している– LCSH、DBpediaなど既存のデータセットを介してさらに連携が可能では
• Drupalなど既存のCMSを利用し、構造化された情報の構築環境を提供– AgriDrupalはLODの学習や評価などに利用できるのでは
• LODE-BDのようなLOD化の手法、手段も検討されている– Decision Treesによるプロパティの設定などの手法は汎用性がある
情報組織化研究グループ 2014年10月月例研究会
2014/10/25 49
Recommended