Upload
hayahiko-ozono
View
52
Download
1
Embed Size (px)
Citation preview
オープンサイエンスの最新情報
メタデータの相互運用性を中心に
平成 2 8 年 6 月 14 日 第 12 回学術ソリューションセミナー
「 The Age of Discovery : コペルニクス的転回を超えた学術情報の新たな波」
機関リポジトリ推進委員会 ワーキンググループ協力員
岡山大学附属図書館 大園隼彦
1
本日の内容
• オープンサイエンスとは
研究データ管理と研究成果のパブリックアクセス
• オープンサイエンスとメタデータ
1. junii2 をカスタマイズして研究データに DOI を
2. junii2 をよりリッチに
公的資金のオープンアクセスの実施状況を捕捉する
3. さらに相互運用性を考える
各種 ID や統制語彙を利用して関係性を充実させる
2
オープンサイエンスとは
公的研究資金を用いた研究成果(論文、生産された研究データ
等)について、 科学界はもとより産業界及び社会一般から広く容
易なアクセス・利用を可能にし、知の創出に新たな道を開くとと
もに、効果的に科学技術研究を推進することで、イノベーション
の創出につなげることを目指した新たなサイエンス
3
内閣府『我が国におけるオープンサイエンス推進のあり方について~ サイエンスの新たな飛躍の時代の幕開け~』( 2015 年 3 月 30 日) http://www8.cao.go.jp/cstp/sonota/openscience/
加速する OA 義務化の動き
4
http://roarmap.eprints.org/view/country/un=5Fgeoscheme.html
海外の助成機関のポリシー
5
http://www.dcc.ac.uk/resources/policy-and-legal/overview-funders-data-policies
https://figshare.com/articles/Overview_of_OSTP_Responses/1367165
★ 公的資金を受けた進めた研究は、論文もデータも公開する方向で進んでいる
英国 米国
国内のポリシー等の状況
• 文献
京都大学(2015年4月28日)
筑波大学(2015年11月19日)
国際日本文化研究センター(2015年12月17日)
九州大学(2016年1月19日)
徳島大学(2016年1月19日)
東京歯科大学(2016年4月12日)
名古屋大学(2016年4月19日)• 研究データ
京都大学 (2016年7月30日)
:研究データ保存サービスの試行
6
大学(図書館)への期待
論文のオープンアクセス( OA ) 機関リポジトリをグリーン OA の基盤として拡充する OA に係る方針を作成する 研究データ管理 研究データ管理計画の作成支援 NII と連携して基盤整備(アカデミッククラウド)を進める 研究成果の散逸防止 論文・研究データの管理に係る規則を定める 論文・研究データに DOI を付与 人材育成 技術職員・ URA 及び大学図書館職員等を中心としたデータ 管理体制を構築
7
学術情報委員会「学術情報のオープン化の推進について(審議まとめ)」よりhttp://www.mext.go.jp/b_menu/shingi/gijyutu/gijyutu4/036/houkoku/1368803.htm
大学図書館への期待
“特に大学図書館には、機関リポジトリの構築を進
めてきた経験等から、研究成果の利活用促進に積
極
的な役割を果たすことが期待される。”
8
学術情報委員会「学術情報のオープン化の推進について(審議まとめ)」よりhttp://www.mext.go.jp/b_menu/shingi/gijyutu/gijyutu4/036/houkoku/1368803.htm
機関リポジトリ推進協会
9
オープンサイエンスにおけるメタデータの検討
研究データに DOI を付与
研究データのメタデータと DOI 付与
オープンアクセスの実施状況を把握する
公的資金のオープンアクセス状況と利用条件がわかるように
コンテンツに加えて関連情報に識別子を付与する
「どこの誰がどの予算でどのような成果を作り出したか」が容
易かつ正確に把握できるように
10
ステップ1
junii2 をカスタマイズして研究データに DOI を
(昨年度までの IR 推進委員会での検討事項)
11
研究データのメタデータ
• 研究分野ごとに様々なメタデータスキーマが存在
• 最初から様々なメタデータに対応することは難しい
• まずは特定の分野に依存しない一般的なメタデータから
• 加えて、研究データに DOI を付与できるように
12
http://www.dcc.ac.uk/resources/metadata-standards
研究データに DOI を付与するには
• IRDB経由で JapanLinkCenterに
研究データのメタデータを提出
• 必要なメタデータ項目は?• 現在の junii2 で対応可能か?
13
“IRDB (JAIRO) データ提供機関のための DOI 管理・メタデータ入力ガイドライン”http://www.nii.ac.jp/irp/archive/system/pdf/JaLC_guideline_ver2.0.pdf
必須項目
• JaLC のメタデータは DataCite に準拠• DateCite の主目的は引用、必須項目は引用に必要な項目中心
• この項目だけで良いなら、現 junii2 でも対応可能
14
JaLC DataCite
DOI (+ URL ) Identifier
title Title
creator (first_name) Creator
publication_date PublicationYear
publisher Publisher
オプションメタデータ( DataCite)
• データに関する記述を充実さ せて、検索性・アクセス性・ 相互運用性を高める。
• 注目すべき項目として ファンド情報 著者等の所属情報 データに関わる属性情報 位置情報 バージョン情報
15
“DataCite Metadata Schema for the Publication and Citation of Research Data”https://schema.datacite.org/meta/kernel-3/doc/DataCite-MetadataKernel_v3.1.pdf
○ ファンド情報
※ DataCite ではファンドを contributor (寄与者)の一つとして捉えている。 ※ junii2 はファンドのための項目を追加する必要がある。
○ 作成者レベルで研究助成の成果を収集できるように
メタデータの充実化
項 目 JaLC DataCite
助成機関名 funder_name contributorType=“Funder”contributorName
助成機関 IDfunder_identifiertype
nameIdentifiernameIdentifierSchemaschemaURI
助成番号 award_number
16
○ ファンド情報の入力例
※ 一部項目を簡略化
科研費の場合 助成団体名 = JSPS ( or MEXT? ) 助成団体 URI = 10.13039/501100001691 助成番号 = 12345678(8桁の課題番号) 研究種目は不要?
JaLC
<fund> <funder_name lang=“ 言語” > 助成団体名 </funder_name> <funder_identifier type=“FundRef”> 助成団体 URI</funder_identifier> <award_number> 助成番号 </award_number></fund>
DataCite
<contributor contributorType=“Funder”> <conrtibutorName> 助成団体名 </contributorName> <nameIdentifier schemaURI=“ スキーマ URI” nameIdentifierSchema=“ スキーマ名” > 助成 URI</nameIdentifier></contributor>
17
○ 所属情報
○ 所属情報の入力例
※一部項目を簡略化 ※ junii2 では所属のための項目を追加する必要がある
項 目 JaLC DataCite所属機関名 affiliation_name affiliation
JaLC
<creator> <names> <last_name>姓 </last_name><first_name> 名 </first_name></names> <affiliation> <affiliation_name>所属機関名 </affiliation_name></affiliation> <researcher_id><id_code type=“ 種類” >著者ID </id_code></researcher_id></creator>
DataCite
<creator> <creatorName>姓 , 名 </creatorName> <nameIdentifier schemaURI=“ スキーマURI” nameIdentifierSchema=“ スキーマ名” >著者ID </nameIdentifier> <affiliation>所属機関名 </affiliation></creator>
18
属性の追加
20
属性 DataCite
contributor type ・ DataCollecor ・ DataCurator ・ DataManager
date type
・ Available ・ Collected ・ Created ・ Issued
resource_type
・ AudioVisual ・ Sound ・ Dataset ・ Text ・ Image ・ Software ※ それぞれ主なものをピックアップ
○ junii2 では寄与者や日付の属性を細かく指定できない。 NIItype は” Data or Dataset” と大まかに指定。
( JaLC 研究データ対応) junii2修正の主なポイント
研究データに DOI を付与し、発見性を高めるには既存の項目の修正、
新しい項目の追加が必要になる。
21
- ファンド情報 ( ID ) <fund> 追加 (or 修正 )
- 寄与者の役割 <contributor type> 追加- 寄与者(著者)の所属 <contributor affiliation> 追加- データの遷移に関る日付 <date type> 追加- データ種類の細かい指定 <NIItype> 修正- データの空間的範囲 <spatial> 修正- データのバージョン管理 <version> 追加「誰が(著者 ID )どこの予算で(助成 ID )どのような成果( DOI )を作ったか」
がわかる。
ステップ2
junii2 の項目をよりリッチに
パブリックアクセスの状況を把握できるように
- 海外のメタデータスキーマを参考に -
22
All scientific articles in Europe must be freely accessible as of 2020. EU member states want to achieve optimal reuse of research data. They are also looking into a European visa for foreign start-up founders. And, according to the new Innovation Principle, new European legislation must take account of its impact on innovation. These are the main outcomes of the meeting of the Competitiveness Council in Brussels on 27 May.
23
http://english.eu2016.nl/documents/press-releases/2016/05/27/all-european-scientific-articles-to-be-freely-accessible-by-2020
OpenAIRE ( Open Access Infrastructure for Research in Europe)
24
Horizon2020 :
ヨーロッパの公的資金を受けた研究プロジェクト
の成果を OA にすることを求める
OpenAIRE : ヨーロッパの OA 実現をサポートするプロジェク
トリポジトリ等からメタデータを収集し、 OA ポ
リシーの実施状況をモニタリング
https://www.openaire.eu/guidelines-update-for-repository-managers
OpenAIRE Guidelines
• ローカルのリポジトリシステムのメタデータを OpenAIRE のメタデー
タ要件に対応させるためのガイドライン
• 特徴 文献リポジトリ、データリポジトリ、ー CRIS の 3 種類 対象コンテンツはー 文献 : OA 文献 or 研究助成成果の文献 データ:研究助成成果のデータ、上記の文献の関連データ
• 多くのヨーロッパの助成成果を OpenaAIRE Portalで利用できるように
25
OpenAIRE メタデータ項目(データリポジトリ用)Identifier (M) ResourceType ( R )Creator ( M ) AlternateIdentifier ( O )Title ( M ) RelatedIdentifier ( MA )Publisher ( M ) Size ( O )PublisherYear ( M ) Format ( O )Subject ( R ) Version ( O )Contributor ( MA ) Rights ( MA )Date ( M ) Description ( MA )Language ( R ) GeoLocation ( O )
26
DataCite メタデータスキーマ 3.1 に準拠 ・赤字部分は DataCite と定義が異なる。
ファンド情報と OA 状況のモニタリング
• ファンド情報 : Conrtibutor に記述。
<contributor contributorType=“Funder”> <contributorName>European Commission</contributorName> <nameIdentifier nameIdentifierSchema=“info”> info:eu-repo/grantAgreement/EC/FP7/282896 </nameIdentifier> </contributor>
27
Fund nameIdentifier の記述方法
• nameIdentifier の記述
info:eure-repo/grantAgreement/Funder/FundingProgram/
ProjectID / [jurisdiction] / [ProjectName] / [ProjectAcronym]
省略例: info:eu-repo/grantAgreement/EC/EP7/283959/EU//OpenAIREPlus科研費を記述したら
/JSPS/KAKENHI/12345678/MEXT/ 研究種目?
28
必須 省略可Funder : 助成機関名 Jurisdiction :所管主体FundingProgram :助成プログラム名
ProjectName :プロジェクト名ProjectID :助成番号 ProjectAcronym :プロジェクト
略称
ファンド情報と OA 状況のモニタリング
• コンテンツのアクセス、ライセンスに関する情報
<rights rightsURI=“info:eu-repo/semantics/openAccess” /><rights rightsURI=“http://creativecommons.org/licenses/by-sa/4.0/”> Creatuve Commons Attribution 4.0 International</rights>
29
アクセス情報
ライセンス情報
rights の記述方法
• アクセス情報の URI
• ライセンス情報: Creative Commons のライセンス情報を URI と
• OA 状況と利用条件が把握できる
date と組み合わせることで、より詳細な指定が可能
30
1. eu-repo/semantics/closedAccess クローズド2. eu-repo/semantics/embargoedAccess エンバーゴあり3. eu-repo/semantics/restrictedAccess アクセス制限あ
り4. eu-repo/semantics/opnAccess オープンアクセ
ス
ファンド情報と OA 状況のモニタリング
• 各種日付に関する情報
<date dateType=“Accepted”>2011-12-01</date> <date dateType=“Available”>2012-12-01</date>
• その他の日付タイプ
Copyrighted, Collected, Issued, Submitted, Updated, Valid
31
エンバーゴ開始
エンバーゴ終了
RIOXX• 英国( RCUK 、 HEFCE )の OA ポリシーに準拠するためのメタ
データスキーマ
• プロジェクトと助成情報の捕捉が目的
• OA ポリシーの実施状況をモニタリング
• 現時点では“出版物“がターゲット
32
http://www.rioxx.net/
RIOXX メタデータ項目
33
必須項目 オプション項目ali:license_ref ali:free_to_read
dc:identifier dc:coverage
dc:language dc:description
dc:title dc:format
dcterms:dataAccepted dc:publisher
rioxxterms:author dc:relation
rioxxterms:project dc:source
rioxxterms:type dc:subject
rioxxterms:version rioxxterms:apc
rioxxterms:contributor
rioxxterms:publication_date
rioxxterms:verion_of_record
ファンド情報と OA 状況のモニタリング
助成機関、プロジェクトに関する情報
<rioxxterms:project funder_name= "Engineering and Physical Sciences Research Council“ funder_id="http://dx.doi.org/10.13039/501100000266"> EP/K023195/1 </rioxxterms:project> 複数の助成機関やプロジェクト IDがある場合、複数の項目に
科研費を記述したら
<project funder_name=“Japan Society for the Promotion of Science” funder_id=“http://10.13039/501100001691”> KAKENHI/12345678 </project>
34
Funder_id : 助成機関の国際的に一意な ID
ISNI or DOI ( FundRef )推奨
Funder_name : 助成機関の正式な名称
ファンド情報と OA 状況のモニタリング
• アクセス情報
<ali:free_to_read start_date=“2013-03-28” end_date=“2014-04-30”>
• フリーでアクセスできる期間(アクセスのみ、利用条件は示さない)
• プロパティの属性がどちらも空値 : 永続的にアクセス可能
35
ファンド情報と OA 状況のモニタリング
• ライセンス情報
<ali:license_ref start_date=“2015-02-17”> http://creativecommons.org/licenses/by/4.0 <ali:license_ref>• 複数のプロパティがある場合、最も最新のものが有効。
例) <license_ref start_date=“2014-02-03”> http://www.psychoceramics.org/license_v1.html <license_ref> <license_ref start_date=“2015-02-03”> http://creativecommons.org/licenses/by/4.0 <license_ref>
36
2015/02/17 以降に” CC by” で利用可能
1年でライセンスが変化(エンバーゴが 1 年間)
OpenAIRE • Contributor に助成情報を
• Rights にアクセス情報とライセンス情報を
• Date にエンバーゴに関する情報を
RIOXX• Project に助成情報を
• free_to_read にアクセス(エンバーゴ)情報を
• License_ref にライセンス(エンバーゴ)情報を
公的資金を受けた研究成果のオープンアクセス状態を捕捉することが可能に。
38
THOR プロジェクト
• Technical and Human Infrastructure for Open Research• 目的 : 研究ライフサイクルを通して、論文、データ、研究者
の間をシームレスに統合
各永続 ID を統合する方法を探る
• 取組 : ORCID と DataCite における寄与者、成果物、組織の関
係性調査
データセンターにおける永続 ID 付与のワークフロー調査
40
https://project-thor.eu/
公開と保存のワークフローの中でジャーナルとリポジトリで識別子( DOI と ORCID )を交換する仕組み ( ADS と Dryad )
41
それぞれ登録の段階で ORCID を付与し、公開の段階で DOI を付与ワークフローの複数のポイントで、各 ID を相互に参照できる
THOR プロジェクトの提案
• 個人名に対するアプローチを共通化
DataCite :1フィールド ORCID :2フィールド
引用フォーマットを考慮すると2フィールドを推奨• 寄与者に関する語彙の標準化
データの重要性が増加 → 対応する寄与者の語彙が必要
→ 各システムの語彙の共通化 → CRediT • コンテンツ間の関係に関する語彙の標準化
DataCite や CrossRef 等、各システムにそれぞれ関係記述がある
共通の語彙を設け関係性を正確に捕捉 → 成果評価
42
THOR プロジェクトの提案
• 組織 ID の採用 ISNI や FundRef 等の既存の ID の活用が遅れている。 識別子間の連携を促し、組織レベルの情報を収集できるように
• プロジェクトに対する永続 ID 時限プロジェクトが創作の主体となる際の識別子が必要 条件 : 既存のインフラ、利用の障壁なし、他の ID と連携可
43
DataCiteの例) <creatorName> 姓 , 名 </creatorName> <nameIdentifier schemaURI=“ スキーマURI” nameIdentifierSchema=“ スキーマ名” > 著者ID </nameIdentifier> <affiliation> 所属機関名 </affiliation> 組織 ID がない
プロジェクトの識別子( DOI )の例
44
プロジェクトのメタデータ( DOI ) http://dx.doi.org/10.5281/zenodo.30030
組織名に関する課題
著者名と同様に
• 組織名の表記の揺れ
• 組織の粒度の問題(下部組織の識別)
• さらに吸収・合併、分割等で組織名や組織構成が変化するケースもある
組織名の揺れの例
NISTEP 大学・公的機関名辞書
Okayama University Okayama U. Okayama Univ University of Okayama
45
http://www.nistep.go.jp/research/scisip/randd-on-university
部局名まで含めると、さらに揺れが大きい
ISNI の活用
• ISNI ( International Standard Name Identifier ) で識別を期
待
• 創作活動を行う主体(人も組織も)を識別する ID• 特に組織の識別に期待
• 自機関の ID は存在するのか?
http://www.isni.org/
46
ISNI の機関 ID
47
機関 ID の例(岡山大学)
ISNI の活用に関する OCLC の報告書( 2016.4 )
“Addressing the Challenges with Organizational Identifiers and ISNI” • ISNI を利用した組織名の曖昧性を除去する試み
• 研究機関の研究活動を様々なレベルで容易かつ正確に集約可能
• 多くの機関は既に IDが存在しているが、既存の ID を適切に管理することが重要になる
48
2016. Addressing the Challenges with Organizational Identifiers and ISNI. Dublin, Ohio: OCLC Research. http://www.oclc.org/content/dam/research/publications/2016/oclcresearch-organizational-identifiers-and-isni-2016.pdf.
ISNI の主な活用例
1.名前の変遷 日付の情報を持つことで、 複数の名称を区別
2.推奨名の提示 複数の情報源に由来する様々な 名称の推奨名にフラグを付与。
49
ISNI の主な活用例
3.組織階層提示 “ hasUnit”,”isUnitOf” で 階層関係を表現
4.組織の再構成 構成に変更(新規、消滅、吸 収合併等)を記録する 粒度に注意
ISNI の主な活用例
5.研究グループの表現
複数の組織の研究者が所属
6.コンソーシアムの表現
複数の組織で構成
CRediT プロジェクト
• Contributor Roles Taxonomy Project• 背景 : 共著者の数が急増。各共著者の貢献度を把握する必要が出てくる• 目的 : 研究者の役割を表す共有の統制語を作り、研究者の貢献
度に透明性をもたらす • メリット : 研究者の貢献度に正確性と透明性。個々のインパクトの正確な測
定に
52
CRediT の分類
• CASRAI と NISOが14の分類
を定義• 一人に複数の役割を付与可能• 貢献の程度を設定可能
“ leader” “ equal” “ supporting”
53
CRediT の広がり
• Editorial Manager ( オンライン投稿システム ) が CRediT を採用• Cell Press によるサンプル
• Open Badge for author’s contribution
54
http://dx.doi.org/ 10.1186/2047-217X-3-13
55
CRediT
junii3
助成機関研究機関
データ
論文研究者
学術情報流通
mapping
オープンサイエンスにおけるメタデータ
• 識別子、統制語を利用することでメタデータをより詳細に
• 識別子を利用することで、シームレスな連携が可能に
• 容易かつ正確に、様々な粒度で情報を収集することが可能に
• 図書館員は、 ID サービス等の外部サービスの理解を
• 学術情報流通の上流からメタデータを整備できるよう関係者にアウ
トリーチ
56
オープンサイエンスにおけるメタデータ
• オープンアクセスの状況を捕捉するにはすべてのコンテンツを対象
にする必要がある
• これまでの機関リポジトリは主に学術論文を対象に本文があるもの
を蓄積してきた。
• 論文の総数を把握するにはコンテンツの枠を広げるか、他の大きな
システムとの連携を強化する必要がある
• 機関リポジトリは、図書館単独で取組む段階ではなくなりつつある
57