24
クラウドソーシングによる 文献情報メタデータ整備の可能性 Discussions on metadata refinement by crowdsourcing 清田陽司(Yoji Kiyota)* + 日向野達郎(Tatsuro Higano)* 中村早紀(Saki Nakamura)* 増田英孝(Hidetaka Masuda)* 山田剛一(Koichi Yamada)* *東京電機大学 (Tokyo Denki University) + 株式会社ネクスト (NEXT Co., Ltd.) 201391Code4Lib Conference JAPAN 2013 @宮城県本吉郡南三陸町 「南三陸プラザ」

クラウドソーシングによる文献情報メタデータ整備の可能性 / Discussions on metadata refinement by crowd souring

Embed Size (px)

DESCRIPTION

Code4Lib JAPANカンファレンス2013@南三陸にて発表

Citation preview

クラウドソーシングによる  文献情報メタデータ整備の可能性  Discussions  on  metadata  refinement  

by  crowdsourcing

清田陽司(Yoji  Kiyota)*+  日向野達郎(Tatsuro  Higano)*  中村早紀(Saki  Nakamura)* 増田英孝(Hidetaka  Masuda)*  

山田剛一(Koichi  Yamada)*  *東京電機大学  (Tokyo  Denki  University)  

+株式会社ネクスト  (NEXT  Co.,  Ltd.)  

2013年9月1日  Code4Lib  Conference  JAPAN  2013  @宮城県本吉郡南三陸町 「南三陸プラザ」  

hTps://www.facebook.com/MiningExploraZon

研究者にとってのサーベイ手段

•  パッケージ媒体(レファ本、専門書)  •  論文、研究報告  •  ふだんの活動の場(キャンパスなど)  •  リアルイベント(学会主催の会議、研究会)  •  ソーシャルネットワーク

ヒトを手がかりとした文献情報の入手

•  直接のコンタクト  •  研究者ホームページ  •  業績データベース  •  論文検索サービス

著者レコード整備にまつわる諸問題

•  コストと品質のトレードオフ  – 人手での整備か機械的処理か?  

•  名寄せ問題  – 同姓同名  – 組織の移動  – 改姓  

•  グローバルなIDの不在  – 日本であれば科研費の研究者番号などがあるが…  

•  組織どうしの連携の難しさ  – 整備のエフォートが共有されない  

ゆるふわメタデータ?

•  各々の機関が管理しているメタデータは気軽に編集できない  

•  気づいた人が編集・訂正できるメタデータってあり?  – Wikipediaみたいに  

NDL NII

JST 民間  MARC

公共図書館 大学図書館

各種研究機関 出版社

Web

サーチエンジン

オンライン書店  (Amazonなど)

Wikipedia 連携Wiki

誰が編集する?

•  Wikipediaと同じ動機づけはうまくいかなそう  •  知らない人については判断が難しいだろう    親しい人にフィードバックしてもらう仕組みを作れないか?  •  知り合いに関するメタデータをきれいにすることなら、インセンティブはあるだろう  

•  知り合いの研究かどうかは容易に判断できるだろう

14

著者同定タスクの クラウドソーシング

15

氏名 : 著者A

学歴 : ○○高校    

 ☓☓大学

職歴 : ☓☓大学    

 △△株式会社

氏名 : 著者A  所属機関:☓☓大学  論文名 : 論文1

氏名 : 著者A  所属機関:☓☓大学  

  □□学部  論文名 : 論文1

     比較

ユーザ

情報取得

判別

Facebookのメタデータ

16

Facebookから取得するメタデータ    氏名・学歴・職歴

CiNiiのメタデータ

17

CiNiiから取得する  メタデータ    氏名・所属機関・論文名

何を作ればできる?

•  Facebookアプリ  – FB上の友達の名前でCiNii著者レコードを検索し、リスト表示  

– 自分が知っている著者レコードを選んでもらい、情報をバックエンドに送信  

– 友達の新着論文を表示  

•  バックエンド(Web  API)  – FBレコードと著者レコードを対応づけるDB  – DBの編集機能

デモ 1/3

友人一覧取得結果

デモ 2/3

Facebookから取得した詳細情報

CiNii著者検索から取得した結果

デモ 3/3

検討すべき課題

•  本人の意思と関係なく紐付けがなされることへの抵抗はないか?  – 研究者の情報発信は実名でなされるべき  – FaceBookは実名主義  – 紐付けを可とするかどうかは別の問題をはらむ  

•  間違った紐付けがされた場合はどうする?  – 自分の研究業績が他人のものに見られてしまう可能性

ベストエフォート・メタデータの  存立可能性

•  「間違いもありうるが、多くの場合は役に立つ」というメタデータは存在できるのか?  – 現行の提供形態は無謬性が前提  – Webではむしろベストエフォートが主流  

•  ベストエフォートであることがユーザーに伝わるデザインが必要だろう  

みんなのメタデータへ

•  メタデータ基盤を維持していくためには、だれもが「我が事」だと感じられる仕組みが必要  

•  メタデータ編集への心理的ハードルを下げるための工夫  – 動機づけ  – タスクを細分化する仕組み