53
e-Research資料庋用: 學術圖書館的新角色 黃乾綱 臺灣大學圖書館系統資訊組 [email protected]

e-Research與 資料庋用: - archives.lib.ntnu.edu.twarchives.lib.ntnu.edu.tw/exhibitions/HwaWeiLee/seminar/pdf/... · 第七章 e-Research 系統之服務與發展 ... 涵蓋研究社群與資料資源之間的

Embed Size (px)

Citation preview

e-Research與 資料庋用: 學術圖書館的新角色

黃乾綱 臺灣大學圖書館系統資訊組 [email protected]

e-Research專書

第一章 導論 /陳雪華

第二章 各國 e-Research 之發展與現況

/陳雪華、黃文樺、何亞真、陳麗純

第三章 臺灣發展研究資料管理政策之芻議 /劉應琳

第四章 學術圖書館與資料庋用 /曾品方

第五章 從研究人員觀點探討資料庋用系統:以地理資訊應用領域為例 /黃文琪、蔣禮芸、秦韻涵

第六章 資料庋用詮釋資料之探析

/林玉、劉京玫

第七章 e-Research 系統之服務與發展 /江玉婷、陳光華、黃乾綱

第八章 結論與建議 /陳光華

2012-12-12

2

National Taiwan University Library

工作同仁

陳雪華, 陳光華, 黃乾綱

劉京玫, 劉應琳, 江玉婷, 黃文琪, 蔣禮芸

曾品方, 秦韻涵, 林玉

黃文樺, 何亞貞, 陳麗純, 鄧雅文, 丁培涵

2012-12-12

3

National Taiwan University Library

大綱

e-Research與資料庋用

發展資料庋用之理由與策略

館員在資料庋用的角色

資料庋用個案與系統

結論與建議

4

2012-12-12 National Taiwan University Library

當今的研究趨勢

資料量遽增

隨著科技進步,研究設備(衛星、感測網等)分秒帶回資料類型的轉變;原生數位(born digital)的資料量遽增。

資料氾濫(data deluge)的時代

跨國與跨界合作研究

跨國或跨界合作引領的研究方向已成為新契機

這些全球合作的科學家或研究人員多來自不同的學科背景,在線上搜尋資料時,往往會在不同的工具與傳輸協定之間感到困惑

2012-12-12 National Taiwan University Library

5

大數據的時代

e-Research

6

2012-12-05 National Taiwan University Library

e-Research的組成

計算能力與網路頻寬

Computer centers, cloud computing providers

資料庋用

Libraries, data centers

作業系統與演算法

Domain experts, computer scientists

2012-12-12

7

National Taiwan University Library

研究資料的規模

研究型資料庫(Research data collections)

一個(或以上)研究計畫的產物

對於資料處理與管理的程度有限

資源/社群型資料庫(Resource or community data collections)

主要在服務特定或單一的研究社群

一般很難預測可以經營或維持多久

參考型資料庫(Reference data collections)

主要目的在於服務大規模學術社群

較佳的管理與營運

2012-12-12 National Taiwan University Library

8

研究資料的存放

依據PARSE.Insight 計畫研究結果

全世界跨領域的1,200名研究者,80%的研究者只存在研究人員自己的電腦

Source: PARSE.Insight consortium. (2010). PARSE.Insight: Science Data Infrastructure Roadmap.

2012-12-12 National Taiwan University Library

9

研究資料的管理現況

未必都有完善保存機制:策略、政策、技術、經費等。

難以整合:部分領域即使各自維護有相關資料庫,未必公開,或都有提供健全的資料描述(identifier、metadata)、利用資料的軟體工具,以及採用與國際接軌的庋藏標準,也因此於整合與開放上增添難度。

缺乏跨資料庫平台:遑論管理與服務人員。

不易取得:相關領域研究人員若要利用公部門經費補助產出的研究資料,非但不易取得,甚至反而必須付費透過營利性的資料庫公司取得。

2012-12-12 National Taiwan University Library

10

資料庋用

11

資料庋用之意義

data curation 或是digital curation

data:資料,原生資料或是研究產出之資料

庋用(curation)源自於拉丁文curare :照料(care for),研究資料如果沒有善加蒐集和照料,就無法提供取得和再次使用(Buneman, Müller &

Rusbridge , 2009)

data curation包括庋藏和使用,故譯為「資料庋用」

資料庋用是針對數位化的研究資料加以維護、保存和加值,建置值得信賴的數位典藏資料庫,以利現在和未來的使用(DCC, 2010)

12

2012-12-12 National Taiwan University Library

e-Research vs. data curation

資料庋用是因應e-Research的發展,著重於保存維護、公開取用大量的資料集,資料庋用之發展與e-Research的興起息息相關

為支援e-Research的發展,除了需要網路基本建設、網格運算等相關技術之外,也需要一套資料庋用的方法,用以評估、蒐集、組織、保存和應用研究資料,俾便資料的再使用,以支援學者驗證或開創研究

13

2012-12-12 National Taiwan University Library

資料庋用vs.數位保存

資料庋用一詞往往包含數位保存、數位典藏的概念,但其實仍有所差別

資料庋用是對於整體學術社群的深層思考,包括研究者、出版者、庋用者、資料管理者以及使用者之間的緊密合作,資料庋用不只是數位保存和數位典藏,更涵蓋研究社群與資料資源之間的密切互動(Beagrie, 2006)

數位保存是資料庋用的一部份,資料庋用除了保存與維護數位資料之外,更強調資料加值、主動管理、建置值得信賴的資料典藏庫以確保未來的使用(Harvey, 2010)

14

2012-12-12 National Taiwan University Library

資料庋用的重要性

資料氾濫

過去數十年來,科學研究透過精密的儀器、電腦化模擬、計算式模組產出大量研究資料

資料流失

數位資料本身的特質、學者對於資料的認知、缺乏保存策略

資料效益

驗證研究、啟發研究、創新研究

15

2012-12-12 National Taiwan University Library

學術圖書館發展資料庋用之理由

長期以來,圖書館從事學術出版品的蒐集、典藏、組織,但對於研究歷程中最基本的元素:資料,卻沒有一套妥善的管理機制(Borgman, 2007)

圖書館具備資訊組織、資訊取用、館藏管理與機構典藏的專業和經驗,可作為資料庋用的基礎能力(Witt,

2008)

對於可感知的、明確的、具體的資訊,圖書館長久以來的徵集方法、資訊組織和典藏策略已然足夠,但是面對數位化研究資料的不明確、不穩定、多變化等特徵,圖書館面臨的是不同屬性的挑戰(Ogburn, 2010)

16

2012-12-12 National Taiwan University Library

學術圖書館發展資料庋用之策略

主動參與研究歷程

圖書館與研究者的夥伴關係是推動資料庋用的重要驅力。

整合校園內外各項資源

校內與校外既有資料,建置研究資料入口網站。

培訓練與重用館員

館員是資料庋用的執行者而非經紀人,有必要增進館員知能。

建立合作關係

考量整體社群的需求而不是個別的工作流程或系統。

執行合作計畫

機構內跨單位、機構之間、多機構的合作。

透過庋用服務更能彰顯圖書館和學術社群的合作關係。

17

Walters & Skinner, 2011;Choudhury, 2008;Witt, 2008;Witt & Carlson, 2007;陳雪華,2010

2012-12-12 National Taiwan University Library

館員在資料庋用的角色

館員是內容徴集和所有權的諮詢顧問

館員是教師的教學夥伴

館員是數位研究資料的產生和使用之觀察者

館員是資料庋用系統的建置者

館員是研究資料的產出者和傳播者

館員是組織的設計者

館員是合作網絡的創建者和參與者

18

Walters & Skinner, 2011

2012-12-12 National Taiwan University Library

資料庋用個案

英國愛丁堡大學

Edinburgh DataShare

美國麻省理工學院

DSpace@MIT

美國普渡大學

D2C2 (Distributed Data Curation Center)

PURR (Purdue University Research Repository)

19

2012-12-12 National Taiwan University Library

Edinburgh DataShare 20

http://datashare.is.ed.ac.uk/

2012-12-12 National Taiwan University Library

愛丁堡大學發展資料庋用的策略

Edinburgh DataShare是英國資料分享計畫的一部份,隸屬於Information Service之Data Library

以DSpace建置的資料典藏庫,另有機構典藏系統Edinburgh Research Archive(ERA)

研究人員以Edinburgh DataShare提交研究資料,每一筆完整的紀錄包括詮釋資料、資料檔和文件檔,可以自行設定取用權限,並取得一個永久的URL

在管理上,由上而下制定研究資料的管理政策;在技術上,由下而上根據研究者的需求,設計資料儲存格式、處理流程和相關工具(Rice & Haywood, 2010)

圖書館並不是資料庋用的主要單位,而是協同單位

21

2012-12-12 National Taiwan University Library

DSpace@MIT 22

http://dspace.mit.edu/handle/1721.1/55345

2012-12-12 National Taiwan University Library

MIT發展資料庋用的策略

基礎建設:採用原DSpace作為資料典藏庫,獲得NSF DataNet贊助,與校內的教師、資訊服務和科技部門合作,持續提昇DSpace的各項功能。

工作小組:2005年由學科館員組成資料倡議小組,學習資料庋用之作法,探討如何回應校內教師對於資料管理的需求,以及如何提供資料管理的服務。

學科館員:分析資料管理的需求、協助製作資料管理計畫書、教導學生使用研究資料、蒐集與傳播資料集、研究資料的上傳、下載、客製與產出等相關事宜。

23

Gabridge, 2009

2012-12-12 National Taiwan University Library

Distributed Data Curation Center

24

http://d2c2.lib.purdue.edu/

2012-12-12 National Taiwan University Library

普渡大學發展資料庋用的策略

普渡大學圖書館為主要負責單位,合作方案的層次

校內:圖書館與校內電算中心合作

校外:普渡大學和伊利諾大學香檳分校(UIUC)合作共同探討研究人員在何種情境下願意公開資料

D2C2提供資料庋用相關工具、參考文件、個案內容、資料管理政策等,但未具備資料提交、查詢、下載功能。

2011年推出Purdue University Research Repository(PURR),提供一個線上合作的資料典藏庫,具備提交和查詢研究資料的功能,可支援全校研究人員撰寫資料管理計畫書。

25

2012-12-12 National Taiwan University Library

PURR

26

https://research.hub.purdue.edu/

2012-12-12 National Taiwan University Library

個案比較

發展背景:國家型計畫的支持

機構典藏:皆已建置機構典藏,但在應用上卻有涉入深淺的差異

合作模式:內部與外部的合作策略

圖書館和館員的角色

Edinburgh DataShare是全校資訊服務的一環,由副校長帶領跨部門的專責單位,圖書館僅為協同單位

DSpace@MIT以學科館員為主力

D2C2由跨學科研究館員為推動資料庋用的聯絡人

27

2012-12-12 National Taiwan University Library

資料庋用系統

28

e-Research系統平台

一站式服務平台(one stop shop) –(Yang; Allan,

2010)

以適當的語意及情境感知服務(contextual

service) 進行知識探索、定位、及數位版權管理,提供研究者存取與其研究相關的全球資訊

獲取資源、內容提供

2012-12-12 National Taiwan University Library

29

e-Research系統之功能面向

資料庋用 (Data Curation)

知識探索與指引 (Knowledge Discovery)

資料分析與運算 (Data Analysis and

Computation)

協同研究環境 (Collaborative Research

Environment)

研究管理工具 (Project Management Tools)

2012-12-12 National Taiwan University Library

30

資料庋用在e-Research的角色

2012-12-12 National Taiwan University Library

31

資料庋用

e-Research系統的發展開端:資料典藏系統

系統特性 資料保存、資訊提供

收錄資料:不限於已出版的正式文件,更重視研究資料(Raw Data)

多樣化Metadata管理:資料主題、數位檔案

重視數位資料的存取政策、權限與安全控管機制

發展趨勢 分散式及雲端儲存系統

使用開放原始碼的檔案典藏系統:DSpace、Fedora

2012-12-12 National Taiwan University Library

32

知識探索與指引

在「主題類別瀏覽」、「全文檢索」之外….

以語意網為基礎架構的知識探索和資源指引

簡單語意網路關係

從屬(is-a)

包含(contain)

參照(refer to)

引用(cite)

被引用(cited)

資料來源:“Semantic Application for Digital Repositories,” Retrieved August 30,

2011, from http://research.microsoft.com/pubs/78985/OGF_for_Fab.pdf

2012-12-12 National Taiwan University Library

33

知識探索與指引之軟體工具

Proté gé

Jena .NET Framework

RDF Pro

VIVO

2012-12-12 National Taiwan University Library

34

資料分析與運算

分析工具:依學科領域及資料內容不同

分析方式:線上或離線分析

運算技術

分散式運算(distributed computing)

網格運算(grid computing)

雲端運算(cloud computing)

視覺化資料呈現

2012-12-12 National Taiwan University Library

35

資料分析與運算工具

資料來源: “VisTrailsWiki,” Retrieved August 30, 2011, from

http://www.vistrails.org/index.php/Main_Page#Screen_Shots

2012-12-12 National Taiwan University Library

36

協同研究環境

支援多人參與、共同運作的研究行為

Web2.0虛擬社群平台

溝通、分享、學習、討論、協同研究

協同寫作

文件編輯、同儕審查、出版

會議、事件管理、電子文件管理

匯聚、整理、統一提供原本分散的相關資源

2012-12-12 National Taiwan University Library

37

研究管理工具

與研究相關的管理活動

研究計畫管理

研究人員管理

工作流程管理

協助使用者善用合適、優良的管理工具,能大幅提升研究者執行管理類工作的效率及成果產出的品質

目標管理

風險管理

書目資源管理

2012-12-12 National Taiwan University Library

38

e-Research 系統實例

39

美國康乃爾大學 DataStaR

http://datastar.mannlib.cornell.edu/

Fedora Commons:資料典藏、檔案存取

Vitro:知識探索語意網

2012-12-12 National Taiwan University Library

40

美國普渡大學e-Scholar 系統

http://www.lib.purdue.edu/escholar/

2012-12-12 National Taiwan University Library

41

澳洲蒙納許大學 e-Research

http://www.monash.edu.au/eresearch/

協同合作服務 (collaboration services)

視覺化工具 (visualization tools)

高效能運算 (High Performance Computing,

HPC)

資料儲存管理系統:CloudStor 雲端資料儲存及分享空間

2012-12-12 National Taiwan University Library

42

地震模擬網路

Network for Earthquake Engineering

Simulation) http://www.nees.org/

資料典藏:NEEScentral 提供集中式資料儲存、管理、共享及出版平台

軟體服務工具:數十種支援研究分析的工具

社群資源

使用者支援

2012-12-12 National Taiwan University Library

43

資料庋用系統之建置

44

資料庋用系統功能要素

資料檢索

資料存取

資料管理

系統介面及使用

資料取得及加值利用

資料儲存

系統管理及開發

2012-12-12 National Taiwan University Library

45

資料庋用系統工具選用建議

可使用開放原始碼套裝軟體,再進行客製化或功能新增

推薦及常用建置工具比較

DSpace Fedora Commons

系統建置容易度 較佳

內容建置容易度 較佳

使用介面易用度 搭配擴充套件後較佳

資料結構及彈性 較佳

系統擴展及再開發容易度 較佳

2012-12-12 National Taiwan University Library

46

臺灣大學e-Research系統雛型

採用Dspace1.8為基礎架構

第一階段預計完成功能

彈性化Collection-level及Item-level詮釋資料

欄位互連導引

研究資料申請及授權流程

2012-12-12 National Taiwan University Library

47

臺灣大學e-Rsearch系統雛型

2012-12-12 National Taiwan University Library

48

結論與建議 (1/2)

精進館員知能以勝任資料庋用任務

館員在資料庋用的角色,幾乎涵蓋整套資料庋用的發展程序

MIT學科館員成立資料計畫小組;普渡大學任用跨學科研究館員

實施需求調查以奠定資料庋用基礎

愛丁堡大學:根據研究人員需求,規劃儲存格式、處理流程和工具

MIT圖書館:館員和研究人員非正式的對談

普渡大學圖書館:訪談研究人員,建置Data Curation Profile

規劃合作策略以推動資料庋用服務

對象:電算中心、系所、研究者、學術圖書館社群與研究經費提供機構等

合作策略不只是建置資料典藏庫,更應關注各領域研究人員的研究情境,才能在多變的環境中發展健全的合作關係

49

2012-12-12 National Taiwan University Library

結論與建議 (2/2)

e-Research系統建置的核心目標

減少研究的障礙及複雜度,讓研究者與資源間能夠更有效地互動,提升研究的品質及產能

有效落實資源保存、促進研究資源的分享與再利用、加速研究活動的生命週期

e-Research系統建置方式

考量機構本身的需求重點及可投入的人力成本,選擇適用的基礎工具

由資料庋用系統為中心,向外擴展系統功能

系統需具備彈性化服務導向架構設計,並可快速進行各項功能的組合及擴充運作

2012-12-12 National Taiwan University Library

50

參考書目(1/2)

陳雪華(2010)。e-Research與圖書館知識服務。上網日期:2012年2月3日,檢自http://www.lib.tku.edu.tw/libintro/pub/990513-2.pdf。

Beagrie, N. (2006). Digital curation for science, digital libraries, and individuals.

The International Journal of Digital Curation, 1(1), 3-16.

Borgman, C. L. (2007). Scholarship in the digital age: Information, infrastructure,

and the Internet. Cambridge, Mass.: MIT Press.

Buneman, P., Müller, H., and Rusbridge, C. (2009). Curating the CIA world

factbook. The International Journal of Digital Curation, 3(4), 29-43.

Choudhury, G. S. (2008). Case study in data curation at Johns Hopkins University.

Library Trends, 57(2), 211-220. Retrieved August 30, 2011, from

https://jscholarship.library.jhu.edu/handle/1774.2/34023.

DCC. (2010). About the DCC. Retrieved July 14, 2011, from

http://www.dcc.ac.uk/about-us/history-dcc.

Gabridge, T., (2009). The last mile: Liaison roles in curating science and

engineering research data. Research Library Issues: A Bimonthly. Report from

ARL, CNI, and SPARC, 265, 15-21.Retrieved June 20, 2011, from

http://www.arl.org/bm~doc/rli-265-gabridge.pdf.

51

2012-12-12 National Taiwan University Library

參考書目(2/2)

Harvey, R. (2010). Digital curation: A how-to-do-it manual. New York: Neal-

Schuman.

Ogburn, J. L. (2010). The Imperative for data curation. Portal: Libraries and the

Academy, 10(2), 241-246.

Rice, R., and Haywood, J., (2010). Research data management initiatives at

University of Edinburgh. Paper presented at the 6th International Digital Curation

Centre Conference,. Chicago, IL. Retrieved September 03, 2011, from

http://edina.ac.uk/presentations_publications/IDCC-rice-haywood.pdf

Walters, T., and Skinner, K. (2011). New roles for new times: Digital curation for

preservation. Washing, DC.: Association of Research Libraries.

Witt, M. (2008). Institutional repositories and research data curation in a

distributed environment. Library Trends, 57(2), 191-201.

Witt, M., and Carlson, J. R., (2007). Conducting a data interview. Libraries

Research Publications. Paper 81. Retrieved June 01, 2011, from

http://docs.lib.purdue.edu/lib_research/81.

52

2012-12-12 National Taiwan University Library

敬請指教

53