Upload
truongkhanh
View
228
Download
6
Embed Size (px)
Citation preview
e-Research專書
第一章 導論 /陳雪華
第二章 各國 e-Research 之發展與現況
/陳雪華、黃文樺、何亞真、陳麗純
第三章 臺灣發展研究資料管理政策之芻議 /劉應琳
第四章 學術圖書館與資料庋用 /曾品方
第五章 從研究人員觀點探討資料庋用系統:以地理資訊應用領域為例 /黃文琪、蔣禮芸、秦韻涵
第六章 資料庋用詮釋資料之探析
/林玉、劉京玫
第七章 e-Research 系統之服務與發展 /江玉婷、陳光華、黃乾綱
第八章 結論與建議 /陳光華
2012-12-12
2
National Taiwan University Library
工作同仁
陳雪華, 陳光華, 黃乾綱
劉京玫, 劉應琳, 江玉婷, 黃文琪, 蔣禮芸
曾品方, 秦韻涵, 林玉
黃文樺, 何亞貞, 陳麗純, 鄧雅文, 丁培涵
2012-12-12
3
National Taiwan University Library
大綱
e-Research與資料庋用
發展資料庋用之理由與策略
館員在資料庋用的角色
資料庋用個案與系統
結論與建議
4
2012-12-12 National Taiwan University Library
當今的研究趨勢
資料量遽增
隨著科技進步,研究設備(衛星、感測網等)分秒帶回資料類型的轉變;原生數位(born digital)的資料量遽增。
資料氾濫(data deluge)的時代
跨國與跨界合作研究
跨國或跨界合作引領的研究方向已成為新契機
這些全球合作的科學家或研究人員多來自不同的學科背景,在線上搜尋資料時,往往會在不同的工具與傳輸協定之間感到困惑
2012-12-12 National Taiwan University Library
5
e-Research的組成
計算能力與網路頻寬
Computer centers, cloud computing providers
資料庋用
Libraries, data centers
作業系統與演算法
Domain experts, computer scientists
2012-12-12
7
National Taiwan University Library
研究資料的規模
研究型資料庫(Research data collections)
一個(或以上)研究計畫的產物
對於資料處理與管理的程度有限
資源/社群型資料庫(Resource or community data collections)
主要在服務特定或單一的研究社群
一般很難預測可以經營或維持多久
參考型資料庫(Reference data collections)
主要目的在於服務大規模學術社群
較佳的管理與營運
2012-12-12 National Taiwan University Library
8
研究資料的存放
依據PARSE.Insight 計畫研究結果
全世界跨領域的1,200名研究者,80%的研究者只存在研究人員自己的電腦
Source: PARSE.Insight consortium. (2010). PARSE.Insight: Science Data Infrastructure Roadmap.
2012-12-12 National Taiwan University Library
9
研究資料的管理現況
未必都有完善保存機制:策略、政策、技術、經費等。
難以整合:部分領域即使各自維護有相關資料庫,未必公開,或都有提供健全的資料描述(identifier、metadata)、利用資料的軟體工具,以及採用與國際接軌的庋藏標準,也因此於整合與開放上增添難度。
缺乏跨資料庫平台:遑論管理與服務人員。
不易取得:相關領域研究人員若要利用公部門經費補助產出的研究資料,非但不易取得,甚至反而必須付費透過營利性的資料庫公司取得。
2012-12-12 National Taiwan University Library
10
資料庋用之意義
data curation 或是digital curation
data:資料,原生資料或是研究產出之資料
庋用(curation)源自於拉丁文curare :照料(care for),研究資料如果沒有善加蒐集和照料,就無法提供取得和再次使用(Buneman, Müller &
Rusbridge , 2009)
data curation包括庋藏和使用,故譯為「資料庋用」
資料庋用是針對數位化的研究資料加以維護、保存和加值,建置值得信賴的數位典藏資料庫,以利現在和未來的使用(DCC, 2010)
12
2012-12-12 National Taiwan University Library
e-Research vs. data curation
資料庋用是因應e-Research的發展,著重於保存維護、公開取用大量的資料集,資料庋用之發展與e-Research的興起息息相關
為支援e-Research的發展,除了需要網路基本建設、網格運算等相關技術之外,也需要一套資料庋用的方法,用以評估、蒐集、組織、保存和應用研究資料,俾便資料的再使用,以支援學者驗證或開創研究
13
2012-12-12 National Taiwan University Library
資料庋用vs.數位保存
資料庋用一詞往往包含數位保存、數位典藏的概念,但其實仍有所差別
資料庋用是對於整體學術社群的深層思考,包括研究者、出版者、庋用者、資料管理者以及使用者之間的緊密合作,資料庋用不只是數位保存和數位典藏,更涵蓋研究社群與資料資源之間的密切互動(Beagrie, 2006)
數位保存是資料庋用的一部份,資料庋用除了保存與維護數位資料之外,更強調資料加值、主動管理、建置值得信賴的資料典藏庫以確保未來的使用(Harvey, 2010)
14
2012-12-12 National Taiwan University Library
資料庋用的重要性
資料氾濫
過去數十年來,科學研究透過精密的儀器、電腦化模擬、計算式模組產出大量研究資料
資料流失
數位資料本身的特質、學者對於資料的認知、缺乏保存策略
資料效益
驗證研究、啟發研究、創新研究
15
2012-12-12 National Taiwan University Library
學術圖書館發展資料庋用之理由
長期以來,圖書館從事學術出版品的蒐集、典藏、組織,但對於研究歷程中最基本的元素:資料,卻沒有一套妥善的管理機制(Borgman, 2007)
圖書館具備資訊組織、資訊取用、館藏管理與機構典藏的專業和經驗,可作為資料庋用的基礎能力(Witt,
2008)
對於可感知的、明確的、具體的資訊,圖書館長久以來的徵集方法、資訊組織和典藏策略已然足夠,但是面對數位化研究資料的不明確、不穩定、多變化等特徵,圖書館面臨的是不同屬性的挑戰(Ogburn, 2010)
16
2012-12-12 National Taiwan University Library
學術圖書館發展資料庋用之策略
主動參與研究歷程
圖書館與研究者的夥伴關係是推動資料庋用的重要驅力。
整合校園內外各項資源
校內與校外既有資料,建置研究資料入口網站。
培訓練與重用館員
館員是資料庋用的執行者而非經紀人,有必要增進館員知能。
建立合作關係
考量整體社群的需求而不是個別的工作流程或系統。
執行合作計畫
機構內跨單位、機構之間、多機構的合作。
透過庋用服務更能彰顯圖書館和學術社群的合作關係。
17
Walters & Skinner, 2011;Choudhury, 2008;Witt, 2008;Witt & Carlson, 2007;陳雪華,2010
2012-12-12 National Taiwan University Library
館員在資料庋用的角色
館員是內容徴集和所有權的諮詢顧問
館員是教師的教學夥伴
館員是數位研究資料的產生和使用之觀察者
館員是資料庋用系統的建置者
館員是研究資料的產出者和傳播者
館員是組織的設計者
館員是合作網絡的創建者和參與者
18
Walters & Skinner, 2011
2012-12-12 National Taiwan University Library
資料庋用個案
英國愛丁堡大學
Edinburgh DataShare
美國麻省理工學院
DSpace@MIT
美國普渡大學
D2C2 (Distributed Data Curation Center)
PURR (Purdue University Research Repository)
19
2012-12-12 National Taiwan University Library
愛丁堡大學發展資料庋用的策略
Edinburgh DataShare是英國資料分享計畫的一部份,隸屬於Information Service之Data Library
以DSpace建置的資料典藏庫,另有機構典藏系統Edinburgh Research Archive(ERA)
研究人員以Edinburgh DataShare提交研究資料,每一筆完整的紀錄包括詮釋資料、資料檔和文件檔,可以自行設定取用權限,並取得一個永久的URL
在管理上,由上而下制定研究資料的管理政策;在技術上,由下而上根據研究者的需求,設計資料儲存格式、處理流程和相關工具(Rice & Haywood, 2010)
圖書館並不是資料庋用的主要單位,而是協同單位
21
2012-12-12 National Taiwan University Library
DSpace@MIT 22
http://dspace.mit.edu/handle/1721.1/55345
2012-12-12 National Taiwan University Library
MIT發展資料庋用的策略
基礎建設:採用原DSpace作為資料典藏庫,獲得NSF DataNet贊助,與校內的教師、資訊服務和科技部門合作,持續提昇DSpace的各項功能。
工作小組:2005年由學科館員組成資料倡議小組,學習資料庋用之作法,探討如何回應校內教師對於資料管理的需求,以及如何提供資料管理的服務。
學科館員:分析資料管理的需求、協助製作資料管理計畫書、教導學生使用研究資料、蒐集與傳播資料集、研究資料的上傳、下載、客製與產出等相關事宜。
23
Gabridge, 2009
2012-12-12 National Taiwan University Library
Distributed Data Curation Center
24
http://d2c2.lib.purdue.edu/
2012-12-12 National Taiwan University Library
普渡大學發展資料庋用的策略
普渡大學圖書館為主要負責單位,合作方案的層次
校內:圖書館與校內電算中心合作
校外:普渡大學和伊利諾大學香檳分校(UIUC)合作共同探討研究人員在何種情境下願意公開資料
D2C2提供資料庋用相關工具、參考文件、個案內容、資料管理政策等,但未具備資料提交、查詢、下載功能。
2011年推出Purdue University Research Repository(PURR),提供一個線上合作的資料典藏庫,具備提交和查詢研究資料的功能,可支援全校研究人員撰寫資料管理計畫書。
25
2012-12-12 National Taiwan University Library
個案比較
發展背景:國家型計畫的支持
機構典藏:皆已建置機構典藏,但在應用上卻有涉入深淺的差異
合作模式:內部與外部的合作策略
圖書館和館員的角色
Edinburgh DataShare是全校資訊服務的一環,由副校長帶領跨部門的專責單位,圖書館僅為協同單位
DSpace@MIT以學科館員為主力
D2C2由跨學科研究館員為推動資料庋用的聯絡人
27
2012-12-12 National Taiwan University Library
e-Research系統平台
一站式服務平台(one stop shop) –(Yang; Allan,
2010)
以適當的語意及情境感知服務(contextual
service) 進行知識探索、定位、及數位版權管理,提供研究者存取與其研究相關的全球資訊
獲取資源、內容提供
2012-12-12 National Taiwan University Library
29
e-Research系統之功能面向
資料庋用 (Data Curation)
知識探索與指引 (Knowledge Discovery)
資料分析與運算 (Data Analysis and
Computation)
協同研究環境 (Collaborative Research
Environment)
研究管理工具 (Project Management Tools)
2012-12-12 National Taiwan University Library
30
資料庋用
e-Research系統的發展開端:資料典藏系統
系統特性 資料保存、資訊提供
收錄資料:不限於已出版的正式文件,更重視研究資料(Raw Data)
多樣化Metadata管理:資料主題、數位檔案
重視數位資料的存取政策、權限與安全控管機制
發展趨勢 分散式及雲端儲存系統
使用開放原始碼的檔案典藏系統:DSpace、Fedora
2012-12-12 National Taiwan University Library
32
知識探索與指引
在「主題類別瀏覽」、「全文檢索」之外….
以語意網為基礎架構的知識探索和資源指引
簡單語意網路關係
從屬(is-a)
包含(contain)
參照(refer to)
引用(cite)
被引用(cited)
資料來源:“Semantic Application for Digital Repositories,” Retrieved August 30,
2011, from http://research.microsoft.com/pubs/78985/OGF_for_Fab.pdf
2012-12-12 National Taiwan University Library
33
知識探索與指引之軟體工具
Proté gé
Jena .NET Framework
RDF Pro
VIVO
2012-12-12 National Taiwan University Library
34
資料分析與運算
分析工具:依學科領域及資料內容不同
分析方式:線上或離線分析
運算技術
分散式運算(distributed computing)
網格運算(grid computing)
雲端運算(cloud computing)
視覺化資料呈現
2012-12-12 National Taiwan University Library
35
資料分析與運算工具
資料來源: “VisTrailsWiki,” Retrieved August 30, 2011, from
http://www.vistrails.org/index.php/Main_Page#Screen_Shots
2012-12-12 National Taiwan University Library
36
協同研究環境
支援多人參與、共同運作的研究行為
Web2.0虛擬社群平台
溝通、分享、學習、討論、協同研究
協同寫作
文件編輯、同儕審查、出版
會議、事件管理、電子文件管理
匯聚、整理、統一提供原本分散的相關資源
2012-12-12 National Taiwan University Library
37
研究管理工具
與研究相關的管理活動
研究計畫管理
研究人員管理
工作流程管理
協助使用者善用合適、優良的管理工具,能大幅提升研究者執行管理類工作的效率及成果產出的品質
目標管理
風險管理
書目資源管理
2012-12-12 National Taiwan University Library
38
美國康乃爾大學 DataStaR
http://datastar.mannlib.cornell.edu/
Fedora Commons:資料典藏、檔案存取
Vitro:知識探索語意網
2012-12-12 National Taiwan University Library
40
美國普渡大學e-Scholar 系統
http://www.lib.purdue.edu/escholar/
2012-12-12 National Taiwan University Library
41
澳洲蒙納許大學 e-Research
http://www.monash.edu.au/eresearch/
協同合作服務 (collaboration services)
視覺化工具 (visualization tools)
高效能運算 (High Performance Computing,
HPC)
資料儲存管理系統:CloudStor 雲端資料儲存及分享空間
2012-12-12 National Taiwan University Library
42
地震模擬網路
Network for Earthquake Engineering
Simulation) http://www.nees.org/
資料典藏:NEEScentral 提供集中式資料儲存、管理、共享及出版平台
軟體服務工具:數十種支援研究分析的工具
社群資源
使用者支援
2012-12-12 National Taiwan University Library
43
資料庋用系統功能要素
資料檢索
資料存取
資料管理
系統介面及使用
資料取得及加值利用
資料儲存
系統管理及開發
2012-12-12 National Taiwan University Library
45
資料庋用系統工具選用建議
可使用開放原始碼套裝軟體,再進行客製化或功能新增
推薦及常用建置工具比較
DSpace Fedora Commons
系統建置容易度 較佳
內容建置容易度 較佳
使用介面易用度 搭配擴充套件後較佳
資料結構及彈性 較佳
系統擴展及再開發容易度 較佳
2012-12-12 National Taiwan University Library
46
臺灣大學e-Research系統雛型
採用Dspace1.8為基礎架構
第一階段預計完成功能
彈性化Collection-level及Item-level詮釋資料
欄位互連導引
研究資料申請及授權流程
2012-12-12 National Taiwan University Library
47
結論與建議 (1/2)
精進館員知能以勝任資料庋用任務
館員在資料庋用的角色,幾乎涵蓋整套資料庋用的發展程序
MIT學科館員成立資料計畫小組;普渡大學任用跨學科研究館員
實施需求調查以奠定資料庋用基礎
愛丁堡大學:根據研究人員需求,規劃儲存格式、處理流程和工具
MIT圖書館:館員和研究人員非正式的對談
普渡大學圖書館:訪談研究人員,建置Data Curation Profile
規劃合作策略以推動資料庋用服務
對象:電算中心、系所、研究者、學術圖書館社群與研究經費提供機構等
合作策略不只是建置資料典藏庫,更應關注各領域研究人員的研究情境,才能在多變的環境中發展健全的合作關係
49
2012-12-12 National Taiwan University Library
結論與建議 (2/2)
e-Research系統建置的核心目標
減少研究的障礙及複雜度,讓研究者與資源間能夠更有效地互動,提升研究的品質及產能
有效落實資源保存、促進研究資源的分享與再利用、加速研究活動的生命週期
e-Research系統建置方式
考量機構本身的需求重點及可投入的人力成本,選擇適用的基礎工具
由資料庋用系統為中心,向外擴展系統功能
系統需具備彈性化服務導向架構設計,並可快速進行各項功能的組合及擴充運作
2012-12-12 National Taiwan University Library
50
參考書目(1/2)
陳雪華(2010)。e-Research與圖書館知識服務。上網日期:2012年2月3日,檢自http://www.lib.tku.edu.tw/libintro/pub/990513-2.pdf。
Beagrie, N. (2006). Digital curation for science, digital libraries, and individuals.
The International Journal of Digital Curation, 1(1), 3-16.
Borgman, C. L. (2007). Scholarship in the digital age: Information, infrastructure,
and the Internet. Cambridge, Mass.: MIT Press.
Buneman, P., Müller, H., and Rusbridge, C. (2009). Curating the CIA world
factbook. The International Journal of Digital Curation, 3(4), 29-43.
Choudhury, G. S. (2008). Case study in data curation at Johns Hopkins University.
Library Trends, 57(2), 211-220. Retrieved August 30, 2011, from
https://jscholarship.library.jhu.edu/handle/1774.2/34023.
DCC. (2010). About the DCC. Retrieved July 14, 2011, from
http://www.dcc.ac.uk/about-us/history-dcc.
Gabridge, T., (2009). The last mile: Liaison roles in curating science and
engineering research data. Research Library Issues: A Bimonthly. Report from
ARL, CNI, and SPARC, 265, 15-21.Retrieved June 20, 2011, from
http://www.arl.org/bm~doc/rli-265-gabridge.pdf.
51
2012-12-12 National Taiwan University Library
參考書目(2/2)
Harvey, R. (2010). Digital curation: A how-to-do-it manual. New York: Neal-
Schuman.
Ogburn, J. L. (2010). The Imperative for data curation. Portal: Libraries and the
Academy, 10(2), 241-246.
Rice, R., and Haywood, J., (2010). Research data management initiatives at
University of Edinburgh. Paper presented at the 6th International Digital Curation
Centre Conference,. Chicago, IL. Retrieved September 03, 2011, from
http://edina.ac.uk/presentations_publications/IDCC-rice-haywood.pdf
Walters, T., and Skinner, K. (2011). New roles for new times: Digital curation for
preservation. Washing, DC.: Association of Research Libraries.
Witt, M. (2008). Institutional repositories and research data curation in a
distributed environment. Library Trends, 57(2), 191-201.
Witt, M., and Carlson, J. R., (2007). Conducting a data interview. Libraries
Research Publications. Paper 81. Retrieved June 01, 2011, from
http://docs.lib.purdue.edu/lib_research/81.
52
2012-12-12 National Taiwan University Library