研究資料管理學習指引 > 管理工具庫 > 學習資源與管理工具 > 典藏與公開
研究資料的公開共享,是研究資料管理的主要目的之一,為提升研究過程透明度,回應研究再現性的訴求,對作者而言,同儕間能發掘並引用研究資料,作為一種研究成果,同時滿足出資單位或出版單位的規範。資料公開的管道包含:資料典藏庫、資料期刊(Data Journal)、出版品附件,並以儲存於典藏庫最為常見,各類型領域之典藏平台多元,選擇方法詳見研究資料典藏庫,而典藏時應考量事項如下:
•選擇資料:研究中產生各式資料,如原始資料、分析資料、分析結果、圖片或實驗指南等,選擇時需考量成本效益、長期價值,以及分享目的,包含可供驗證分析、再用衍伸研究,或恢復資料原貌。此外資料公開與否,也受相關法規或政策影響,應注意資料著作權所有情形、所屬單位智慧財產權政策、出資及出版單位公開規範與受測者個資或機敏資料問題。
•資料處理:為使資料便於供他人識讀使用,依照各典藏庫設計與資料特性,應參考典藏庫指引,執行組織檔案、轉換格式、確認與簡化資料內容等。其中最重要的事項則是針對姓名、地址、電話、可辨識身份的代碼等個人資料進行去識別化(De-identification)或匿名化(Anonymisation),前者僅隱藏個資,特定權限者仍可取得,後者則刪除個資,無法再復原辨識。
•描述說明:除各階段蒐集紀錄的詮釋資料應完整提供外,為利追蹤資料影響,並更易於查找發掘,應取得資料的永久識別碼(如DOI等),並連結其他相關研究產出,期符合FAIR原則,此外,亦建議提供引用資訊,呈現適當的姓名與出處標示。
•取用授權:典藏庫多提供取用控制功能,分為多種公開層級、使用權限,或可延遲公開,此外,也應依資料類型或公開需求選擇資料授權方式,提供明確的資料再用指引,常見的研究資料開放授權條款包含創用CC、Open Data Commons、Open Government Licence,以及不保留權力的公眾領域授權宣告(CC0)等。
完整說明生命週期的共享與公開階段所需認識的概念與任務
簡要說明資料共享的重要性與需考量的議題
提供中譯版本,不侷限討論研究資料,強調開放資料的意義、重要性、開放方式與推廣
為Open Science Training中說明開放研究資料的專章,廣泛說明資料公開的相關議題、單位、工具與常見問題
簡要說明典藏資料的種類、典藏目的與成本,供選擇參考
說明資料內容外,其他影響選擇的法規、政策因素
詳細說明研究資料牽涉的著作權議題
說明分享研究資料時可能遇到的智慧財產權問題
(具體作法因典藏庫規範而異,請參考所選典藏庫之說明)
說明USGS資料公開的規範、輔助工具與Check List
詳細說明資料存入Uk Data Service典藏平台前應進行的整備流程、資料規範與Check List
表格式資料整備指引,包含資料的組織、格式選擇、品質確認與輔助工具
提供在生命週期的各階段,如欲典藏或分享資料時,用於整理、紀錄資料、檔案的表格
說明研究資料的影響力追蹤機制與重要性,以及提升資料影響力的方法
簡要說明FAIR原則及實踐方式
詳加說明FAIR原則的意義,並列舉典藏平台之實踐案例,可供服務規劃參考
深入說明各類授權及條款,並提供選擇方式與授權附加方法
簡要說明研究資料授權,以創用CC為主
說明ICPSR典藏平台對資料保密的規範、建議與相關功能
提供機敏資料取用控制及社會科學質化與量化資料匿名化方法
說明患者之人體受測對象資料如何去識別化的5個具體步驟
美國Poverty Action Lab出版的資料去識別化指引文件
英國National Centre for Research Methods製作之去識別化入門課程
分別提供非結構化文字、數位影像及表格等結構化資料之去識別化工具列表與比較
UK Data Service以VBA開發之文字質化研究資料去識別化工具,僅適用於MS Word