研究資料管理學習指引 > 管理工具庫 > 學習資源與管理工具 > 儲存與描述
在資料生命週期的每個階段都包含品質確認、記錄描述與儲存共享的規劃或執行,其內涵概述如下:
•品質確認:
包含Quality Assurance(QA)及Quality Control(QC),前者指蒐集過程中預防資料品質不良,而後者則是蒐集完成後資料品質的偵測,於蒐集資料前應規劃品質確認方式,並於蒐集和偵測過程中記錄確認方式。具體的做法包含訂定明確的資料蒐集規範,於表單設計偵錯機制,並於資料蒐集後再次確認正確性與編碼一致性,以及,找出異常、缺漏、離群或預測值,進一步標註記錄資料品質狀況。
•記錄描述:
為利資料蒐集者或其他研究者後續再運用,需保留充足的背景、實驗、蒐集、編碼、變數、品管、儲存等資訊與說明,故應有系統的描述記錄研究資料,可分為資料集和整體研究2層級,前者針對特定資料集或檔案細節說明,後者則闡述研究設計、方法、背景與流程。描述的格式多元,可能是附加於檔案的Readme files、Data dictionaries、實驗記錄簿中的筆記、典藏平台的書目資料或利於機器讀取的詮釋資料(Metadata),資料欄位亦因領域或資料類型而異,可在計劃設計階段就參考通用標準或運用查詢工具確認所屬領域的標準及配套工具與模板,並使用符合領域普遍認知的詞彙,以利完整保留、蒐集足夠且容易理解的描述資訊。
•儲存共享:
避免資料遺失與未授權的取用或更動是確保研究順利進行的要件,在規劃階段應先選擇資料儲存與備份策略,可運用備份軟體,並遵循3-2-1法則,儲存3個資料複本於2種儲存裝置上,並且至少1種放置於不同場域。儲存後亦須考量資料安全,可透過設資料或資訊設備設定密碼或加密等方式避免資料外洩,若需多人甚至跨國合作,儲存媒體則須考量共享機制,並確保團隊成員瞭解檔案管理方式,並應管控資料取用權限。
說明QA及QC的差異,及具體計畫、執行方式與範例
詳細列出資料蒐集前中後,為例品質確認的計畫、預防、檢查偵測及記錄事項
資料描述相關概念之簡要介紹
詳細說明社會科學之質化與量化研究資料之記錄描述方式與相關標準
詳列生命週期各階段的資料描述事項,並簡要說明執行方式
以資料欄位多元的Dataverse平台說明各種資料類型的建議描述欄位,供研究者參考
說明儲存選擇、設備比較、備份方式與資料安全,並整合Uk Data Service之相關資訊
說明如何在計畫階段進行研究資料管理相關業務人員及其資料取用權責之定義
說明若為大團隊或跨國團隊合作,資料應可共享,並訂定標準與管控使用權限
提供實驗記錄簿使用說明、運用實例、選擇方式與產品比較
Dublin Core:一般性多功能之詮釋資料標準
DataCite:跨領域適用之核心詮釋資料要件,以供資源辨識、引用及指引使用為目的
Data Documentation Initiative (DDI):為國際標準,用於描述調查資料及其他透過觀察取得之社會、行為、經濟、健康主題之科學研究資料
Statistical Data and Metadata eXchange (SDMX):用於描述統計資料,已發表為ISO 17369之國際標準
ISO 19115 及FGDC-CSDGM :為地理空間資訊詮釋標準
MIBBI:彙整超過40種生醫領域常用詮釋資料標準
EML:Ecology Metadata Language為生態學領域詮釋資料標準,可運用配套Morpho應用程式編輯
Darwin Core:生命科學領域詮釋資料標準
為UK Data Service開發之免費開源工具,可自動品質偵測,用於初步排除常見資料問題
為免費開源工具,下載安裝後以瀏覽器開啟,可用於資料清理、詞彙整併與品質確認,亦可進行資料格式轉換、整合資料集等分析處理
(各領域詮釋資料標準之配套編輯工具請運用前述查詢工具取得)
為資料公開、描述、分析與視覺化的線上免費工具,支援DDI及Dublin Core等詮釋資料標準
為開源免費工具,用於瀏覽、編輯與確認XML檔案的簡易介面,未預設帶入任何詮釋資料標準,可用於修改各標準提供的模板或範本。
以簡要的問題條列方式提出詮釋資料的一般性基本內容,並延伸提供具體XML格式描述範例,供研究者快速掌握詮釋資料內涵與描述方式
免費之檔案校驗工具,可產生MD5或SHA Hash,提供中文介面
臺灣大學計算機中心提供之雲端儲存空間、虛擬主機與軟體共享協作平台
臺灣大學之G Suite for Education 服務,提供50GB之雲端空間
美國Center for Open Science提供之免費開放計畫管理、典藏與共享平台,協助研究者進行生命週期的所有流程
為開源之資料管理軟體,主要透過資料虛擬化技術幫助研究者在多種媒體上管理資料,並提供完善的詮釋資料欄位、資訊安全管控與工作流程自動化功能
提供超過30種實驗記錄簿詳盡之功能特性比較
免費之大型檔案傳輸工具,傳輸時提供加密與檔案校驗等功能,確保傳輸安全