研究資料管理學習指引 > 管理工具庫 > 學習資源與管理工具 > 蒐集與組織
原始資料蒐集為研究者熟悉的流程,透過一致的蒐集格式、有組織的檔案命名與儲存架構並詳加註記蒐集過程,能使執行方式標準化,並提升後續描述、分析及典藏之效率。此階段的管理任務概述如下,開始進行前可先行規劃並製作模板,供執行資料蒐集人員確認,確保作業一致性。
•維持格式結構一致:為維持資料結構一致,避免轉檔修改,以利後續彙整分析,應依據後續研究需要、分析工具特性與儲存典藏規範,預先編排原始資料格式、定義參數、用語格式、資料欄位,並選擇資料檔案類型,為利未來長期保存,建議以開放檔案格式為主。
•依循檔案儲存架構:資料蒐集後的儲存方式,攸關後續查找與團隊合作效率,故建議統一命名方式(Naming Convention)並符合領域既定標準,並可預先設想資料分類結構,確立檔案儲存架構(Folder Structure),並蒐集過程中運用相關工具進行版本控制,完成蒐集後應妥為保存資料原貌,或可以設為唯讀檔方式避免修改。
•彙整記錄蒐集過程:建立Readme Files ,概述整體資料集的內容、格式、資料類型等使用時所需資訊,並將參數的編碼細節,資料來源的各類背景資訊,詳加紀錄為參數表及資料來源表。
許多生命週期模型會將資料的品質確認及描述納入此階段,其詳情請參考「儲存與描述」階段。
哈佛醫學院資料管理單位提出,說明如何確立資料組織基礎,訂定檔案命名規則、檔案儲存架構、版本控制,並編寫readme檔案
提出資料集格式欄位、編碼等建議,包含保留原始資料、使用適當分欄方式與保持編碼一致性
美國地質調查局提出,強調在完成資料蒐集的計畫後可建立資料蒐集的模板與檔案命名的模板,提升資料蒐集的精確與一致
說明社會科學研究之質化或量化資料應如何組織、設計格式、設定參數及編碼
英國社經資料典藏庫提出,說明如何將資料數位化、轉檔、版本控制、組織等概念
提供檔案命名的13點注意事項,並詳加舉例說明
提供確認Readme file的各項要素
提供最佳及必要版本的Readme file模板
簡要圖示常見資料格式的開放情形與保存難易,協助建立基本概念
由美國國會圖書館提出,依資料類型推薦較易於保存使用之資料格式
批次修改檔名軟體比較表
檔案命名格式模板,提供元素建議、範例與指引