5.3.1データリポジトリとは
データリポジトリとは、研究データを保管し、インターネット上で公開する場所です。データリポジトリは、次の3種類に大別できます。
・ 機関リポジトリ
東京大学のUTokyo Repositoryは学術論文だけでなく、学術雑誌の投稿の要件として求められる、論文の論拠となる研究データの公開にも対応しています。UTokyo Repositoryで登録が可能な研究データのサイズは、1論文あたり500MB以下です。さらに、より大容量の研究データについても公開できるよう準備を進めています。(2025年5月現在)
・ 分野別リポジトリ
分野によっては、専門分野に特化したデータリポジトリがあります。同じ分野の研究者に研究データが発見されやすくなり、再利用の可能性も高まります。各分野のリポジトリは、re3dataで検索できます。国別または分野別にリポジトリを一覧表示する機能も備えています。
re3data https://www.re3data.org/
・ 汎用リポジトリ
汎用リポジトリとは分野を限定せずに、研究データの公開を受け付けているデータリポジトリです。代表的なものにfigshareやzenodo、Dryadがあります。
figshare https://figshare.com/
zenodo https://zenodo.org/
Dryad https://datadryad.org/
5.3.2選定のチェックポイント
データリポジトリを選ぶ際のチェックポイントは以下のとおりです。それぞれのチェックポイントについて、データリポジトリの利用規約や運営ポリシーを確認することをお勧めします。
・ 公開要件・ポリシー
学術雑誌や研究助成団体が、研究データの公開先として特定のデータリポジトリを指定あるいは推奨している場合があります。研究データに付与するライセンスが指定されている場合は、そのライセンスを適用できるデータリポジトリを選ぶ必要があります。
・ 利用条件
データリポジトリには、有料と無料のものがあります。また、データリポジトリによっては、公開できる研究データの容量に上限を設けている場合があります。出版過程で査読者のみに公開するといった公開範囲の設定を希望する場合は、データリポジトリが当該機能を備えているかの確認も必要です。
・ 運営の信頼性
長期にわたり安定的に研究データを公開できる運営体制であるかも、重要な判断基準です。確認するポイントに、運営ポリシーの内容、信頼できる運営機関か、研究データが保存されるサーバの所在国や適用法などが挙げられます。運営ポリシーの中で特に注意すべき点は、セキュリティ、機密性、長期保存とアクセスの保証です。万一データの流出や不正利用が起きた場合の対応や保護内容を確認しておくと安心です。
・ 視認性の向上
FAIR原則に則ったデータ公開は、研究データの利活用を促進します。(参照【実践編】5.2 研究データ公開の注意点)。公開データにDOI(参照【実践編】[コラム]永続的識別子(PID))が付与されるか、メタデータやライセンスを適切に付与できるかなどがチェックポイントになります。メタデータとは、データを説明する情報で、たとえばデータの名称や作成者などを指します。
データリポジトリの信頼性や視認性向上を判断する基準の一つに、CoreTrustSeal認証があります。CoreTrustSealはデータリポジトリの品質保証の一種で、サービスの継続性やガバナンスなど、一定の要件を満たしているデータリポジトリを認定するものです。
Current CoreTrustSeal certified data repositories
(CoreTrustSeal認定を受けているデータリポジトリ一覧)
参考文献
千葉大学アカデミック・リンク・センター.(2025). データリポジトリでの研究データ公開② データリポジトリでの研究データ公開の流れ. 研究データ管理・公開支援ポータル. https://alc.chiba-u.jp/eyr/2025/03/31/02dataRepo.html, (2025-04-14最終確認)