5.3.1データリポジトリとは
データリポジトリとは、研究データを保管し、インターネット上で公開する場所です。データリポジトリは、次の3種類に大別できます。
・ 機関リポジトリ
東京大学のUTokyo Repositoryは学術論文だけでなく、学術雑誌の投稿の要件として求められる、論文の論拠となる研究データの公開にも対応しています。UTokyo Repositoryで登録が可能な研究データのサイズは、1論文あたり500MB以下です。さらに、より大容量の研究データについても公開できるよう準備を進めています。(2025年5月現在)
・ 分野別リポジトリ
分野によっては、専門分野に特化したデータリポジトリがあります。同じ分野の研究者に研究データが発見されやすくなり、再利用の可能性も高まります。各分野のリポジトリは、re3dataで検索できます。国別または分野別にリポジトリを一覧表示する機能も備えています。
re3data 7)
・ 汎用リポジトリ
汎用リポジトリとは分野を限定せずに、研究データの公開を受け付けているデータリポジトリです。代表的なものにfigshareやZenodo、Dryadがあります。
figshare 8)
Zenodo 9)
Dryad 10)
5.3.2選定のチェックポイント
データリポジトリを選ぶ際のチェックポイントは以下のとおりです。それぞれのチェックポイントについて、データリポジトリの利用規約や運営ポリシーを確認することをお勧めします。
・ 公開要件・ポリシー
学術雑誌や研究助成団体が、研究データの公開先として特定のデータリポジトリを指定あるいは推奨している場合があります。研究データに付与するライセンスが指定されている場合は、そのライセンスを適用できるデータリポジトリを選ぶ必要があります。
・ 利用条件
データリポジトリには、有料と無料のものがあります。また、データリポジトリによっては、公開できる研究データの容量に上限を設けている場合があります。出版過程で査読者のみに公開するといった公開範囲の設定を希望する場合は、データリポジトリが当該機能を備えているかの確認も必要です。
・ 運営の信頼性
長期にわたり安定的に研究データを公開できる運営体制であるかも、重要な判断基準です。確認するポイントに、運営ポリシーの内容、信頼できる運営機関か、研究データが保存されるサーバの所在国や適用法などが挙げられます。運営ポリシーの中で特に注意すべき点は、セキュリティ、機密性、長期保存とアクセスの保証です。万一データの流出や不正利用が起きた場合の対応や保護内容を確認しておくと安心です。
・ 視認性の向上
FAIR原則に則ったデータ公開は、研究データの利活用を促進します。(参照【実践編】5.2 研究データ公開における注意点)。公開データにDOI(参照【実践編】コラム永続的識別子(PID))が付与されるか、メタデータやライセンスを適切に付与できるかなどがチェックポイントになります。メタデータとは、データを説明する情報で、たとえばデータの名称や作成者などを指します。
データリポジトリの信頼性や視認性向上を判断する基準の一つに、CoreTrustSeal認証があります。CoreTrustSealはデータリポジトリの品質保証の一種で、サービスの継続性やガバナンスなど、一定の要件を満たしているデータリポジトリを認定するものです。
Current CoreTrustSeal certified data repositories 11)
(CoreTrustSeal認定を受けているデータリポジトリ一覧)
注・引用文献
7 )re3data.
https://www.re3data.org/ (2025-04-14 最終確認)
8 )figshare.
https://figshare.com/ (2025-04-14 最終確認)
9 )Zenodo.
https://zenodo.org/ (2025-04-14 最終確認)
10)Dryad.
https://datadryad.org/ (2025-04-14 最終確認)
11)CoreTrustSeal. Current CoreTrustSeal certified data repositories.
https://amt.coretrustseal.org/certificates (2025-04-14 最終確認)
参考文献
千葉大学アカデミック・リンク・センター.(2025). データリポジトリでの研究データ公開② データリポジトリでの研究データ公開の流れ. https://alc.chiba-u.jp/eyr/2025/03/31/02dataRepo.html (2025-04-14最終確認)
5.3.1 What is a data repository?
A data repository is where research data is stored and published online. Data repositories can be divided into three broad categories.
Institutional repositories
The UTokyo Repository publishes not only academic articles but also the supporting research data required for the submission of an article to an academic journal. Up to 500MB of research data can be registered to the UTokyo Repository per article. Preparations are also underway for enabling the publishing of even larger volumes of research data (as at May 2025).
Disciplinary repositories
Some data repositories focus on a specific discipline. This makes the research data easily discoverable by other researchers in the same discipline and increases the possibility of reuse. Disciplinary repositories can be searched using re3data, where you can also browse repositories by country and by discipline.
re3data [7]
Generalist repositories
Generalist repositories publish research data regardless of the discipline. figshare, Zenodo, and Dryad are among the main generalist repositories.
figshare [8]
Zenodo [9]
Dryad [10]
5.3.2 Key points in repository selection
Key points when selecting a data repository are as follows. We also recommend checking the terms of use and operational policies of the respective data repositories in relation to these points.
Publication requirements and policies
In some cases, academic journals and research funding agencies will stipulate or recommend a specific data repository for publishing research data. Where they stipulate which license to apply to the research data, you will need to select a data repository that allows application of that license.
Terms of use
Some data repositories charge a fee, and some are free. Some also impose a ceiling on the amount of research data that can be published. If you wish to set the publication scope so that the data is only disclosed to the reviewer/s during the publishing process, you will need to check that the data repository has that function.
Operational trustworthiness
Another important criteria in deciding on a repository is whether the repository’s operational structure will ensure a long-term, stable publishing of data. Check the repository’s operational policy, whether the repository has a trustworthy management body, what country will house the server storing your research data, and the applicable laws in that country. In the operational policy, pay particular attention to security, confidentiality, long-term data preservation, and guaranteed access. It is also a good idea to check what happens in the case of data breaches and unauthorized use, as well as protection measures.
Increased visibility
Data publishing in line with the FAIR principles promotes the reuse of research data (see 5.2 Important points in relation to sharing research data). Other key points include whether the published data is assigned a DOI (see Column: Persistent Identifiers), or whether the proper metadata and license can be applied. Metadata is information describing the data, such as the name and creator of the data. CoreTrustSeal certification is one criteria for determining a data repository’s trustworthiness and whether it will increase data visibility. CoreTrustSeal is a type of quality assurance for data repositories, certifying repositories that meet certain requirements, such as continuity of service and governance.
Current CoreTrustSeal certified data repositories [11]
(List of data repositories with CoreTrustSeal certification.)
References
[7] re3data. https://www.re3data.org/. Accessed April 14, 2025.
[8] figshare. https://figshare.com/. Accessed April 14, 2025.
[9] Zenodo. https://zenodo.org/. Accessed April 14, 2025.
[10] Dryad. https://datadryad.org/. Accessed April 14, 2025.
[11] CoreTrustSeal. Current CoreTrustSeal certified data repositories. https://amt.coretrustseal.org/certificates. Accessed April 14, 2025.
5.3 Data repository selection is based on the following webpage:
Academic Link Center, Chiba University. (2025). Research Data Publication in Data Repositories ② The Process of Publishing Research Data in Data Repositories (Japanese only). https://alc.chiba-u.jp/eyr/2025/03/31/02dataRepo.html. Accessed April 14, 2025.