JSUT-book corpus

ダウンロード (download)

Click here. [Google Drive link, zip 0.25 GB]

内容 (description)

This corpus consists of audiobook voice data. The specification is as follows.

  • Speaker: a female non-professional Japanese speaker

  • Size: 6 audiobooks, 1 hours of voice

  • Recording: 48 kHz sampling, studio recording

  • Data: text (*.yaml), voice (*.wav).

    • The text file contains chapter ('chaptXXX'), paragraph ('paragXXX'), style ('narration' or acting character's names), raw sentence, sentence-level alignment.

このコーパスはオーディオブック音声から成ります.日本語テキストと多数話者の音声データからなります.スペックは以下のとおりです.

  • 話者: プロではない日本語女性話者1名

  • サイズ: 6つの物語,1時間の音声

  • 収録:48kHz サンプリング,スタジオ収録

  • データ: テキスト,音声,キャラ名.

    • テキストファイルには,章 ('chapterXXX'),段落 ('paragraphXXX'),様式 ('narration' もしくは キャラ名),文,文レベルのアライメント結果が含まれています.

使い方 (terms of use)

The text data is out-of-copyright books stored in the Aozora Bunko. The audio data may be used for

      • Research by academic institutions

      • Non-commercial research, including research conducted within commercial organizations

      • Personal use, including blog posts.

If you want to use the audio data for commercial purposes, please see below. Re-distribution is not permitted, but you can upload a part of this corpus (e.g., ~10 audio files) in your website or blog. If possible, please let me know when you revealed papers, blog posts, and others. It will be very helpful to investigate contributions of this corpus.

テキストデータは青空文庫に収録されている,著作権切れの文です.音声データは,以下の場合に限り使用可能です.

      • アカデミック機関での研究

      • 非商用目的の研究(営利団体での研究も含む)

      • 個人での利用(ブログなどを含む)

営利目的の利用を希望される場合,下記をご覧ください.この音声データの再配布は認められていませんが,あなたのウェブページやブログなどでコーパスの一部(例えば,10文程度)を公開することは可能です.できれば,あなたが論文やブログポスト等の成果を公開した際には,私まで連絡してもらえると助かります.このコーパスの貢献を調査することは,我々にとって非常に有効な情報となります.

作成者 (contributors)

論文 (paper)

No paper. When you refer this corpus, please cite this website's URL.

論文はありません.本コーパスを参照する場合には,本ウェブページのURLを引用してください.

商用利用 (terms of commercial use)

We welcome your commercial use. Please contact the following email addresses. 我々は,皆様の商用利用を歓迎します.下記メールアドレスにご連絡ください.

      • Kana Nakahara (TLO of the Univ. of Tokyo) / 中原 花菜 (東大TLO)

        • nakahara [_at_mark_] todaitlo.jp

      • Shinnosuke Takamichi / 高道 慎之介

        • shinnosuke_takamichi [_at_mark_] ipc.i.u-tokyo.ac.jp

謝辞 (acknowledgement)

本コーパスの構築は,以下のプロジェクトを受けて実施したものです.

リンク (link)