Download from here.
This corpus consists of voices of Japanese Kamishibai (picture card show) and audiobooks. The specifications are as follows.
Voices by a professional speaker: The speaker is acting in a variety of styles and characters.
Structured text: Sentences are structured in chapters, sections, etc.
character name: annotation: Spoken phrases are annotated with the character name.
Illustration: Illustrations of the Kamishibais and books are also stored.
The voice duration is 9 hours, and the number of works is 42.
本コーパスは,紙芝居とオーディオブックの朗読音声からなります.スペックは以下のとおりです.
プロ声優による音声: 話者は,多様なスタイルやキャラクタで演技しています.
構造化テキスト: テキストは,章や節などに構造化されています.
キャラ名: セリフにはそのキャラ名を付与しています.
挿絵・平絵: 作品の画像も含まれています.
音声の長さは9時間で,作品数は42です.
Research only (visit the download page to see the details.)
研究のみ (詳細はダウンロードページを参照)
高道慎之介,中田亘,郡山知樹,丹治尚子,井島勇祐,増村亮,猿渡洋,"J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス," 情報処理学会研究報告, Jun. 2021. (日本語)
Wataru Nakata, Tomoki Koriyama, Shinnosuke Takamichi, Naoko Tanji, Yusuke Ijima, Ryo Masumura and Hiroshi Saruwatari, "Audiobook Speech Synthesis Conditioned by Cross-Sentence Context-Aware Word Embeddings," Proc. The 11th ISCA SSW, Online, Aug. 2021.
本コーパスの構築は,以下のプロジェクトを受けて実施したものです.
東京大学 GAPファンドプログラム「音声合成技術の研究開発・商用利用を加速させる音声コーパスの設計・構築」