J-KAC: Japanese Kamishibai and audiobook corpus
ダウンロード (download)
Download from here.
内容 (description)
This corpus consists of voices of Japanese Kamishibai (picture card show) and audiobooks. The specifications are as follows.
Voices by a professional speaker: The speaker is acting in a variety of styles and characters.
Structured text: Sentences are structured in chapters, sections, etc.
character name: annotation: Spoken phrases are annotated with the character name.
Illustration: Illustrations of the Kamishibais and books are also stored.
The voice duration is 9 hours, and the number of works is 42.
本コーパスは,紙芝居とオーディオブックの朗読音声からなります.スペックは以下のとおりです.
プロ声優による音声: 話者は,多様なスタイルやキャラクタで演技しています.
構造化テキスト: テキストは,章や節などに構造化されています.
キャラ名: セリフにはそのキャラ名を付与しています.
挿絵・平絵: 作品の画像も含まれています.
音声の長さは9時間で,作品数は42です.
使い方 (terms of use)
Research only (visit the download page to see the details.)
研究のみ (詳細はダウンロードページを参照)
作成者 (contributors)
論文 (paper)
高道慎之介,中田亘,郡山知樹,丹治尚子,井島勇祐,増村亮,猿渡洋,"J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス," 情報処理学会研究報告, Jun. 2021. (日本語)
Wataru Nakata, Tomoki Koriyama, Shinnosuke Takamichi, Naoko Tanji, Yusuke Ijima, Ryo Masumura and Hiroshi Saruwatari, "Audiobook Speech Synthesis Conditioned by Cross-Sentence Context-Aware Word Embeddings," Proc. The 11th ISCA SSW, Online, Aug. 2021.
謝辞 (acknowledgement)
本コーパスの構築は,以下のプロジェクトを受けて実施したものです.
東京大学 GAPファンドプログラム「音声合成技術の研究開発・商用利用を加速させる音声コーパスの設計・構築」