Coco-Nut: Corpus of Japanese Utterance and Voice Characteristics Description for Prompt-based Control / 自由記述文による声質制御に向けた多話者音声・声質自由記述ペアデータセット
Download / ダウンロード
Description / 内容
This corpus is designed for text prompt-based control of speech characteristics. It includes:
Speech
Content prompt: text transcriptions of speech
Characteristics prompt: free-form descriptions that express characteristics of speech. Examples are:
"A young woman in her twenties is speaking slowly with a sweet, clinging voice."
"A middle-aged cheerful man is speaking in a clear voice, addressing in a questioning manner."
"A young man is speaking in a high-pitched voice, as if he is excited."
Specifications:
Language: Japanese
Data source: YouTube
The number of utterances: approx. 7600
Duration: approx. 8 hours
The number of characteristics prompts: 1 per utterance in training data, and 5 per utterance in validation/test data.
本コーパスは,自由記述に基づく声質制御のために設計されています.コーパスには,以下の内容が含まれます.
音声
読み上げ文 (内容プロンプト):音声の書き起こし文
声質表現文 (声質プロンプト):声質の自由記述文.例は以下の通り.
”30代くらいの男性の声。ゆっくりと穏やかな話し方でした。苦悩に満ちた、けだるそうな声でした。”
”元気な男性が明るい声で、テンション高く発表をするように喋っている。”
”若い女性が、抑揚のある声で、ゆっくりと喋っている”
スペック:
言語:日本語
データソース:YouTube
発話数:約7600
長さ:約8時間
声質表現分の数:学習データでは 1 文 / 発話.検証・評価データでは異なる 5 文 / 発話.
License / ライセンス
See the download pages.(TBD)
Contributors / 作成者
Paper / 論文
Aya Watanabe, Shinnosuke Takamichi, Yuki Saito, Wataru Nakata, Detai Xin, Hiroshi Saruwatari, "Coco-Nut: Corpus of Japanese Utterance and Voice Characteristics Description for Prompt-based Control," Proc. ASRU, Dec. 2023.
渡邊 亞椰,高道 慎之介,齋藤 佑樹,辛 徳泰,猿渡 洋,"Coco-Nut: 自由記述文による声質制御に向けた多話者音声・声質自由記述ペアデータセット," 日本音響学会2023年秋季研究発表会, 2023.
Acknowledgement / 謝辞
本コーパスの構築は,以下のプロジェクトを受けて実施したものです.
科研費 21H04900
科研費 22H03639
科研費 23H03418
JST創発的研究支援事業 JP23KJ0828
ムーンショット JPMJPS2011
Link / リンク
Inquiry / お問い合わせ
Please contact to Shinnosuke Takamichi.
コーパスに関するお問い合わせは 高道 慎之介 までご連絡下さい.