JVNV: a Japanese emotional speech corpus with both verbal content and nonverbal vocalizations (言語音声と非言語音声を持つ日本語感情音声コーパス)

Download / ダウンロード

Click here. [zip 1.7 GB]

Description / 内容

 JVNV (Japanese emotional speech corpus with Verbal content and Nonverbal Vocalizations) is a Japanese emotional speech corpus with both verbal content and nonverbal expressions used in daily conversations such as laughter, and sobbing that can express emotions. The corpus consists of 3.94 hours of speech from 4 speakers with 6 emotions (anger, disgust, fear, happiness, sadness, and surprise). Each utterance of JVNV expresses a certain emotion, the duration of each NV phrase is also provided.

 Compared to previous emotional speech corpora, JVNV has the following novel features:

 Specification:


 JVNV (Japanese emotional speech corpus with Verbal content and Nonverbal Vocalizations) は,言語音声と非言語音声から成る日本語感情音声コーパスです.非言語音声には,感情を表す笑い声や泣き声のような,日常会話で使用されるものが含まれます.コーパスには,4 話者・6 感情(怒り,嫌悪,恐れ,幸せ,悲しみ,驚き)による 3.94 時間の音声が含まれます.各発話は,指定された感情を表現しており,少なくとも1つの非言語音声を含みます.音声と書き起こしテキストに加え,本コーパスには各発話の非言語発話の時間区間が含まれます.

 既存の感情音声コーパスと比較して,JVNVコーパスは以下の特徴を持ちます.

 スペックは以下のとおりです. 

License / ライセンス

Contributors / 作成者

Paper / 論文

Acknowledgement / 謝辞

本コーパスの構築は,以下のプロジェクトを受けて実施したものです.

Link / リンク