JECS: Japanese-English code-switching
speech corpus
Download / ダウンロード
Click here. [Google Drive link, zip 0.4 GB]
Description / 内容
This corpus consists of parallel utterance of Japanese, English, their code-switching. このコーパスは,日本語・英語・コードスイッチングのパラレル発話からなります.
Normal text / 通常の発話
Japanese: 非常に生産にコストがかかります
English: The production cost is very high.
Word-emphasized utterance / 単語を強調した発話
Japanese: それが数々のトラブルに見舞われた
English: It went through many troubles.
Code-switching: それが数々の trouble に見舞われた
Emotion (only small amount) / 感情発話 (少量のみ)
Japanese: それが数々のトラブルに見舞われた
English: It went through many troubles.
Code-switching: それが数々の trouble に見舞われた
The specifications are as follows. / スペックは以下のとおりです.
Sampling rate: 24kHz / サンプリング周波数: 24kHz
Emotion (acted): neutral, sad, happy, angry / 感情(演技): 通常,喜怒哀
Duration: 2.5 hours / 長さ: 2.5時間
Speaker: bilingual voice actor / 話者: バイリンガルの声優
Recording: recording studio / 収録: スタジオ
Code-switch text design: contributors and speaker / コードスイッチング文の作成: 作成者と話者
Terms of use / 使い方
The text data is licensed as CC BY 3.0. The audio data may be used for
Research by academic institutions
Non-commercial research, including research conducted within commercial organizations
Personal use, including blog posts.
Any use that will violate public order and standards of decency are prohibited. Re-distribution is not permitted, but you can upload a part of this corpus (e.g., ~5 audio files) in your website or blog. If possible, please let me know when you revealed papers, blog posts, and others. It will be very helpful to investigate contributions of this corpus.
テキストデータは CC BY 3.0 でライセンスされております.音声データは,以下の場合に限り使用可能です.
アカデミック機関での研究
非商用目的の研究(営利団体での研究も含む)
個人での利用(ブログなどを含む)
公序良俗に反する利用は認められていません.音声データの再配布は認められていませんが,あなたのウェブページやブログなどでコーパスの一部(例えば,5文程度)を公開することは可能です.できれば,あなたが論文やブログポスト等の成果を公開した際には,私まで連絡してもらえると助かります.このコーパスの貢献を調査することは,我々にとって非常に有効な情報となります.
Contributors / 作成者
中野 嘉文
Yoshifumi Nakano
森松 亜依
Ai Morimatsu
Takaaki Saeki
Paper / 論文
(TBA)
Acknowledgement / 謝辞
本コーパスの構築は,以下のプロジェクトを受けて実施したものです.
日本学術振興会 科学研究費補助金(基盤A) "ビスポーク音声デザインの骨格形成と体系化"
日本学術振興会 科学研究費補助金(基盤S) "多元自動通訳システムと評価法に関する研究とその応用展開"