JECS: Japanese-English code-switching
speech corpus

Download / ダウンロード

Click here. [Google Drive link, zip 0.4 GB]

Description / 内容

This corpus consists of parallel utterance of Japanese, English, their code-switching. このコーパスは,日本語・英語・コードスイッチングのパラレル発話からなります.

  • Normal text / 通常の発話

    • Japanese: 非常に生産にコストがかかります

    • English: The production cost is very high.

  • Word-emphasized utterance / 単語を強調した発話

    • Japanese: それが数々のトラブルに見舞われた

    • English: It went through many troubles.

    • Code-switching: それが数々の trouble に見舞われた

  • Emotion (only small amount) / 感情発話 (少量のみ)

    • Japanese: それが数々のトラブルに見舞われた

    • English: It went through many troubles.

    • Code-switching: それが数々の trouble に見舞われた

The specifications are as follows. / スペックは以下のとおりです.

  • Sampling rate: 24kHz / サンプリング周波数: 24kHz

  • Emotion (acted): neutral, sad, happy, angry / 感情(演技): 通常,喜怒哀

  • Duration: 2.5 hours / 長さ: 2.5時間

  • Speaker: bilingual voice actor / 話者: バイリンガルの声優

  • Recording: recording studio / 収録: スタジオ

  • Code-switch text design: contributors and speaker / コードスイッチング文の作成: 作成者と話者

Terms of use / 使い方

The text data is licensed as CC BY 3.0. The audio data may be used for

      • Research by academic institutions

      • Non-commercial research, including research conducted within commercial organizations

      • Personal use, including blog posts.

Any use that will violate public order and standards of decency are prohibited. Re-distribution is not permitted, but you can upload a part of this corpus (e.g., ~5 audio files) in your website or blog. If possible, please let me know when you revealed papers, blog posts, and others. It will be very helpful to investigate contributions of this corpus.

テキストデータは CC BY 3.0ライセンスされております.音声データは,以下の場合に限り使用可能です.

      • アカデミック機関での研究

      • 非商用目的の研究(営利団体での研究も含む)

      • 個人での利用(ブログなどを含む)

公序良俗に反する利用は認められていません.音声データの再配布は認められていませんが,あなたのウェブページやブログなどでコーパスの一部(例えば,5文程度)を公開することは可能です.できれば,あなたが論文やブログポスト等の成果を公開した際には,私まで連絡してもらえると助かります.このコーパスの貢献を調査することは,我々にとって非常に有効な情報となります.

Contributors / 作成者

中野 嘉文

Yoshifumi Nakano

森松 亜依

Ai Morimatsu

佐伯 高明

Takaaki Saeki

Paper / 論文

(TBA)

Acknowledgement / 謝辞

本コーパスの構築は,以下のプロジェクトを受けて実施したものです.

Link / リンク