tri-jek: Japanese-English-Korean tri-lingual speech corpus

Download / ダウンロード

Click here. [Google Drive link, zip 1.5 GB]
(sample: Japanese, Korean, and English)

Description / 内容

This corpus consists of reading-style speech data uttered by a female tri-lingual speaker. / このコーパスは,単一のトリリンガル話者による,読み上げ音声です.

  • Speaker: a female speaker / 話者:単一の女性話者

    • Japanese (native), Korean (native), English / 日本語(ネイティブ)・韓国語(ネイティブ)・英語

  • Duration: 11 hours / 時間長:11時間

    • 2.8 (ja), 6.7 (kr), and 1.5 (en) hours / 2.8 (日),6.7 (韓),1.5 (英) 時間

  • Sampling rate: 24 kHz / サンプリング周波数:24 kHz

Note / 注意

Our audio recording was done during the Covid-19 pandemic, so the quality is not as good as studio recordings. For example, clipping distortion and background noise were observed in the recordings. We have removed these in post-processing, but it is not perfect.
音声収録はコロナ禍に実施されたため,スタジオ収録ほど高品質ではありません.例えば,収録音声には,クリッピング歪や背景雑音の混入が認められました.我々は,後処理でこれらの除去を行いましたが,完璧ではありません.

Terms of use / 使い方

The text data is licensed as follows. / テキストデータは以下のようにライセンスされています

The audio data may be used for the following cases. / 音声データは,以下の場合に限り使用可能です.

  • Research by academic institutions / アカデミック機関での研究

  • Non-commercial research, including research conducted within commercial organizations / 非商用目的の研究(営利団体での研究も含む)

  • Personal use, including blog posts. / 個人での利用(ブログなどを含む)

Re-distribution is not permitted, but you can upload a part of this corpus (e.g., ~50 audio files) in your website or blog. If possible, please let me know when you revealed papers, blog posts, and others. It will be very helpful to investigate contributions of this corpus.
音声データの再配布は認められていませんが,あなたのウェブページやブログなどでコーパスの一部(例えば,50文程度)を公開することは可能です.できれば,あなたが論文やブログポスト等の成果を公開した際には,私まで連絡してもらえると助かります.このコーパスの貢献を調査することは,我々にとって非常に有効な情報となります.

Contributors / 作成者

三澤 颯大

Sota Misawa

丹治 尚子

Naoko Tanji

Paper / 論文

(TBA)

Terms of commercial use / 商用利用

We welcome your commercial use. We have higher-quality (48 kHz sampling rate) audio. Please feel free to contact the following members for your commercial use. Note that, as described above, our recordings have some distortions.
我々は本コーパスの商用利用を歓迎します.我々は更に高品質(48 kHzサンプリング)の音声ファイルを用意しております.商用利用をご希望の場合は,下記アドレスにご連絡下さい.ただし,上記の説明の通り,この音声には歪みが含まれます.

    • Kana Nakahara (TLO of the Univ. of Tokyo) / 中原 花菜 (東大TLO) ... nakahara [_at_mark_] todaitlo.jp

    • Shinnosuke Takamichi / 高道 慎之介 ... shinnosuke_takamichi [_at_mark_] ipc.i.u-tokyo.ac.jp

Acknowledgement / 謝辞

本コーパスの構築は,以下のプロジェクトを受けて実施したものです.

Link / リンク (link)