JMD: Japanese multi-dialect corpus for speech synthesis

ダウンロード (download)

frequent updates (順次更新予定)

Looking for dialect speakers (方言話者を探しています)

 音声言語の文化を計算機的に残すために,我々は音声合成技術(音声を人工的に作り出す技術)と方言コーパス(音声言語のデータベース)の構築を進めています.音声合成を支える昨今の機械学習技術(人工知能技術)は日々進歩しており,自らの母語でない言語の音声合成も,可能になりつつあります.この現状で,音声合成用の音声コーパスを構築して一般に公開すること(すなわち,方言音声コーパスの公共化は,音声合成技術を更に発展させることだけでなく,前述した方言文化の保存に強く貢献できると,我々は確信しております.

 我々はこの活動を継続する予定です.もし,自らの方言をご提供くださる方がいらっしゃいましたら,home のメールアドレスまでご連絡下さい.収録方法,配布形態やデータサイズなどのご要望があれば,それも合わせてご連絡下さい.

内容 (description)

This corpus consists of voices of Japanese dialect for speech synthesis. The specifications are as follows.

  • Native dialect speaker's voice: The voices are uttered by a native dialect speaker.

  • Middle-size audio: 2+ hours audio are stored for each dialect.

本コーパスは,音声合成のための日本語方言コーパスです.スペックは以下のとおりです.

  • ネイティブ方言話者による発話: 全ての音声は,その方言のネイティブ話者により発話されました.

  • 中規模の音声: 各方言で2時間以上の音声が収録されています.

使い方 (terms of use)

All the data may be used for

  • Research by academic institutions

  • Non-commercial research, including research conducted within commercial organizations

  • Personal use, including blog posts.

Any use that will violate public order and standards of decency are prohibited. Re-distribution is not permitted, but you can upload a part of this corpus (e.g., ~3 audio files) in your website or blog. If possible, please let me know when you revealed papers, blog posts, and others. It will be very helpful to investigate contributions of this corpus.

データは,以下の場合に限り使用可能です.

  • アカデミック機関での研究

  • 非商用目的の研究(営利団体での研究も含む)

  • 個人での利用(ブログなどを含む)

公序良俗に反する利用は認められていません.データの再配布は認められていませんが,あなたのウェブページやブログなどでコーパスの一部(例えば,3文程度)を公開することは可能です.できれば,あなたが論文やブログポスト等の成果を公開した際には,私まで連絡してもらえると助かります.このコーパスの貢献を調査することは,我々にとって非常に有効な情報となります.

作成者 (contributors)

引用 (Reference)

Shinnosuke Takamichi, "JMD: Japanese multi-dialect corpus," https://sites.google.com/site/shinnosuketakamichi/publication/research-topics/jmd_corpus

謝辞 (acknowledgement)

本コーパスの構築は,以下のプロジェクトを受けて実施したものです.

リンク (link)