JSUT-vi

The JSUT Collection is Japanese speech corpora connecting speech, song, and audio events. The JSUT-vi corpus is a part of the JSUT Collection.

JSUT コレクションは,声・歌・音声模倣をつなげるための音声コーパスです.このJSUT-vi コーパスは,JSUT コレクションの一部です.

Report (PDF)

Download/ダウンロード

You can download from here (0.1GB).

ここ (0.1GB) からダウンロード可能です.

(old ver.: None)

Description/内容

This corpus consists of speech data of vocal imitation of audio events by a Japanese speaker. The audio data is sampled at 48kHz and recorded in our anechoic room. The total duration is approximately 13 minutes. The speaker is the same to the JSUT corpus. This corpus also includes reference audio events' data (e.g., audio files of guitar and coin dropping) that the speaker listened and imitated. The audio events' data is a re-distributed version of VocalSketch (The audio events' data are sampled at 44.1 kHz).

このコーパスは,日本語話者による,音響イベントの vocal imitation (音声模倣) の音声データを含みます.音声データは48kHzでサンプリングされ,無響室で収録されました.合計の発話時間は,およそ13分です.発話者は,JSUT コーパス と同じ人です.このコーパスには,発話者が聞いて模倣した,音響イベントのデータ (例えば,ギターの音やコインを落とす音のオーディオデータ) も含まれています.この音響イベントのデータは,VocalSketch に含まれるものの再配布版です.

Terms of use/使い方

The speech data may be used for

      • Research by academic institutions

      • Non-commercial research, including research conducted within commercial organizations

      • Personal use, including blog posts.

If you want to use for commercial purposes, please see below. Re-distribution is not permited, but you can upload a part of this corpus (e.g., ~10 audio files) in your webpage or blog. If possible, please let me know when you revealed papers, blog posts, and others. It will be very helpful to investigate contributions of this corpus.

音声データは,以下の場合に限り使用可能です.

      • アカデミック機関での研究

      • 非商用目的の研究(営利団体での研究も含む)

      • 個人での利用(ブログなどを含む)

営利目的の利用を希望される場合,下記をご覧ください.この音声データの再配布は認められていませんが,あなたのウェブページやブログなどでコーパスの一部(例えば,10個程度)を公開することは可能です.できれば,あなたが論文やブログポスト等の成果を公開した際には,私まで連絡してもらえると助かります.このコーパスの貢献を調査することは,我々にとって非常に有効な情報となります.

Contributors/作成者

      • Shinnosuke Takamichi (@forthshinji, University of Tokyo) / 高道 慎之介 (東京大学)

      • Shota Ikawa (University of Tokyo) / 井川 翔太 (東京大学)

      • Hiroshi Saruwatari (University of Tokyo) / 猿渡 洋 (東京大学)

Bold is the main contributor. 太字が主な作成者です.

Citation/引用

Refer this page.

Terms of commercial use/商用利用

We welcome your commercial use. Please contact the following email addresses.

我々は,皆様の商用利用を歓迎します.下記メールアドレスにご連絡ください.

      • Kana Nakahara (TLO of the Univ. of Tokyo) / 中原 花菜 (東大TLO)

        • nakahara [_at_mark_] todaitlo.jp

      • Shinnosuke Takamichi / 高道 慎之介

        • shinnosuke_takamichi [_at_mark_] ipc.i.u-tokyo.ac.jp

Link/リンク

Saruwatari Lab, the University of Tokyo / 東京大学 猿渡研究室: http://www.sp.ipc.i.u-tokyo.ac.jp/

JSUT corpus: https://sites.google.com/site/shinnosuketakamichi/publication/jsut

JSUT-song corpus: https://sites.google.com/site/shinnosuketakamichi/publication/jsut-song

Acknowledgement/謝辞

A part of this work is supported by the SECOM Science and Technology Foundation.

この実施の一部は,セコム科学技術支援財団の助成を受け実施した.