音声収録に関して以下の課題を実施し、略式レポート(表紙不要)にまとめて提出せよ。
本課題は単著での提出のみ受けつける.
音声の収録をおこなう.収録した音声はPCで扱うことのできる音声ファイルとする必要がある.
音声ファイルの基本的な扱いと注意点についてコマンド操作を通して体験する.
以下の音声を収録せよ、なお収録機器及び話者は全データにおいて統一しておくこと。
- 数字発声 (~/OUSLP/work/speech/digit/) 50個 ... digit.txt
- ぜろ d1-0.wav, d2-0.wav, d3-0.wav, d4-0.wav, d5-0.wav
- いち d1-1.wav, d1-1.wav, d2-1.wav, d4-1.wav, d5-1.wav
- に d1-2.wav, d1-2.wav, d3-2.wav, d4-2.wav, d5-2.wav
- さん
- よん
- ご
- ろく
- なな
- はち
- きゅう d1-9.wav, d2-9.wav, d3-9.wav, d4-9.wav, d5-9.wav
- 音素バランス文 (~/OUSLP/work/speech/balance/a01.wav ~ a50.wav) 50文 ... balance.txt
- 小説読み上げ文 (~/OUSLP/work/speech/novel1/n101.wav ~ n105.wav) 5文 ... novel1.txt
- n101 吾輩(わがはい)は猫である。
- n102 薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。
- n103 この書生というのは時々(ときどき)我々を捕(つかま)えて煮(に)て食うという話である。
- n104 そうして,その穴の中から時々ぷうぷうと煙けむりを吹く。
- n105 腹が非常に減って来た。泣きたくても声が出ない。
- コマンド文 (~/OUSLP/work/speech/cmd1/) 5文 ... cmd1.txt
- ハクトウをください。 c101.wav
- ピオーネをください。 c102.wav
- 4個お願いします。 c103.wav
- マスカットを5個ください。 c104.wav
- バナナを3個お願いします。 c105.wav
各自のPCとマイクで収録する.収録には arayuru-py などを用いると便利である.
音声の形式は以下の通りとする。
- ヘッダー ・・・ RIFF (.wav)
- サンプリングレート ・・・ 16,000 Hz
- チャネル数 ・・・ 1 (モノラル)
- ビット数 ・・・ 16 bit (signed short)
- バイトオーダー ・・・ Little Endian (RIFFの仕様)
- 圧縮符号化方式 ・・・ Linear-PCM
レポートとしては、収録に利用した機器、環境、手順、ファイル形式などについてまとめておくこと。
実習1「音声ファイルの扱い方」を行って、その実行結果を利用しながら、音声ファイルのデータ形式についてまとめよ。
なお、音声データの図を貼り付ける場合は、キャプションか本文でその発話内容が読み取れるようにすること。
- できるだけ静かな部屋で録る
- 阿部研究室の防音室(4号館702室)を利用したい場合は、原か阿部研の学生にアポイントメントをとってください
- 音が割れる(最大振幅を越える)事がないように注意しましょう
- 目安は最大振幅が16000 (全体の1/2)を超えない程度
- ヘッドセットマイク等の距離を固定できるマイクを利用した方が良い
- 距離が𝑛倍になると音圧はおよそ2^(−𝑛)倍になる
- マイクに息がかからない位置に固定する
- たぶん,とっても疲れます
- 最初に収録した音声と最後に収録した音声を聞き比べてみるのも面白いだろう
参考:ヘッドセットマイクのジャック