持続時間の測定とセグメンテーション

このページで使うサンプルファイルは以下の通りです。右上に表示されるアイコンをクリックするとGoogle Driveを開くことができます。

音声学において,時間軸上における物理的な長さのことを「持続時間」(duration)といいます(あるいは,同じ意味で「時間長」「持続時間長」「継続時間」などの用語が用いられることもあります)。持続時間の測定は,実は今までにも出てきました。たとえば,以前に学習したVOTは,破裂と声帯振動開始点の間の持続時間のことです。VOTに限らず,音響音声学においては,様々な部分の持続時間が様々な目的で測定されます。


(1)SoundEditorによる持続時間の計測

Praatで単語や分節音の持続時間を測るための最も手軽な方法は,Sound Editorを利用することです。

母音の計測の際に使った ieaou.wav の音声ファイルを利用し、Sound Editorを立ち上げましょう。そして,音声のうちの任意の範囲を選択してみてください。選択範囲の上と下に時間が表示されます(下の例では0.406746)。これが選択範囲の持続時間です。

(2)ケーススタディー:日本語の母音の長短

日本語には母音に長短の対立があります。「ま」は1モーラ,「まあ」は2モーラで,後者は前者よりも「心理的に」2倍の長さがあると言われることがあります。しかし,物理的にも2倍なのでしょうか?持続時間を測定することにより,この問いに答えることができます。

サンプルファイル ma_maa.wav は「これからマと言います」「これからマーと言います」という発話を含むものです。このうちの「マ」と「マー」の部分の持続時間を測ってみましょう。

補足:なお,「これから・・・と言います」のような文を用いているのは,こうすることで検査語(ここでは「マ」や「マー」)の発音が安定し,また測定しやすくなるためです。このような目的で用いる文を「キャリアセンテンス」といいます。通常,キャリアセンテンスは,検査語が真ん中にくるようになり,どんな検査語を入れても意味的におかしくならないような文を用います。

上の(1)のようにSoundEditorのみを用いて測定してもいいのですが,のちのち記録が残るように,ここではTextGridを利用しましょう(参考:「Praatの基本操作(2):TextGridの利用」)。以前に学習したように,TextGridは,Soundオブジェクトを選択した状態で,Annotate -> To TextGrid... によって作成することができます。今回は以下のようにしてwordというtierを作ることにしましょう。

そして,以下のようにして「マ」と「マー」の区間をマークしてみましょう。

(3)セグメンテーション

上のような作業は,どこが「これから」の最後の母音[a]と「マ」の最初の子音[m]の境界か,どこが「マ」の母音[a]と次の子音[t]の境界かという,境界の画定を伴います。このような作業を「セグメンテーション」(segmentation)といいます。持続時間の測定は常にセグメンテーションを伴います。

問題は,どのようにしてセグメンテーションをすればよいかです。これに関しては,ほとんどの場合、唯一の正解というものは存在しないといってよいでしょう。音声は分節音の連綿とした連なりであって,「わたり」や調音結合を伴っています。そのような音声を分析する上で可能なのは,目的に応じて基準を決め,基準にしたがってセグメンテーションを行うことです。

一般にはセグメンテーションは,スペクトログラムと原波形をもとにして行います。基本周波数やインテンシティーを参考にすることもあります。たとえば,Turk et al.(2006)はこの基準について論じたものです。ただし,この論文で提案する基準も,ひとつの提案に過ぎないということを理解してください。また,藤本他(2006)は,国立国語研究所・日本語話し言葉コーパスの構築作業において用いられた基準をまとめたものです。

ところで,これとは別に,Praat上でセグメンテーションをしていく際にどのようなラベルを用いるかという技術的な問題があります。PraatではIPAで入力することも可能ですが,データを他のアプリケーションソフトで扱う可能性も考えると,よりコンピュータで扱いやすい文字を使ったほうがよさそうです。また,音素レベルで記述するか異音レベルで記述するかという問題もあります。これについても,特に正解はありません。作業全体で一貫したラベルを用いればよいでしょう。(なお,上図におけるma, maHというラベルは,上述の藤本他(2006)に従っています。)

(4)Intrinsic vowel duration

持続時間の分析において注意しなければいけないことの一つに,母音の影響があります。同一条件化では,母音の開口度が広い/舌が低いほど持続時間が長くなることが,様々な言語の研究において知られています。これを intrinsic vowel duration(あるいは単に intrinsic duration)といいます(Lehiste 1970,Beckman 1986 参照)。サンプルファイル mi_me_ma_mo_mu.wav は,日本語の5母音を含むものです。このファイルを用いて,intrinsic vowel durationが日本語にも観察されるか,調べてみましょう。

Intrinsic vowel durationは,持続時間の分析において重要です。たとえば,「ミ」と「マー」の母音の持続時間を比べて,後者の方が長かったとします。このことから,「長母音と短母音では長母音の方が持続時間が長い」と結論付けることはできません。なぜなら,後者が長かったのは,もしかしたら intrinsic vowel duration のせいかもしれないからです。では,intrinsic vowel durationの要因を取り除き,純粋に長母音と短母音を比べたかったら,どのような調査をすればよいでしょうか?

ところで,intrinsic vowel durationに限らず,韻律の諸特性は様々なかたちで分節音の影響を受けます。これをmicroprosodyと呼ぶことがあります。後で出てくる基本周波数の分析においても,microprosodyが登場します。

参照文献

Beckman, Mary E. (1986). Stress and non-stress accent. Dordrecht: Foris.

藤本雅子・菊池英明・前川喜久雄 (2006) 「分節音情報」 『国立国語研究所報告124 日本語話し言葉コーパスの構築法』 国立国語研究所. [報告書のページ] (PDFをダウンロードできる)

Lehiste, Ilse (1970). Suprasegmentals. Cambridge, MA: MIT Press.

Turk, A., Nakai, S., & Sugahara, M. (2006). Acoustic segment durations in prosodic research: A practical guide. In S. Sudhoff, D. Lenertova, R. Meyer, S. Pappert & P. Augurzky (Eds.), Methods in empirical prosody research (pp. 1-27). Berlin: Walter De Gruyter.