母音のフォルマント

このページで使うサンプルファイルは以下の通りです。右上に表示されるアイコンをクリックするとGoogle Driveを開くことができます。

ここでは,Praatでフォルマントの測定を行う方法を学んでいきます。(「フォルマント」とは何かについては,ここでは扱いません。ページ末尾の文献案内参照。)サンプルファイルとして、ieaou.wav を用います。

(1) SoundEditorでフォルマントを測定する

分析するSoundオブジェクトを選択し,いつものようにView & Editを押してSoundEditorを開きましょう。サンプルファイルは「イ,エ,ア,オ,ウ」を5回発音したものです。とりあえず1回目の「イ,エ,ア,オ,ウ」の部分だけズームしてみましょう。

設定によっては青い線(基本周波数)や黄色い線(インテンシティー)や赤い線(フォルマント)が見えるかもしれません。今はスペクトログラムがよく見えるように,それらの線を出さないようにしておきましょう。以下の手順で線を出さないようにすることができます。SoundEditorの上部メニューから

  • Pitch -> Show pitchのチェックを外す

  • Intensity -> Show intensityのチェックを外す

  • Formant -> Show formantsのチェックを外す

さて,フォルマントとは何か?理論的な話をはぶいて感覚的に説明するならば(本当は理論的なところから理解しておくべきですが),スペクトログラム上に現れた濃く黒い横棒のことです。下から順に第1フォルマント(F1),第2フォルマント(F2),・・・といいます。たとえば,「イ」の第1フォルマントは,下図のカーソルをあてたあたりの周波数にあります。

Praatでは,フォルマントの周波数を推定してくれる機能があります。最も手軽なのは,SoundEditor上で上部メニューからShow formantsにチェックを入れるという方法です。以下のように表示されるはずです。

ただし,正確に測るには,設定を少し変更するのがおすすめです。SoundEditorの上部メニュー Formantから,Formant settingsを選んでください。以下の設定ウィンドウが立ちあがるはずです。

女性の音声の場合にはこのデフォルトの設定のままでいいのですが,男性の音声の場合にはMaximum formantを5000に変えた方がいいでしょう。変更してOKを押してください。今度は赤い点々が以下のように表示されるはずです。先ほどとの違いがわかるでしょうか?

特に顕著な違いは,4番目の「オ」に見られます。「オ」は第1フォルマントと第2フォルマントが接近しているため,先ほどは両者がひとつのフォルマントとして誤って捉えられてしまっていたのです。変更した後の設定では,第1フォルマントと第2フォルマントは適切に検出されました。

さて,赤い点々で示されたフォルマントの値を記録しましょう。フォルマントを知りたい時点にカーソルをあてた状態で上部メニューからFormant -> Formant listingとすれば,値を表示してくれます。上のサンプルにおける「イ」の場合,F1は約280Hz,F2は約2300 Hzほどになるはずです。

(2) スペクトルを見る

フォルマントを調べるためのもう一つの方法として,スペクトルを見るという方法があります。

上でみたSoundEditor上で,例えばiの中心付近50ms (0.05 秒) ほどを選択してください。

そして,SoundEditorの上部メニューから,Spectrum -> View spectral sliceを選択してください。これは,選択した範囲のスペクトルを示すという機能です(「高速フーリエ変換」(Fast Fourier Transform; FFT)という手法が用いられています)。以下のウィンドウが立ちあがるはずです。

以前にも学んだように,スペクトルの表示においては,横軸が周波数,縦軸が振幅となります。

このスペクトルを見ると,縦方向のギザギザがいくつも現れているのがわかります。そのうちのいくつかは,振幅が大きめに現れています。例えば,280 Hz付近と2400Hz付近の振幅が大きいことがわかるでしょう。これは,先ほどスペクトログラム上で見た第1フォルマント,第2フォルマントの値と近いものです。

しかし,このFFTのスペクトル上で振幅のピークをとってフォルマントとみなすのは,良い方法ではありません。スペクトル上のギザギザは倍音を反映したものであって,フォルマントそのものではないのです。

フォルマントを測る上でより適した方法は,LPC(linear predictive coding; 線形予測符号化)というものです。以下の図は,FFT(黒線)とLPC(赤線)によるスペクトルを比較したものです。ピークの位置に若干ずれがあることがわかるでしょう。ここではズレはさほど顕著ではありませんが,場合によってはピークの値にかなり顕著な違いが現れることがあります。

実は,PraatにおいてSoundEditor上で赤い点々で示されるフォルマントは,このLPCで計算されたものです。したがって,(設定さえ適切であれば)上の(1)でみた方法によってフォルマントはかなり正確に測定できることができるのです。

(3) 散布図を作成する

フォルマントの計測結果はしばしば、F1とF2を軸とした散布図として示します。このとき、しばしばF1を縦軸、F2を横軸とし、どちらの軸も反転させる(つまり、下から上へ大きく、右から左へ大きく)という図の描き方をすることがあります(なお、横軸をF2のかわりにF1とF2の差にすることもあります)。このような軸の取り方に本質的な意味があるわけではないのですが、調音音声学(およびそれにもとづいて作られた国際音声記号)の母音チャートと対応付けて理解するために、このような図の描き方をすることがあります。以下では、Praatの操作法からは離れますが、ExcelやRでこのような散布図を描く方法を(かいつまんで)紹介します。


【Excelによる方法】

  • シートのA列に母音、B列にF1、C列にF2を入力する。

  • 挿入 -> グラフ -> 散布図

(系列の変更)

  • グラフのデザイン -> データの選択

  • 編集をクリック

  • 系列Xの上向き矢印を選択し、F2の値が入力されている範囲を選択、下向き矢印をクリック

  • 系列Yの上向き矢印を選択し、F1の値が入力されている範囲を選択、下向き矢印をクリック

(軸を反転)

  • 図の横軸付近をクリックし、「軸のオプション」において「軸を反転する」にチェックを入れる

  • 図の縦軸付近をクリックし、「軸のオプション」において「軸を反転する」にチェックを入れる

(軸ラベルの挿入)

  • 図をクリックして選択し、+ボタンを押し、軸ラベルにチェックを入れる

  • 縦軸、横軸それぞれのラベルをクリックし、軸ラベルを入力する。(縦軸はF1、横軸はF2)

(母音ラベルを挿入)

  • 図を選択し+ボタンを押し、データラベルの▶を押し、「その他のオプション」を選択

  • ラベルの内容に何かチェックが入っていたらチェックを外す

  • 「セルの値」の「範囲の選択」を押し、Excelシート上の母音ラベルが入力されている範囲を選択する


【Rによる方法】

ggplot2による方法:Making vowel plots in R (Part 1) (Joey Stanley)

vowelsパッケージによる方法: CRAN > vowels

文献案内

(母音のフォルマントについて理解するための文献)

川原繁人(2018)『ビジュアル音声学』三省堂.【3.3 共鳴、3.4.1 日本語の母音、3.4.2 英語の母音】

Johnson, Keith (2012) Acoustic and auditory phonetics, third edition. Chichester: Wiley-Blackwell. [Chapter 6: Vowels.]