基本周波数(fo)

このページで使うサンプルファイルは以下の通りです。右上に表示されるアイコンをクリックするとGoogle Driveを開くことができます。 

ピッチに関わる諸現象(たとえば,日本語のアクセントやイントネーション)を音響音声学的に調べるときには,たいてい基本周波数(fundamental frequency; fo)をみます。今回から数回にわたってfoの分析の仕方を扱います。なお、基本周波数はかつてはF0(エフゼロ)と呼ぶのが一般的でしたが、最近では(フォルマントと紛らわしいので)fo(エフオー)と呼ぶことが提案されています(Titze et al. 2015, 榊原他 2017)。(このホームページでも以前はF0を用いていましたが、foに直しました。なお、oは下付き文字で表記すべきところですが、ウェブページ上では下付き文字にするのが難しいので、このページでは便宜上普通の小文字で表記しています。)

(1)Praatでfoを測定する

Praatでfoを測定するための方法はいろいろあります。最も簡単な方法は,SoundEditorを用いるというものです。

サンプルファイル ame.wav を読み込み,Editを押してSoundEditorを開いてみましょう。

SoundEditor上で青い線で示されているのがfoです。もし青い線が表示されていなかったら,上部メニューのPitchにおいてShow Pitchにチェックを入れましょう。

さて,このサンプルファイルは頭高型の「雨」と平板型の「飴」を発音したものです。foにどのような違いがあるでしょうか?

(2)子音の影響

foを分析する上で特に注意しなければいけないのは,foが子音の影響を受けやすいということです。例えば,サンプルファイル ame_take_kaze.wav のfoをSoundEditorで確認してみましょう。

上の図は,1番目の単語が「飴」,2番目が「竹」,3番目が「風」です。いずれも平板型で発音されており,また第1モーラの母音が/a/,第2モーラが/e/という点も共通しています。それにも関わらず,三つの発話のfoにはかなり違いがあることが見てとれると思います。具体的に,どこがどう違っているでしょうか?

子音の中には,foに影響を与えやすいものと与えにくいものがあります。一般には,阻害音(たとえば,破裂音,破擦音,摩擦音)はfoに影響を与えやすく,共鳴音(たとえば,鼻音,接近音)は影響を与えにくい傾向にあります。

言語学においてfoを分析するのはたいてい,アクセントやイントネーションを調べるような場合です。そのような場合,子音の影響というのは,本来注目したいアクセントやイントネーションを反映したfoパターンを歪めているものと位置づけられます。アクセントやイントネーションを分析する上では,子音の影響は最小限に抑えたいわけであり,したがって,foに影響を与えやすい子音を含まないような単語や文を用いて分析した方が,分析がしやすいということになります。

(3)母音のintrinsic fo

持続時間の測定の際に,intrinsic vowel duration という現象を扱いました。これと同様に,母音のintrinsic foというものも知られています("intrinsic F0" という呼び方の方が定着しているかもしれませんが)。一般に,同一条件下では,母音の開口度が狭い/舌が高いほどfoが高くなる傾向にあることが知られています。この傾向はこれまでに様々な言語で確認されています(Whalen & Levitt 1995 参照)。この現象もfoを分析する上で気をつけなければいけないものです。

なお,(2)や(3)で取り上げた現象は,持続時間のところでも述べたmicroprosodyと呼ばれるものの一種です。

(4)Pitchオブジェクト

foの計測は上で述べたようにSoundEditor上で行うこともできますが、これとは別にPitchオブジェクトを使って計測することもできます。

まず、ame.wav のうち、最初の「雨」の発音だけを切り出しましょう。SoundEditorで該当区間を選択した状態で、SoundEditorの上部メニュー Sound から Extract selected sound (time from 0) を選んで実行することで、この区間を切り出したSoundオブジェクトを作ることができます。新たに作られたこのオブジェクトは、Objectウィンドウ上では Sound untitled と表示されているはずです。これだとわかりにくいので、ame1とでも名前を変えておきましょう。

次に、Objectウィンドウ上でこのオブジェクトを選択し、右メニューから Analyse periodicity > To Pitch... を選び実行しましょう(設定画面が現れますが、ひとまずデフォルトのままでOKを押しましょう)。これにより、Pitchオブジェクトを作ることができます。

このようにして作られたPitchオブジェクトに対し、様々なコマンドを実行することができます。例えば、Pitchオブジェクトを選択した状態で右側に表示されるメニューのうち、Queryでは様々な計測ができます。例えば、Get mean... により、当該Pitchオブジェクト全体の平均foを求めることができます。このようにPitchオブジェクトに対して実行可能なQuery内のコマンドを用いるという方法は、特にスクリプトを用いてfoを計測する際に有用です。

さて、Pitchオブジェクトの右側メニューのうち View & Edit を実行すると、下の図のようなピンクの点が現れます。

ここでは、fo曲線の修正ができます。たとえば、特定の区間を選択し、上部メニューの Pitch から Unvoice を実行すると、その区間のピンクの点が消えます。

つづいて、Pitchオブジェクトから図を作成してみましょう。Objectウィンドウ上でPitchオブジェクトを選択した状態で右側メニューからDrawを押すと、図を作成するためのコマンドがいくつか表示されます。このうち代表的なのは、Draw... と Speckle... です。Draw... はピクチャーウィンドウ上にfoを線で描きます。一方、Speckle... はfoを点で描きます。お薦めはSpeckle... のほうです。子音の影響によるmicroprosodyやfoの誤検出とそうでないところとを判別しやすいからです。

TextGridと合わせた図を作ることもできます。Sound ame1に対応するTextGridを作り、セグメンテーションしてa, m, eのラベルをつけたとします。オブジェクトウィンドウ上で、このTextGridとPitchを同時に選択してDrawすると、foとセグメント情報を組み合わせた図を作ることができます。以下の図は、このようにして作った図をPNGファイルとして保存したものです。

参照文献

榊原健一・竹本浩典・北村達也 (2017) 「Q&Aコーナー」『日本音響学会誌』73 (5), 301. [Link]

Titze, I.R., et al. (2015). Toward a consensus on symbolic notation of harmonics, resonances, and formants in vocalization. Journal of the Acoustical Society of America 137, 3005-3007. [Link]

Whalen, D.H. & A.G. Levitt (1995) The universality of intrinsic F0 of vowels. Journal of Phonetics 23, 349-366. [Link]