以下の課題を実施して、略式レポート(表紙ページは不要)にまとめて提出せよ。
また、本テーマに関連していれば課題以外の内容を実施してレポートとしてまとめても良い。
雑音を含む音声のパワー値[dB]を、GMMによってモデル化する。
モデル化にはSPTKのコマンドを使用する(実習4を参照)。
ここでは、以下の学習用データと評価用データを利用する。
学習用データファイル(Training data):
~/OUSLP/sample/noisy_f/FKN_SD_A01_N1.f
評価(Test)用データファイル(Test data):
~/OUSLP/sample/noisy_f/FKN_SD_A02_N1.f
学習用データのパワー値[dB]をモデル化するために、1混合から5混合までのGMMを作成せよ。
作成したGMMそれぞれに対して、学習用データと評価用データの平均対数尤度を求めて、図示せよ。
図:横軸(混合数)、縦軸(平均対数尤度)、系列(学習用データ、評価用データ)
また、その結果に対する考察を述べよ。
学習用データのパワー値の相対頻度分布図(ヒストグラム)とGMMの確率密度分布を並べて*,あるいは,重ねて図示せよ。
GMMは1混合と2混合だけで構わない。
図:横軸(パワー [dB])、縦1軸(相対頻度値)、縦2軸(GMMの確率密度分布関数の値)
結果からわかることを述べ、さらに考察を述べよ。
* 並べて描く場合は少なくも二つの図の横軸の範囲が共通とみなせるように注意して作成すること.
例えば,ヒストグラムの図の横軸を0 dBから70 dBで描くならば,gmmの図も0 dBから70 dBの範囲で描きなさい,ということである.
学習回数を5回、10回、50回、100回に変更して学習されたGMMを作成せよ。
GMMの混合数は2混合、3混合、4混合とする。
学習用データに対する平均対数尤度、及び、評価用データに対する平均対数尤度をそれぞれ図示せよ。
図:横軸(学習回数)、縦軸(平均対数尤度)、系列(混合数)