以下の課題を実施して,略式レポート(表紙ページは不要)にまとめて提出せよ.EX-3は発展課題である.
Labo Aを実行せずに,過去の受講者が収録した音声データを利用してもよいが,その場合はレポートの謝辞として必ず音声提供者の氏名を記載すること.
なお,同一の音声ファイルを用いた結果を提出する場合は連名として提出すること.
本課題は応用課題だが連名での提出を認める.
あらかじめ用意された5000文のテキスト(~/OUSLP/work/mklm/data/news5000.txt)を利用して、言語モデルの学習と評価を行う。
前半4000文を学習用に、後半1000文を評価用に用いて、3-gramモデルを作成せよ。
このとき、ディスカウンティング手法として、Good-Turing法、Witten-Bell法、modified Kneiser-Ney法の3つそれぞれを適用したモデルを作成し、
学習文セットに対するパープレキシティと評価文セットに対するパープレキシティもそれぞれ計算せよ。
※ 3手法x2指標で6つの組み合わせのパープレキシティの値を計算する、ということ。
言語モデルの学習文に新しい文章を追加して単語正解精度(Accuracy)の向上を目指す。
評価用音声は、新聞読み上げ文とコマンド文の合計10文とする。
評価用音声
- 小説読み上げ文 (~/OUSLP/work/speech/novel1/n10[1-5].wav) 5文
- コマンド文 (~/OUSLP/work/speech/command/c10[1-5].wav) 5文
(1) 評価用音声合計10文の平均単語認識精度ができる限り高くなるように、言語モデルの学習文にWWW等から抽出したテキストや自分で作成した文章を追加せよ。
必ずしも追加した文章そのものをレポートに記述しなくてもよいが、例えば「××××な文章を含んでいそうな○○○サイトからテキストを手作業で抽出して、合計△△△文を追加した。」などのように、文章の追加基準やその文章数などがレポートから読み取れるようにすること。
(2) EX-1を参考に言語モデルを再度作り直して単語認識精度を計算せよ。
(3) 旧言語モデルと新言語モデルについての精度の差について、考察を行え。
EX-3*. 音声認識エンジン Julius の認識モードとチューニング(実習10)
以下のa~dの言語モデル・パラメータによる音声認識精度の差とそこから得られる知見について述べよ.
a. EX-1で実装した言語モデルによる音声認識/Juliusのパラメータはデフォルト
b. aのモデルに対して,EX-2でおこなった学習文を追加して作成した言語モデル/Juliusのパラメータはデフォルト
c. bの言語モデル/Juliusのパラメータとして、第一パスの言語重みと挿入ペナルティ(-lmp1)を調整する
d. bの言語モデル/cのJulius設定に加えて,さらに第二パスの言語重みと挿入ペナルティ(-lmp2)も調整する
(参考:http://julius.sourceforge.jp/juliusbook/ja/desc_search.html#id2540956)
なお,言語モデルはいずれの手法で作ったものでも良い.また,Julius は julius-fast を用いた場合の実験結果と考察のみで良い。
形態素解析には mecab ではなく、ChaSen や KyTea を使っても良い。独自のシステムがあるならばそれでも良いが,出自は明示すること.
ChaSen(茶筌)
http://chasen-legacy.osdn.jp/
KyTea - Kyoto Text Analysis Toolkit [w/ BCCWJ and UniDic]
http://www.phontron.com/kytea/