This site is a lecture information site for the student of Graduate school of Natural Science and Technology, Okayama University.

Division of Medical Bioengineering (生命医用工学専攻)
  Speech recognition interfaces (Class subject no. 436203) (音声認識インタフェース)

Division of Electronic and Information Systems Engineering (電子情報システム工学専攻)
  Speech recognition interfaces (Class subject no. 432104) (音声認識インタフェース)
  Programming for Speech Interface (Class subject no. 432006) (音声インタフェースプログラミング; 旧課程用)

■ Agenda / Table of Contents

Lecture 1: Introduction (10/7) ... [introduction] [handout]
  • 音声インタフェースの概要
  • パターン認識・機械学習の基礎
  • 統計的音声認識の概要 P(W|x_i)
  • 音声・音響信号の特徴 → Labo A
Lecture 2: Fundamentals of speech processing (10/14) ... [handout]
Lecture 3: Discrete Hidden Markov model (HMM) (10/21) ... [handout]
Lecture 4: Training discrete HMM (Baum-Welch algorithm) (10/28) ... [handout]
Lecture 5: Gaussian Mixture Models and Continuous HMM (11/11) ... [handout]
  • 音響モデルの基礎(GMMの概要)
  • 音響モデルの基礎(GMMのパラメータ推定)
  • 音響モデルの基礎(GMMと数値計算)
  • 音響モデルの基礎(連続HMM)
  • 実習4: GMMのEM学習と尤度計算Labo C / Labo CX
Lecture 6: Statistical ASR: Acoustic Models (11/18) ... [handout]
  • 統計的音声認識の概要 (1)
  • 音響モデルの実際(サブワード音響モデル)
  • 音響モデルの実際(状態共有、分布共有)
  • 音響モデルの実際(話者適応・環境適応)
  • 実習5: 単語HMM音響モデルの学習と認識Labo D-1
Lecture 7: Statistical ASR: Language Models (11/25) ... [handout]
  • 統計的音声認識の概要 (2)
  • 言語モデル(文脈自由文法) → 小テスト 4
  • 言語モデル(統計的言語モデル)
  • 実習6: サブワードHMM音響モデルの学習 [github] → Labo D-2
Lecture 8: Design for Speech Recognition Interfaces (11/29)
  • 部屋変更:303室
  • Labo Z/ZX に向けたアイデアソン or ブレインストーミング
  • 「ロボットとの対話を想定した音声インタフェース」
Lecture 9: Speech Recognition Algorithms (12/2) ... [handout]
  • 音声認識アルゴリズム(単語音声認識)
  • 音声認識アルゴリズム(連続音声認識)
  • 実習7a: 文音声認識 [github] → Labo D-3
  • 実習7b: HMM音響モデルの適応* [github]→ Labo D-4
Lecture 10: Practical algorithms for ASR (12/9) ... [handout]
  • 音声認識アルゴリズム(Julius)
  • 実習8: 新聞記事言語モデルの学習と評価 [github] → Labo E-1
Lecture 11: Spoken Dialog Systems (SDSs) (12/16) ... [handout]
  • 音声対話システムの概要
  • 音声対話システム:対話処理
  • 実習9: 音声認識エンジン Julius を用いた大語彙音声認識と評価 [github] → Labo E-2
  • 実習10a: 言語モデルの改善 [資料なし] → Labo E-3
  • 実習10b: 音声認識エンジン Julius のチューニング* [github] → Labo E-4
Lecture 12: Speech Generation and Responses (1/6) ... [handout]
Lecture 13: Practical use of SDSs (1) (1/20) ... [handout]
Lecture 14: Practical use of SDSs (2) (1/27) ... [handout]
Lecture 15: Practical use of SDSs (3) (2/3) ... [handout]

■ News

  • RAPIRO実習の採点 RAPIRO実習 (2) ロボット実験系の構築RAPIRO実習 (3) Raspberry Pi実験系の構築RAPIRO実習 (4) 音声対話ロボットの構築以上3回の提出物は小テスト相当(5点)として成績評価に加えます.3回の合計で15点となります.
    投稿: 2017/01/19 18:26、Hara Sunao
  • Open JTalk 1.09 (win64) 講義用にOpen JTalkのwindows版バイナリを配布します.大学内からのみアクセス可能です.Open JTalk 1.09 (win64)
    投稿: 2017/01/12 19:05、Hara Sunao
  • スクリーンショットの取り方 gnome-screenshotコマンドが使えます.コンソールの画面で,gnome-screenshot -d 5とすると,5秒後(--delay 5)に,全画面のスクリーンショットが取られます.詳しくは gnome-screenshot --help か man gnome-screenshot で調べてください.Print Screenキーでもできるかもしれません.
    投稿: 2016/10/13 3:15、Hara Sunao
1 - 3 / 5 件の投稿を表示中 もっと見る »

■ Schedule

8:40-9:40, 9:50-10:50 on every Friday.

01 ... 2016-10-07
02 ... 2016-10-14
03 ... 2016-10-21
04 ... 2016-10-28
XX ... 2016-11-04 ※大学祭
05 ... 2016-11-11
06 ... 2016-11-18
07 ... 2016-11-25
08 ... 2016-11-29 ※火曜日だが金曜日の講義日
09 ... 2016-12-02
XX ... 2016-12-02 19:00 ← Labo 提出一次〆切(ここまでに1つ以上は提出すること)
10 ... 2016-12-09
11 ... 2016-12-16
XX ... 2016-12-23 ※ 天皇誕生日
XX ... 2016-12-30 ※ 冬休み
12 ... 2017-01-06
XX ... 2017-01-13 ※ センター試験前休業
13 ... 2017-01-20
14 ... 2017-01-27
15 ... 2017-02-03
16 ... 2017-02-10 総合演習(仮)
XX ... 2016-02-10 19:00 ← Labo 提出二次〆切

■ Report Submission