第12回サイレント音声認識ワークショップ
12th Silent Speech Recognition Workshop
12th Silent Speech Recognition Workshop
2026年3月10日(火)
――――――――――――――――――――――――――――――――――――――――
13:25~13:30(5分)開会式
―――――――――――――――――――――――――――――――――――――――
セッションA 座長:桂田 浩一(東京理科大)
13:30~13:45(15分)① 脳波による想起音声認識のための聴取時データを利用した想起区間推定,〇溝上 智也,甲斐 充彦,中川 聖一 (静岡大)
13:45~14:00(15分)② 口唇映像を用いた構音障害者のマルチモーダル音声認識の検討,〇木山 大輔,原 直(岡山大)
14:00~14:15(15分)(3) 言語間転移学習による日本語マルチモーダル音声認識,近藤 史弥,〇田村 哲嗣(岐阜大)
14:15~14:30(15分)④ スマートグラスを用いた日本語読唇システムの開発,〇田邉 光,田村 哲嗣(岐阜大)
―――――――――――――――――――――――――――――――――――――――
14:30~14:45(15分) 休憩
―――――――――――――――――――――――――――――――――――――――
セッションB 座長:田村 哲嗣(岐阜大)
14:45~15:00(15分)⑤ 発話映像に基づく音声生成におけるTTS変換モデル及び音声合成モデルの比較評価,〇脇坂 伸,張 海波,齊藤 剛史(九州工大)
15:00~15:15(15分)⑥ Phoneme-Level Visual Speech Recognition via Point-Visual Fusion and Language Model Reconstruction,〇Matthew TENG Kit Khinn, Haibo Zhang, Takeshi Saitoh(九州工大)
15:15~15:30(15分)(7) 横顔と正面顔画像による対照学習を用いた機械読唇,孫田 啓舟(東京理科大),澤田 隼(日本工大),大村 英史,〇桂田 浩一(東京理科大)
―――――――――――――――――――――――――――――――――――――――
15:30~15:35(5分) 休憩
―――――――――――――――――――――――――――――――――――――――
15:35~15:45(10分)表彰式+閉会式
―――――――――――――――――――――――――――――――――――――――
※丸数字は学生奨励賞対象発表です。