Takahiro Kinouchi, Atsunori Ogawa, Yukoh Wakabayashi, Kengo Ohta, Norihide Kitaoka, “Domain adaptation using non-parallel target domain corpus for self-supervised learning-based automatic speech recognition,” SPEECH COMMUNICATION, Vol. 174, 103303, (8 pages) Oct., 2025.
坪倉和哉, 入部百合絵, 北岡教英, "音声対話システムにおける対話破綻時のユーザ反応と個人特性との関連," 電子情報通信学会論文誌D, Vol.J108-D, No.04, (to appear), Apr. 2025.
Ryota Nishimura, Takaaki Uno, Taiki Yamamoto, Kengo Ohta, Norihide Kitaoka, "Detection of Arbitrary Wake Words by Coupling a Phoneme Predictor and a Phoneme Sequence Detector," APSIPA Transactions on Signal and Information Processing,Vol. 13: No. 1, e14, pp. 1-21, Aug., 2024.
Daiki Mori, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, Norihide Kitaoka, "Recognition of target domain Japanese speech using language model replacement," EURASIP Journal on Audio, Speech and Music Processing, Article number: 40 (2024), 14 pages, 2024. (DOI: 10.1186/s13636-024-00360-8)
Kazuya Tsubokura, Yurie Iribe, Norihide Kitaoka, “Analysis of the Relationship between User Response to Dialog Breakdown and Personality Traits,” Applied Robotics, Vol. 37, Issue 21, pp.1-10 ,Nov., 2023. (DOI: 10.1080/01691864.2023.2279610)
Katsunori Yokoi, Yurie Iribe, Norihide Kitaoka, Takashi Tsuboi, Keita Hiraga, Yuki Satake, Makoto Hattori, Yasuhiro Tanaka, Maki Sato, Akihiro Hori, Masahisa Katsuno, “Analysis of spontaneous speech in Parkinson’s disease by natural language processing,” Parkinsonism and Related Disorders, Vol. 112, pp.1-6, Apr., 2023. (DOI: 10.1016/j.parkreldis.2023.105411)
Meiko Fukuda, Ryota Nshimura, Hiromitsu Nishizaki, Koharu Horii, Yurie Iribe, Kazumasa Yamamoto, Norihide Kitaoka. "A new speech corpus of super-elderly Japanese for acoustic modeling," Computer Speech & Langage, Vol. 77 (2023), pp. 1-22, 2022 (DOI: 10.1016/j.csl.2022.101424)
西村 良太, 森 雷太, 太田 健吾, 北岡 教英. "音声対話システムのための自由発話に対応した照応解析による入力発話への話題補完手法," 人工知能学会論文誌, Vol. 37, No. 3 p. IDS-F_1-13, May, 2022. (DOI: https://doi.org/10.1527/tjsai.37-3_IDS-F)
Zolzaya Byambadorj,Ryota Nishimura,Altangerel Ayush, Kengo Ohta, Norihide Kitaoka, "Text-to-speech system for low-resource language using cross-lingual transfer learning and data augmentation," EURASIP Journal on Audio, Speech, and Music Processing, 2021:42, 20 pages, Dec., 2021. (DOI: 10.1186/s13636-021-00225-4)
Zolzaya Byambadorj,Ryota Nishimura,Altangerel Ayush, Norihide Kitaoka, "Normalization of Transliterated Mongolian Words Using Seq2Seq Model with Limited Data," ACM Transactions on Asian and Low-Resource Language Information Processing, Article No.: 103, pp. 1-19, Nov., 2021. (DOI: 10.1145/3464361)
Kego Ohta,Ryota Nishimura,Norihide Kitaoka, "Response Type Selection for Chat-like Spoken Dialog Systems Based on LSTM and Multi-task Learning," SPEECH COMMUNICATION, vol. 133, pp. 23-30, Oct., 2021.
石原颯人,入部百合絵,北岡教英,"係り受け距離に着目した雑談対話からの認知症疑い検出," 電子情報通信学会論文誌D, Vol.J104-D,No.04, pp. 357-367, Apr. 2021.
Norihide Kitaoka; Bohan Chen; Yuya Obashi, "Dynamic out-of-vocabulary word registration to language model for speech recognition," EURASIP Journal on Audio, Speech, and Music Processing, 2021:4, (8 pages), 2021. (DOI: 10.1186/s13636-020-00193-1)
Jiahao Chen, Ryota Nishimura, Norihide Kitaoka, "End-to-End Recognition of Streaming Japanese Speech Using CTC and Local Attention," APSIPA Transactions on Signal and Information Processing, vol. 9, e 25, pp. 1-7, 2020.
Norihide Kitaoka, Eichi Seto, Ryota Nishimura, "Example phrase adaptation method for customized, example-based sialog system using user data and distributed word representations," IEICE Trans. Inf. & Syst., Vol. E103-D, No. 11, pp. 2332-2339, Nov., 2020.
Tomoki Hayashi, Masafumi Nishida, Norihide Kitaoka, Tomoki Toda, Kazuya Takeda, "Daily Activity Recognition with Large-scaled Real-life Recording Datasets Based on Deep Neural Network using Multi-modal Signals," IEICE Trans. Fundamentals, Vol.E101-A,No.1, pp. 199-210,Jan. 2018.
Bohan Chen, Norihide Kitaoka, Kazuya Takeda, "Impact of acoustic similarity on efficiency of verbal information transmission via subtle prosodic cues," EURASIP Journal on Audio, Speech, and Music Processing, 2016:19, 2016. (DOI: 10.1186/s13636-016-0097-6)
Satoshi Tamura, Hiroshi Ninomiya, Norihide Kitaoka, Shin Osuga, Yurie Iribe, Kazuya Takeda, "Investigation of DNN-based audio-visual speech recognition," IEICE Trans. Inf. & Syst., pp. 2444-2451, Oct., 2016.
市川 賢, 北岡教英, 柘植 覚, 武田一哉, 北 研二, "種々のテキスト検索モデルの頑健性向上による音声ドキュメント検索の高精度化," 情報処理学会論文誌, Vol.56, No. 3, pp. 1003-1012, Mar., 2015.
Yiyang Li, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "An evaluation method of aggressiveness of driving behavior using drive recorders," IEEJ Journal of Industry Applications, Vol. 4, No. 1, pp. 59-66, Jan., 2015.
柘植 覚, 大橋宏正, 市川 賢, 北岡教英, 武田一哉, 北 研二, "音声ドキュメント検索における種々の検討および線形補間係数を自動決定する検索質問拡張," 情報処理学会論文誌, Vol.55, No. 6, pp. 1625-1636, Jun., 2014.
Yiyang Li, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "Driving scene retrieval with an integrated similarity measure using driving behavior and environment information," IEEJ Journal C, Vol. 134, No. 5, pp. 1-8, May, 2014.
Yusuke Mizuno, Takanori Nishino, Kazunobu Kondo, Norihide Kitaoka, Kazuya Takeda, "Effective Frame Selection for Blind Source Separation based on Frequency Domain Independent Component Analysis," IEICE Trans. Fundamentals, Vol. 97-A, No. 3, pp. 784-791, Mar., 2014.
陳伯翰, 北岡教英, 武田一哉 "発話セグメントクラスタの評価とそれに基づく改良ボトムアップクラスタリングによる話者ダイアライゼーションの高精度化," 電子情報通信学会論文誌(D), Vol. J97-D, No. 3, pp. 540-547, Mar., 2014.
Norihide Kitaoka, Daisuke Enami, Seiichi Nakagawa, "Effect of acoustic and linguistic contexts on human and machine speech recognition," Computer Speech and Language, Vol. 28, pp. 769-787, Feb., 2014. (doi: 0.1016/j.csl.2013.09.009)
Madoka Miki, Norihide Kitaoka, Chiyomi Miyajima, Takanori Nishino and Kazuya Takeda, "Improvement of multimodal gesture and speech recognition performance using time intervals between gestures and accompanying speech," EURASIP Journal on Audio, Speech, and Music Processing, 2014:2, (7 pages), Jan., 2014. (doi: 10.1186/1687-4722-2014-2)
Norihide Kitaoka, Yuji Kinoshita, Sunao Hara, Chiyomi Miyajima, Kazuya Takeda, "A graph-based spoken dialog strategy utilizing multiple understanding hypotheses," Information and Media Technologies,Vol 9, No. 1, pp. 111-120, Mar.,, 2014. (reprinted from Transactions of the Japanese Society for Artificial Intelligence, Vol.29, No.1, Jan, 2014)
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "Classification of speech under stress based on physical modeling," Acoustical Science and Technology, Vol. 34, No. 5, pp. 311-321, Sep., 2013.
北岡教英,押川洋徳,中川聖一, "単語認識と連続音節認識を併用した音声認識とタッチ入力を利用した姓名音声入力方式," 電気学会電子情報システム部門誌(C), vol. 133, No. 8, pp. 1565-1575, Aug., 2013.
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "Classification of speech under stress based on modeling of the vocal folds and vocal tract," EURASIP Journal on Audio, Speech, and Music Processing, 2013:17, (17 pages), Jul., 2013. (doi:10.1186/1687-4722-2013-17)
川渕将太,宮島千代美,北岡教英,武田一哉, "楽曲間の類似判断における個人性データの収集とその分析," 情報処理学会論文誌, vol. 54, No. 4, pp. 1350-1361, Apr. 2013.
原 直, 北岡教英, 武田一哉, "音声対話システムの発話・動作タグN-gramを用いた課題未達成のオンライン検出," 電子情報通信学会論文誌(D),VolJ96-D, No.1, pp. 81-93, Jan., 2013.
Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda, "Acoustic model training using pseudo-speaker feature generated by MLLR transofrmaions for robust speech recognition," IEICE Trans. Inf. & Syst., vol. E95-D, No. 10, pp. 2479-2485, Oct., 2012.
Yi Ren Leng, Huy Dat Tran, Norihide Kitaoka, Haizhou Li, "Selective Gammatone envelope feature for robust sound event recognition," IEICE Trans. Inf. & Syst., E95-D, No. 5, pp. 659-667, May. 2012.
(Preface for Special Section by Prof. Haizhou Li)
北岡教英, 矢野浩利, 杉本夏樹, 山本一公, 中川聖一, "複数理解候補の保持と効率性・自然性を考慮した応答生成による誤認識に頑健な音声対話戦略とその評価," 電子情報通信学会論文誌(D),VolJ95-D, No.4, pp. 982-994, Apr., 2012.
Sunao Hara, Norihide Kitaoka, Kazuya Takeda, "Field data collection of a distributed spoken dialog system for music retrieval and its evaluation," Global Engineering, Science, and Technology society International Transaction on Computer Science and Engineering, vol. 64, no. 1, pp. 33-58, May, 2011.
Longbiao Wang, Norihide Kitaoka, Seiichi Nakagawa, "Distant-talking speech recognition based on spectral subtraction by multi-channel LMS algorithm," IEICE Trans. Inf. & Syst., Vol. E94-D, No. 3, pp. 659-667, Mar. 2011.
Lucas Malta, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda, "Analysis of real-world driver's frustration," IEEE Transactions on Intelligent Transportation Systems, Vol. 12, No. 1, pp. 109-118, Mar. 2011.
尾崎晃, 草川高志, 西脇由博, マルタルーカス, 宮島千代美, 西野隆典, 北岡教英, 伊藤克亘, 武田一哉, "自動車運転のマルチモーダル信号収録装置の開発," 電子情報通信学会論文誌(D), VolJ93-D, No.10, pp. 2118-2128, Oct. 2010.
Makoto Sakai, Norihide Kitaoka, Kazuya Takeda, "Acoustic feature transformation based on discriminant analysis preserving local structure for speech recognition," IEICE Trans. Inf. & Syst., Vol. E93-D, Vol.E93-D, No.5, pp. 1244-1252, May, 2010.
藤井康寿,山本一公,北岡教英,中川聖一, "重要文抽出に基づく講義音声の自動要約," 情報処理学会論文誌, vol. 51, No. 3, pp. 1094-1106, Mar. 2010
西脇由博,宮島千代美,北岡教英,武田一哉, "確率的手法を用いた車線変更軌跡のモデル化," 情報処理学会論文誌 Vol. 51 No.1, pp. 131-140, Jan. 2010.
Lucas Malta, Akira Ozaki, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda, "Use of on-road data in evaluating driver performance metrics," Chapter 9 of Performance Metrics for Assessing Driver Distraction: The Quest for Improved Road Safety (Gary Rupp eds.), SAE International, pp83-91, 2010.
西村良太,北岡教英,中川聖一. "音声対話における韻律変化をもたらす要因分析," 音声研究, Vol. 13, No. 3, pp. 66-84., Dec., 2009.
Norihide Kitaoka, Souta Hamaguchi, Seiichi Nakagawa, "Noisy speech recognition based on integration/selection of multiple noise suppression methods using noise GMMs," IEICE Trans. Inf. & Syst., Vol. E91-D, No. 3, pp.411-421, Mar. 2008.
Makoto Sakai, Norihide Kitaoka, Seiichi Nakagawa, "Linear discriminant analysis using a generalized mean of class covariances and its application to speech recognition," IEICE Trans. Inf. & Syst., Vol. E91-D, No. 3, pp.478-487, Mar. 2008.
Longbiao Wang, Seiichi Nakagawa, Norihide Kitaoka, "Robust speech recognition by combining short-term and long-term spectrum based position-dependent CMN with conventional CMN," IEICE Trans. Inf. & Syst., Vol. E91-D, No. 3, pp. 457-466, Mar. 2008.
中川聖一, 富樫慎吾, 山口優, 藤井康寿, 北岡教英, "講義音声ドキュメントのコンテンツ化と視聴システム," 電子情報通信学会論文誌(D-II), Vol. J91-D-II, No. 2, pp. 238-249, Feb. 2008.
Longbiao Wang, Norihide Kitaoka, and Seiichi Nakagawa, "Robust distant speaker recognition based on position-dependent CMN by combining speaker-specific GMM with speaker-adapted HMM," Speech Communication, Vol. 49, Issue 6, pp. 501-513, June 2007.
Longbiao Wang, Norihide Kitaoka, and Seiichi Nakagawa, "Robust distant speech recognition by combining multiple microphone-array processing with position-dependent CMN," EURASIP Journal on Applied Signal Processing, Vol. 2006, Article ID 95491, 11 pages, 2006.
Norihide Kitaoka, Masashi Takeuchi, Ryota Nishimura, Seiichi Nakagawa, "Response timing detection using prosodic and linguistic information for human-friendly spoken dialog systems," Information and Media Technologies Vol.1, No. 1, pp. 294-3-4, 2006. (reprinted from Transactions of the Japanese Society for Artificial Intellignece, Vol.20, No.3 SP-E, pp. 220-228,) Mar., 2005.
Satoshi Nakamura, Kazuya Takeda, Kazumasa Yamamoto, Takeshi Yamada, Shingo Kuroiwa, Norihide Kitaoka, Takanobu Nishiura, Akira Sasou, Mitsunori Mizumachi, Chiyomi Miyajima, Masakiyo Fujimoto, Toshiki Endo. "AURORA-2J: An evaluation framework for Japanese noisy speech recognition," IEICE Trans. Inf. & Syst., Vol.E88-D, No.3, pp. 535-544, Mar., 2005.
北岡教英, 角谷直子, 中川聖一. "音声対話システムの誤認識に対するユーザの繰り返し訂正発話の検出と認識," 電子情報通信学会論文誌(D-II), Vol. J87-D-II No. 7, 1441-1450, Jul., 2004.
(Translation of the above paper) Norihide Kitaoka, Naoko Kakutani and Seiichi Nakagawa, "Detection and Recognition of Correction Utterances on Misrecognition of Spoken Dialog System," Systems and Computers in Japan, Vol. 36, No. 11, pp. 24-33, 2005.
北岡教英, 高橋伸寿, 中川聖一. "N-best線形辞書探索と1-best近似木構造辞書探索の併用による大語彙連続音声認識", 電子情報通信学会論文誌(D-II), Vol.J87-D-II No.3, pp. 799-807, Mar., 2004.
(Translation of the above paper) Norihide Kitaoka, Nobutoshi Takahashi and Seiichi Nakagawa, "Large vocabulary continuous speech recognition using linear lexicon search and 1-best approximation tree-structured lexicon search," Systems and Computers in Japan, Vol. 36, No. 7, pp. 31-39, 2005.
北岡教英, 角谷直子, 中川聖一. "カーナビの地名音声入力における誤認識時の言い直し発話の検出と認識", 電気学会電子情報システム部門誌(C), Vol.122-C, No.12, pp. 2020-2027, 2002.
山田大輔, 北岡教英, 中川聖一. "音源情報の特徴量を用いた音声認識", 電気学会電子情報システム部門誌(C), Vol.122-C, No.12, pp. 2028-2034, 2002.
北岡教英, 赤堀一郎, 中川聖一. "認識結果の正解確率に基づく信頼度とリジェクション," 電子情報通信学会論文誌(D-II), Vol.J83-D-II No.11, pp.2160-2170, Nov., 2000.
(Translation of the above paper) Norihide Kitaoka, Ichiro Akahori and Seiichi Nakagawa, "Confidence measure and rejection based on correctness probability of recognition candidate," Systems and Computers in Japan, Vol. 35, No. 11, pp. 91-102, 2004.
北岡教英, 赤堀一郎, 中川聖一. "スペクトルサブトラクションと時間方向スムージングを用いた雑音環境下音声認識", 電子情報通信学会論文誌(D-II), Vol.J83-D-II No.2, pp.500-509, Feb., 2000.
河原達也, 北岡教英, 堂下修司. "A*探索に基づいたフレーズスポッティングによる頑健な音声理解," 電子情報通信学会論文誌(D-II), Vol.J79-D-II, No.7, pp.1187-1194, Jul., 1996.
西村良太, 長尾拓海, 一万田郁仁, 北岡教英, “高齢者の音声知覚特性に基づいた音声の明瞭化加工法の研究,” 日本知能情報ファジィ学会誌, Vol. 30, No. 6, pp. 840-845, Dec., 2018.
西村良太, 檜垣美帆, 北岡教英, “RNN-LSTMによる音響ベクトル空間と文書ベクトル空間とのマッピング,” 日本知能情報ファジィ学会誌, Vol. 30, No. 4, pp. 628-633, Aug., 2018.
Norihide Kitaoka, Shuhei Segawa, Ryota Nishimura, Kazuya Takeda, "Recognizing emotions from speech using a physical model," Acoustical Science and Technology, Vol. 39, Issue 2, pp. 167-170, Feb., 2018. (doi: 10.1250/ast.39.167)
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "Modelling of Physical Characteristics of Speech under Stress," IEEE Signal Processing Letters, Vol. 22, Issue 10, pp. 1801-1805, Oct., 2015. (DOI: 10.1109/LSP.2015.2434732)
Takahiro Fukumori, Takanobu Nishiura, Masato Nakayama, Yuki Denda, Norihide Kitaoka, Takeshi Yamada, Kazumasa Yamamoto, Satoru Tsuge, Masakiyo Fujimoto, Tetsuya Takiguchi, Chiyomi Miyajima, Satoshi Tamura, Tetsuji Ogawa, Shigeki Matsuda, Shingo Kuroiwa, Kazuya Takeda, Satoshi Nakamura, "CENSREC-4:An Evaluation Framework for Distant-talking Speech Recognition under Reverberant Environments," Acoustical Science and Technology, Vol. 32, No. 5, pp. 201-210, Sept., 2011.
Yuichi. Kuroyanagi, Chiyomi. Miyajima, Norihide Kitaoka, and Kazuya Takeda, "Analysis and detection of potentially hazardous situations in real-world driving," ICIC Express Letters, Part B: Applications, An International Journal of Research and Surveys, ICIC International, Vol. 2, No. 3, pp. 621-626, June, 2011.
Hiroaki Ishikawa, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda, "Detection of distracted driving using a Bayesian network," ICIC Express Letters, Part B: Applications, An International Journal of Research and Surveys, ICIC International, Vol. 2, No. 3, pp. 627-633, June, 2011.
原 直, 北岡教英, 武田一哉, "音声対話システムの発話系列N-gramを利用した課題未達成対話の検出," 電子情報通信学会論文誌D, Vol.J94-D,No.2, pp. 497-500, Feb. 2011.
Makoto SAKAI, Norihide KITAOKA, and Kazuya TAKEDA, "Acoustic feature transformation combining average and maximum classification error minimization criteria," IEICE Trans. Inf. & Syst., Vol. E93-D, No.7, pp. 2005-2008, Jul., 2010.
Makoto SAKAI, Norihide KITAOKA, Yuya HATTORI, Seiichi NAKAGAWA, and Kazuya TAKEDA, "Evaluation of combinational use of discriminant analysis-based acoustic feature transformation and discriminative training," IEICE Trans. Inf. & Syst., Vol.E93-D, No.2, pp.395-398, Feb., 2010.
Norihide Kitaoka, Takeshi Yamada, Satoru Tsuge, Chiyomi Miyajima, Kazumasa Yamamoto, Takanobu Nishiura, Masato Nakayama, Yuki Denda, Masakiyo Fujimoto, Tetsuya Takiguchi, Satoshi Tamura, Shigeki Matsuda, Tetsuji Ogawa, Shingo Kuroiwa, Kazuya Takeda, Satoshi Nakamura, "CENSREC-1-C: An evaluation framework for voice activity detection under noisy environments," Acoustical Science and Technology, Vol. 30, No. 5, pp. 363-371, Sept., 2009.
北岡教英, 高木俊一, 中川聖一. "自動車内情報システムインタフェース制御のための運転過負荷状態の検出," 情報処理学会論文誌,Vol. 49, No. 12, pp. 4088-4092, Dec., 2008.
北岡 教英, 西村 良太, 太田 健吾, "フォトリアルCGエージェントとのマルチモーダル対話," 日本音響学会誌 Vol. 78, No. 5, pp. 257-264, May, 2022.
山本 一公, 坂野 秀樹, 北岡 教英, "小特集「音声対話システムにおける“不気味の谷”を超えるには」にあたって," 日本音響学会誌 Vol. 78, No. 5, pp. 245-248, May, 2022.
大須賀 晋, 田中 五大, 鍋倉 彩那, 藤井 宏行, 中野 涼太, 渡邊 凌太, TELYUKA, 太田 健吾, 西村 良太, 北岡 教英, "次世代の移動を支えるマルチモーダルエージェント“Saya”," 自動車技術, Vol. 75, No. 9, pp. 109-109, Sep. 2021.
入部百合絵, 北岡教英 "音声認識にむけた超高齢者音声のコーパス構築," 小特集---高齢者や視覚障害者に配慮した音環境---, 日本音響学会誌 Vol. 73, No. 5, pp. 303-310, May, 2017.
Norihide Kitaoka, "FOREWORD: Special section on recent advances in machine learning in spoken language processing," IEICE Trans. Inf. & Syst., Vol. E-99-D, No. 10, p. 2422, Oct., 2016.
北岡教英, 中村 哲 "解説:雑音下音声認識評価基盤 CENSREC," 日本音響学会誌 Vol. 68, No. 6, pp. 305-310, Jun., 2012.
北岡教英, 伊田正樹, "運転行動信号処理特集号を企画して," 『運転行動信号処理』特集号(pp.2-32), システム制御情報処理学会誌, Vol. 55, no. 1 ,p. 32, Jan., 2011.
北岡教英, "音声認識におけるロバストネス," 小特集---自動音声認識研究の動向と展望---, 日本音響学会誌 Vol. 66, No. 1, pp. 23-27, Jan., 2010.
Norihide Kitaoka, "Spoken and multimodal interfaces: Interaction systems with machines," ICAICTA2019 (Keynote speech), Sep 2019.
Norihide Kitaoka, Yurie Iribe, Hiromitsu Nishizaki, "Construction of a corpus of elderly Japanese spech for analysis and recognition," LREC2018 (Invited Talk), May 2018.
北岡教英, 入部百合絵, "高齢者音声の収録・分析・認識," 音声資源活用シンポジウム(招待講演), Sep. 2017.
Jotaro Emoto, Ryota Nishimura, Kengo Ohta, Norihide Kitaoka, “Real-time VAD-less speech recognition by fine-tuning SSL model with data containing tagged non-speech segments,” Proc. APSIPA ASC 2025, pp. 980-985, Oct., 2025.
Ryota Uematsu, Chee Siang Leow, Norihide Kitaoka, Hiromitsu Nishizaki, “Improving Automatic Speech Recognition Model for Super-Elderly Voice Using Speech Synthesis Model,” Proc. APSIPA ASC 2025, pp. 986-988, Oct., 2025.
Tamon Mikawa, Yasuhisa Fujii, Yukoh Wakabayashi, Kengo Ohta, Ryota Nishimura, Norihide Kitaoka, “Improving Listening Head Generation Performance Using Speech Representations from Self-Supervised Learning,” Proc. APSIPA ASC 2025, pp. 956-961, Oct., 2025.
Kazuya Tsubokura, Yurie Iribe, Norihide Kitaoka, “Toward Natural System Repair: An Analysis of Human Other-Initiated Self-Repair Patterns in Japanese Casual Conversations,” Proc. APSIPA ASC 2025, 1004-1009, Oct., 2025.
Yoshinori Fukunaga, Ryota Nishimura, Kengo Ohta, Norihide Kitaoka, “Backchannel prediction for natural spoken dialog systems using general speaker and listener information,” Proc. INTERSPEECH2025, pp.1078-1082, Aug., 2025.
Kaito Takahashi, Keigo Hojo, Toshimitsu Sakai, Yukoh Wakabayashi, Norihide Kitaoka, “Fine-tuning Parakeet-TDT for Dysarthric Speech Recognition in the Speech Accessibility Project Challenge,” Proc. INTERSPEECH2025, pp.3304-3308, Aug., 2025.
Makoto Hotta, Chee Siang Leow, Norihide Kitaoka, Hiromitsu Nishizaki, "Evaluation of Speech Translation Subtitles Generated by ASR with Unnecessary Word Detection," Proc. GCCE, pp. 835-839, Oct., 2024.
Kaito Takahashi, Yukoh Wakabayashi, Kengo Ohta, Akio Kobayashi, Norihide Kitaoka, "Improving Speech Recognition for Japanese Deaf and Hard-of-Hearing People by Replacing Encoder Layers," Proc. ICAICTA 2024, (5 pages), Sep. 2024.
Takanori Kanai, Yukoh Wakabayashi, Ryota Nishimura, Norihide Kitaoka, "Predicting Utterance-final Timing Considering Linguistic Features Using Wav2vec 2.0," Proc. ICAICTA 2024, (5 pages), Sep., 2024.
Tamon Mikawa, Yasuhisa Fujii, Yukoh Wakabayashi, Kengo Ohta, Ryota Nishimura, Norihide Kitaoka, "Listening Head Motion Generation for Multimodal Dialog System," Proc. ICAICTA 2024, (6 pages), Sep., 2024.
Tatsunari Takagi, Yukoh Wakabayashi, Atsunori Ogawa, Norihide Kitaoka, "Text-only Domain Adaptation for CTC-based Speech Recognition through Substitution of Implicit Linguistic Information in the Search Space, " Proc. INTERSPEECH, pp. 287-291, Sep., 2024.
Keigo Hojo, Yukoh Wakabayashi, Kengo Ohta, Atsunori Ogawa, Norihide Kitaoka, "CTC-based ASR using inter-layer attention-based CTC loss," Proc. INTERSPEECH, 2860-2864, Sep., 2024.
Kazuya Tsubokura, Takuya Takeda, Yurie Iribe, Norihide Kitaoka, “Dialog Breakdown Recovery Strategies Based on User Personality,” Proc. of The 14th International Workshop on Spoken Dialogue Systems Technology (IWSDS2024), Mar. 2024.
Koharu Horii, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, Norihide Kitaoka, “Language Modeling for Spontaneous Speech Recognition Based on Disfluency Labeling and Generation of Disfluent Text,” APSIPA ASC 2023, pp.1867-1872, Nov., 2023.
Keigo Hojo, Daiki Mori, Yukoh Wakabayashi, Kengo Ohta, Atsunori Ogawa, Norihide Kitaoka, “Combining Multiple End-To-End Speech Recognition Models Based on Density Ratio Approach,” APSIPA ASC 2023, pp.2250-2255, Nov., 2023.
Nagito Shione, Norihide Kitaoka, “Construction of Automatic Speech Recognition Model That Recognizes Linguistic Information and Verbal/Non-Verbal Phenomena,” APSIPA ASC 2023, pp.2282-2287, Nov., 2023.
Tatsunari Takagi, Norihide Kitaoka, Atsunori Ogawa, Yukoh Wakabayashi, “Streaming End-To-End ASR Using CTC Decoder and DRA for Linguistic Information Substitution,” APSIPA ASC 2023, pp.1768-1772, Nov., 2023.
Ryo Maejima, Norihide Kitaoka, “Speech recognition interface for updating electronic medical records with automatic itemization,” ICAICTA2023, (5 pages) Oct., 2023.
Takahiro Kinouchi, Atsunori Ogawa, Yukoh Wakabayashi, Norihide Kitaoka, “Domain adaptation with a non-parallel target domain corpus,” ICAICTA2023, (6 pages) Oct., 2023.
Tatsunari Takagi, Yukoh Wakabayashi, Atsunori Ogawa, Norihide Kitaoka, “Domain Adaptation Using Density Ratio Approach and CTC Decoder for Streaming Speech Recognition,” ICAICTA2023, (5 pages) Oct., 2023.
Shione Nagito, Yukoh Wakabayashi, Norihide Kitaoka, “Automatic Speech Recognition Using Linguistic and Verbal/Non-verbal Information,” ICAICTA2023, (6 pages) Oct., 2023.
Aito Nakata, Ryota Nishimura, Kengo Ohta, Norihide Kitaoka, “Development of a Model for Predicting Timing of Back-Channel in a Real-Time Spoken Dialog System,” GCCE2023, (to appear), Oct., 2023.
Kazuya Tsubokura, Yurie Iribe, Norihide Kitaoka, “Relationships Between Gender, Personality Traits and Features of Multi-Modal Data to Responses to Spoken Dialog Systems Breakdown,” INTERSPEECH2023, pp.2713-2717, Oct., 2023. (DOI: 10.21437/Interspeech.2023-1267)
Meiko Fukuda, Masakazu Sugiyama, Ryota Nishimura, Yurie Iribe, Kazumasa Yamamoto, Norihide Kitaoka, “A corpus-based analysis of age-related change in the acoustic features of elderly to super elderly speech,” Proc. Oriental-COCOSDA, (6 pages), Nov., 2022.
Kazuya Tsubokura, Yurie Iribe, Norihide Kitaoka, “Dialog Breakdown Detection Using Multimodal Features for Non-Task-Oriented Dialog Systems,” GCCE2022, pp.359-363, Oct., 2022.
Daiki Mori, Kengo Ohta, Ryota Nishimura, Norihide Kitaoka, “Implicit language information replace method in Japanese encoder-decode ASR model," ICAICTA-2022, Sep., 2022.
Takahiro Kinouchi, Norihide Kitaoka, “A response generation method of chat-bot system using input formatting and reference resolution," ICAICTA-2022, Sep., 2022.
Koharu Horii, Meiko Fukuda, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, Norihide Kitaoka. "End-to-End Spontaneous Speech Recognition Using Disfluency Labeling," Proc. INTERSPEECH 2022, (5 pages), 2022.
Meiko Fukuda, Maina Umezawa, Ryta Nishimura, Yurie Iribe, Kazumasa Yamamoto, Norihide Kitaoka, "Elderly Conversational Speech Corpus with Cognitive Impairment Test and Pilot Dementia Detection Experiment Using Acoustic Characteristics of Speech in Japanese Dialects," Proc. LREC2022, pp. 1016-1022, Jun, 2022.
Byambadorj, Ryota Nishimura,Altangerel Ayush, Kengo Ohta, Norihide Kitaoka, "Multi-speaker TTS system for low-resource language using cross-lingual transfer learning and data augmentation," Proc. APSIPA ASC 2021, pp. 849-853, 2021.
Daiki Mori, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, Norihide Kitaoka, "Advanced language model fusion method for encoder-decoder model in Japanese speech," Proc. APSIPA ASC 2021, pp. 503-510, 2021.
Koharu Horii, Meiko Fukuda, Kengo Ohta, Ryota Nishimura, Atsunori Ogawa, Norihide Kitaoka, "End-to-end spontaneous speech recognition using hesitation labeling," Proc. APSIPA ASC 2021, pp. 1077-1081, 2021.
Meiko Fukuda, Hiromitsu Nishizaki, Yurie Iribe, Ryota Nishimura, Norihide Kitaoka, "Improving speech recognition for the elderly: A new corpus of elderly Japanese speech and investigation of acoustic modeling for speech recognition," Proc. LREC2020, 9 pages, Jun, 2020.
Meiko Fukuda, Ryota Nishimura, Hiromitsu Nishizaki, Yurie Iribe, Norihide Kitaoka, "A new corpus of elderly Japanese speech for acoustic modeling, and a preliminary investigation of dialect-dependent speech recognition," Proc. Oriental-COCOSDA2019, 6 pages, Oct., 2019. (Best paper award)
Yuya Obashi, Ryota Nishimura, Norihide Kitaoka, "Automatic conversion of written language into spoken language using a sequence-to-sequence model trained with a parallel corpus," Proc. Oriental-COCOSDA2019, 5 pages, Oct., 2019.
Taiki Yamamoto, Ryota Nishimura, Masayuki Misaki, Norihide Kitaoka, "Small-footprint magic word detection method using convolutional LSTM neural network," Proc. INTERSPEECH2019, pp. 2035-2039, Sep. 2019.
Eichi Seto, Ryota Nishimura, Norihide Kitaoka, "Customization of an example-based dialog system with user data and distributed word representations," Proc. APSIPA2018, 7 pages, Nov. 2018.
Kazuaki Kajinami, Ryota Nishimura, Norihide Kitaoka, “Construction of dialog database for development of spoken dialog breakdown detection methods,” ICAICTA-2018, pp.1-5, 2018.
Kengo Ohta, Rikito Marumoto, Ryota Nishimura, Norihide Kitaoka, "Selecting type of response for chat-like spoken dialogue systems based on acoustic features of user utterances," Proc. APSIPA2017, 5 pages, Dec. 2017.
Eichi Seto, Norihide Kitaoka, "User adaptation of input-response pairs in an example-based dialog system using distributed representations of words," Proc. ICAICTA2017, Aug., 2017.
Bohan Chen, Norihide Kitaoka, Kazuya Takeda, "Relationship between Speaker/Listener Similarity and Information Transmission Quality in Speech Communication," APSIPA ASC 2015, pp. 1190-1193, Dec., 2015.
Masafumi Nishida, Norihide Kitaoka, Kazuya Takeda, "Daily activity recognition based on acoustic signals and acceleration signals estimated with Gaussian process," APSIPA ASC 2015, pp. 279-282, Dec., 2015.
Satoshi Tamura, Hiroshi Ninomiya, Norihide Kitaoka, Shin Osuga, Yurie Iribe, Kazuya Takeda, Satoru Hayamizu, "Audio-visual speech recognition using deep bottleneck features and high-perfromanc lipreading," APSIPA ASC 2015, pp. 575-582, Dec., 2015.
Yurie Iribe, Norihide Kitaoka, Shuhei Segawa, "Development of new speech corpus for elderly Japanese speech recognition," Oriental-COCOSDA/CASLRE, pp. 27-31, Oct., 2015.
Satoshi Tamura, Hiroshi Ninomiya, Norihide Kitaoka, Shin Osuga, Yurie Iribe, Kazuya Takeda, Satoru Hayamizu, "Investigation of DNN-based modeling for audio-visual speech recognition," 2015 First International Workshop on Spoken Language Processing (MLSLP2015), (6 pages), Oct., 2015.
Hiroshi Ninomiya, Norihide Kitaoka, Satoshi Tamura, Yurie Iribe, Kazuya Takeda, "Integration of Deep Bottleneck Features for Audio-Visual Speech Recognition," Proc. INTERSPEECH, pp. 563-566, Sep., 2015.
Tomoki Hayashi, Masafumi Nishida, Norihide Kitaoka, Kazuya Takeda, "Dayly activity recogntion based on DNN using environmental sound and acceleration signals," Proc. EUSIPCO 2015, pp. 2351-2355, Sep. 2015.
Norihide Kitaoka, Tomoki Hayashi, Kazuya Takeda, "Noisy speech recognition using blind spatial subtraction array technique and deep bottleneck features," APSIPA ASC 2014, (5 pages), Oct., 2014
Masafumi Nishida, Norihide Kitaoka, Kazuya Takeda, "Development and preliminary analysis of sensor signal database of contiuous daily living activity over the long term," APSIPA ASC 2014, (6 pages), Oct., 2014
Panikos Heracleous, Pongtep Angkititrakul, Norihide Kitaoka, Kazuya Takeda, "Unsupervised energy disaggregation using conditional random fields," IEEE ISGT Europe 2014, (6 pages), Oct., 2014.
Yiyang Li, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "Measuring Aggressive Driving Behavior Using," IEEE ITSC14, 1886-1887, Oct., 2014.
Kengo Ohta, Norihide Kitaoka, Seiichi Nakagawa, "Analyzing Effects of Filled Pauses and Silences in Responses of a Spoken Dialogue System", The 6th World Congress: Applied Computing Conference, pp. 71-77, Nov., 2013.
Ken Ichikawa, Satoru Tsuge, Norihide Kitaoka, Kazuya Takeda, Kenji Kita, "Spoken document retrieval using both word-based and syllable-based document spaces with latent semantci indexing," APSIPA ASC 2013, 5 pages, Oct., 2013.
Masataka Mori, Chiyomi Miyajima, Takatsugu Hirayama, Norihide Kitaoka, Kazuya Takeda, "Integrated modeling of driver gaze and vehicle operation behavior to estimate risk level during lane," Proc. IEEE ITSC, 2020-2025, Oct., 2013.
Chiyomi Miyajima, Hiroki Takeshita, Hiroaki Ishikawa, Norihide Kitaoka, Kazuya Takeda, "Measuring driving behavior on different types of vehicles," The SICE Annual Conference 2013, pp. 1172-1173, Sept., 2013.
Shota Kawabuchi, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "Modeling subjective evaluation of music similarity using tolerance," Proc. EUSIPCO 2013, 5 pages, Sept., 2013.
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "Classification of speech under stress by modeling the aerodynamics of the laryngeal ventricle," Proc. INTERSPEECH2013, pp. 837-840, Aug. 2013.
Motonari Kawagishi, Shota Kawabuchi, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "Analysis and modeling of entrainment in chorus singing," Proc. ICASSP 2013, 7795--7798, May, 2013.
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "Estimation of vocal tract parameters for the classification of speech under stress," Proc. ICASSP 2013, pp. 7532--7535, May, 2013.
Naoya Ukai, Takuya Kawasaki, Satoshi Tamura, Chiyomi Miyajima, Norihide Kitaoka, Satoru Hayamizu and Kazuya Takeda, "CENSREC-2-AV: An evaluation framework for bimodal speech recognition in real environments," Oriental COCOSDA 2012, pp. 88-91, Dec., 2012.
Tetsuto Kawai, Norihide Kitaoka, Kazuya Takeda, "Acoustic model training using feature vectors generated by manipulating speech parameters of real speakers," Proc. APSIPA ASC 2012, (4 pages), Dec., 2012.
Shota Kawabuchi, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "Subjective similarity of music: Data collection for individuality analysis," Proc. APSIPA ASC 2012, (4 pages), Dec., 2012.
Masataka Mori, Chiyomi Miyajima, Pongtep Angkititrakul, Takatsugu Hirayama, Yiyang li, Norihide Kitaoka, Kazuya Takeda, "Measuring driver awareness based on correlation between gaze behavior and risks of surrounding vehicles," IEEE Interlligent Transportation Systems Conference (ITSC) 2012, pp. 644-947, Sept., 2012.
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "Classification of stressed speech using physical parameters derived from two-mass model," Proc. INTERSPEECH, 4 pages, Sep., 2012.
Yusuke Mizuno, Kazunobu Kondo, Takanori Nishino, Norihide Kitaoka, Kazuya Takeda, "Fast source separation based on selection of effective temporal frames," Proc. EUSIPCO 2012, pp. 914-918, Aug., 2012.
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda, "Physical characteristics of vocal folds during speech under stress," Proc. ICASSP 2012, pp. 4609-4612, Mar., 2012.
Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda, "Robust seed model training for speaker adaptation using pseudo-speaker features generated by inverse CMLLR transformation," Proc. ASRU 2011, pp. 169-172, Dec., 2011.
Arata Itoh, Sunao Hara, Norihide Kitaoka, Kazuya Takeda, "Training robust acoustic models using features of pseudo-speakers generated by inverse CMLLR transformation," Proc. APSIPA ASC 2011, 5 pages, Oct., 2011.
Huy Dat Tran, Yi Ren Leng, Norihide Kitaoka and Haizhou Li, "On the feasibility of the Mel frequency scale for sound event recognition in realistic conditions," (Invited talk) Inter-noise 2011, 7 pages, Sept., 2011.
Tetsuji Ogawa, Takanobu Nishiura, Takeshi Yamada, Norihide Kitaoka, and Tetsunori Kobayashi, "Development and evaluation of Japanese Lombard speech corpus," (Invited talk) Inter-noise 2011, 8 pages, Sept., 2011.
Sunao Hara, Norihide Kitaoka, Kazuya Takeda, "On-line detection of task incompletion for spoken dialog systems using utterance and behavior tag N-gram vectors," International Workshop on Spoken Dialog Systems (IWSDS2011), pp. 211-221, Sept., 2011.
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "An analysis of the speech under stress using the two-mass vocal fold model," International Workshop on Spoken Dialog Systems (IWSDS2011), pp. 53-58, Sept., 2011.
Sunao Hara, Norihide Kitaoka, Kazuya Takeda, "Detection of task-incomplete dialogs based on utterance-and-behavior tag N-gram for spoken dialog systems," Proc. INTERSPEECH2011, pp. 1305-1308, Aug., 2011.
Yiren Leng, Huy Dat Tran, Norihide Kitaoka, Haizhou Li, "Alternative Frequency Scale Cepstral Coefficient for Robust Sound Event Recognition," Proc. INTERSPEECH2011, pp. 297-300, Aug., 2011.
Ryo Nakagawa, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda, "Retrieval system of driving situations based on similarity-measure of driving behavior signals," 5th Biennial Workshop on Digital Signal Processing for In-Vehicle Systems, Sep., 2011.
Yiyang Li, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda, "Driving scene retrieval based on detection of surrounding vehicles and road configuration," 5th Biennial Workshop on Digital Signal Processing for In-Vehicle Systems, Sep., 2011.
Hiromasa Ohashi, Sunao Hara, Norihide Kitaoka, Kazuya Takeda, "Music Recommendation System Based on Human-to-human Conversation Recognition," 2nd International Workshop on Human-Centric Interfaces for Ambient Intelligence (HCIAmI'11), pp. 352-361, Jul., 2011.
Chiyomi Miyajima, Hiroki Ukai, Atsumi Naito, Hideomi Amata, Norihide Kitaoka, Kazuya Takeda, "Driver risk evaluation based on acceleration, deceleration, and steering behavior," Proc. of ICASSP, pp. 1829-1832, 2011.
Satoshi Tamura, Chiyomi Miyajima, Norihide Kitaoka, Takeshi Yamada, Satoru Tsuge, Tetsuya Takiguchi, Kazumasa Yamamoto, Takanobu Nishiura, Masato Nakayama, Yuki Denda, Masakiyo Fujimoto, Shigeki Matsuda, Tetsuji Ogawa, Shingo Kuroiwa, Kazuya Takeda, and Satoshi Nakamura, "CENSREC-1-AV: An audio-visual corpus for noisy bimodal speech recognition," 2010 International Conference on Auditory and Visual Speech Processing (AVSP 2010), Hakone, Japan, Sept.-Oct. 2010.
Sunao Hara, Norihide Kitaoka, Kazuya Takeda, "Automatic detection of task-uncompleted dialog for spoken dialog system based on dialog act N-gram," Proc. INTERSPEECH 2010, pp.3034-3037, Sep, 2010.
Yi Ren Leng, Huy Dat Tran, Norihide Kitaoka, Haizhou Li, "Selective Gammatone filterbank feature for robust sound event recognition," Proc. INTERSPEECH 2010, pp.2246-2249, Sep, 2010.
Atsumi Naito, Chiyomi Miyajima, Takanori Nishino, Norihide Kitaoka, and Kazuya Takeda, "Driver evaluation based on classification of rapid decelerating patterns," IEEE International Conference on Vehicular Electronics and Safety (ICVES2009), pp. 113-117, Nov. 2009. (Best Paper Award)
Hideomi Amata, Chiyomi Miyajima, Takanori Nishino, Norihide Kitaoka, and Kazuya Takeda, "Prediction model of driving behavior based on traffic conditions and driver types," 12th IEEE International Conference on Intelligent Transportation Systems (ITSC 2009), (aural), pp. 747-752, St. Louis, Missouri, U.S.A., Oct. 3-7 (Oct. 7), 2009.
Lucas Malta, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda, "Multimedia corpus of driving behaviors," IEEE International Workshop on Multimedia Signal Processing (MMSP'09), (4 pages), Oct. 2009.
Toshihiko Itoh, Norihide Kitaoka, Ryota Nishimura, "Subjective experiments on influence of response timing in spoken dialogues," Proc. Interspeech 2009, pp. 1835-1838, Sept. 2009.
Lucas Malta, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda, "Multimodal estimation of a driver's spontaneous irritation," Proc. 2009 Intelligent Vehicles Symposium, (5 pages) June 2009.
Yoshihiro Nishiwaki, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda, "A stochastic signal model for predicting the vehicle trajectory at lane change," Proc. 4th Biennial Workshop on Digital Signal Processing for In-Vehicle Systems and Safety, (4 pages) Dallas, Texas, U.S.A., June 25-27, 2009.
Lucas Malta, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda, "Multimodal real-world driving data collection and analysis," Proc. 4th Biennial Workshop on Digital Signal Processing for In-Vehicle Systems and Safety, Dallas, Texas, U.S.A., June 25-27, 2009.
Norihide Kitaoka, Makoto Sakai, Yuya Hattori, Seiichi Nakagawa, Kazuya Takeda, "Evaluation of discriminant analysis-based feature transformation and discriminative training for speech recognition," SPECOM2009, pp 47-50, June, 2009.
Makoto Sakai, Norihide Kitaoka, Kazuya Takeda, "Feature transformation based on discriminant analysis preserving local structure for speech recognition," ICASSP2009, pp.3813-3816, Apr. 2009.
Yuji Kinoshita, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "Spoken dialog strategy based on understanding graph search," ICASSP2009, 4797-4800, Apr. 2009.
Yoshihiro Nishiwaki, Chiyomi Miyajima, Hidenori Kitaoka, Kazuya Takeda, "Stochastic modeling of vehicle trajectory during lane-changing," ICASSP2009, pp. 1377-1380, Apr., 2009.
Sunao Hara, Chiyomi Miyajima, Katsunobu Ito, Norihide Kitaoka, Kazuya Takeda, "Data collection and usability study of a PC-based speech application in various user environments," Proc. Oriental-COCOSDA 2008, (6 pages), Nov., 2008.
Lucas Malta, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda. "Multimodal estimation of a driver's affective state," Proc. of the Workshop on Affective Interaction in Natural Environments in International Conference on Multimodal Interfaces, 5 pages, Oct. 2008.
Madoka Miki, Chiyomi Miyajima, Takanori Nishino, Norihide Kitaoka, and Kazuya Takeda. "An integrative recognition method for speech and gestures," 2008 International Conference on Multimodal Interfaces (ICMI2008), pp. 93-96, Oct. 2008.
Satoshi Tamura, Chiyomi Miyajima, Norihide Kitaoka, Satoru Hayamizu and Kazuya Takeda, "CENSREC-AV: An evaluation frameworks for audio-visual speech recognition," AVSP2008, pp 51-54, Sept. 2008.
Ryoei Takahashi, Yasunari Ohishi, Norihide Kitaoka, and Kazuya Takeda, "Building and combining document and music spaces for music query-by-webpage system," INTERSPEECH2008, pp. 2020-2023, Sept. 2008.
Yasuhisa Fujii, Kazumasa Yamamoto, Norihide Kitaoka, and Seiichi Nakagawa, "Class lecture summarization taking into account consectiveness of important sentences," INTERSPEECH2008, pp. 2438-2491, Sep. 2008.
Masato Nakayama, Takanobu Nishiura, Yuki Denda, Norihide Kitaoka, Kazumasa Yamamoto, Takeshi Yamada, Satoru Tsuge, Chiyomi Miyajima, Masakiyo Fujimoto, Tetsuya Takiguchi, Satoshi Tamura, Tetsuji Ogawa, Shigeki Matsuda, Shingo Kuroiwa, Kazuya Takeda, and Satoshi Nakamura, "CENSREC-4: Development of evaluation framework for distant-talking speech recognition under reverberant environments," INTERSPEECH2008, pp. 968-971, Sept. 2008.
Ryota Nishimura, Norihide Kitaoka, and Seiichi Nakagawa, "Analysis of relationship between impression of human-to-human conversations and prosodic change and its modeling," INTERSPEECH2008, pp. 537-540, Sep. 2008.
Longbiao Wang, Seiichi Nakagawa and Norihide Kitaoka, "Blind dereverberation based on CMN and spectral subtraction by multi-channel LMS algorithm," INTERSPEECH2008, pp. 1032-1035, Sep. 2008.
Yoshihiro Nishiwaki, Chiyomi Miyajima, Norihide Kitaoka, Ryuta TERASHIMA, Toshihiro Wakita, Kazuya Takeda, "Generating lane-change trajectories of individual drivers," 2008 IEEE International Conference on Vehicular Electronics and Safety, pp. 271-275, Sep. 2008.
Hideomi Amata, Chiyomi Miyajima, Akira Ozaki,Takanori Nishino, Norihide Kitaoka, and Kazuya Takeda, ``Abrupt steering detection based on the road construction ordinance and vehicle acceleration captured with drive recorders,'' 2008 IEEE International Conference of Innovative Computing Information and Control (ICICIC2008), 4 pages, Dalian, China, June 2008.
Longbiao Wang, Norihide Kitaoka, and Seiichi Nakagawa, "Robust distant speech recognition by combining variable-term spectrum based position-dependent CMN with conventional CMN," Asian Workshop on Speech Science and Technology 2008, Mar., 2008.
Longbiao Wang, Norihide Kitaoka, and Seiichi Nakagawa, "Blind dereverberation based on spectral subtraction by multi-channel LMS algorithm for distant-talking speech recognition," LangTech2008, pp. 15-18, Feb., 2008.
Norihide Kitaoka, Kazumasa Yamamoto, Tomohiro Kusamizu, Seiichi Nakagawa, Takeshi Yamada, Satoru Tsuge, Chiyomi Miyajima, Takanobu Nishiura, Masato Nakayama, Yuki Denda, Masakiyo Fujimoto, Tetsuya Takiguchi, Satoshi Tamura, Shingo Kuroiwa, Kazuya Takeda, Satoshi Nakamura, "Development of VAD evaluation framework CENSREC-1-C and investigation of relationship between VAD and speech recognition performance," ASRU-2007,607-612, Dec. 2007.
Kazuhiro Morimoto, Chiyomi Miyajima, Norihide Kitaoka, Katunobu Itou, Kazuya Takeda, "Statistical segmentation and recognition of fingertip trajectories for a gesture interface," International Conference on Multimodal Interface (ICMI2007), pp. 54-57, Nov., 2007.
Ryota Nishimura, Norihide Kitaoka, Seiichi Nakagawa, "A spoken dialog system for chat-like conversations considering response timing," 10th International Conference on Text, Speech, and Dialogue (TSD2007), pp. 599-606, Sep., 2007.
Makoto Sakai, Norihide Kitaoka, Seiichi Nakagawa, "Selection of optimal dimensionality reduction method using Chernoff bound for segmental unit input HMM," INTERSPEECH-EUROSPEECH 2007, pp. 1110-1113, Aug., 2007.
Yasuhisa Fujii, Norihide Kitaoka, Seiichi Nakagawa, "Automatic extraction of cue phrases for important sentences in lecture speech and automatic lecture speech summarization," INTERSPEECH-EUROSPEECH 2007, 2801-2804, Aug., 2007.
Ryota Nishimura, Norihide Kitaoka, Seiichi Nakagawa, "Prosody change and response timing analysis in spontaneously spoken dialogs and their modeling in a spoken dialog system," INTERSPEECH-EUROSPEECH 2007, pp. 2565-2568, Aug., 2007.
Chiyomi Miyajima, Takashi. Kusakawa, Takanori. Nishino, Norihide. Kitaoka, Katunobu. Itou, and Kazuya. Takeda. "On going data collection for driving behavior signal," Biennial on DSP for in-Vehicle and Mobile Systems, Paper ID 108 (4 pages), Jun., 2007.
Yoshihiro Nishiwaki, Chiyomi Miyajima, Norihide Kitaoka, Katsunobu Itou, Kazuya Takeda. "Generation of pedal operation patterns of individual drivers in car-following for personalized cruise control," 2007 IEEE Intelligent Vehicles Symposium, pp. 823-827, Jun., 2007.
(Invited) Norihide Kitaoka, "Liveliness of spoken dialog systems - considering response timing and prosodic synchrony -," International Symposium on Universal Comunication, pp. 63-66, Jun., 2007.
Makoto Sakai, Norihide Kitaoka, Seiichi Nakagawa. "Generalization of linear discriminant analysis used in segmental unit input HMM for speech recognition," IEEE ICASSP 2007, Vol. 4, pp. 333-336, April, 2007.
Longbiao Wang, Norihide Kitaoka, Seiichi Nakagawa. "Robust distant speech recognition by combining position-dependent CMN with conventional CMN," IEEE ICASSP 2007 Vol. 4, 817-820, April, 2007.
Makoto Sakai, Norihide Kitaoka, and Seiichi Nakagawa. "Power linear discriminant analysis," ISSPA 2007 International Symposium on Signal Processing and its Applications, (4 pages) Feb. 2007.
Longbiao Wang, Norihide Kitaoka, and Seiichi Nakagawa. "Analysis of effect of compensation parameter estimation for CMN on speech/speaker recognition," ISSPA 2007 International Symposium on Signal Processing and its Applications, (4 pages), Feb. 2007.
Norihide Kitaoka, Ying Liang, and Seiichi Nakagawa. "One-pass LVCSR algorithm using linear lexicon search and 1-best approximation tree-structured lexicon search," ISSPA 2007 International Symposium on Signal Processing and its Applications, (4 pages), Feb. 2007.
Norihide Kitaoka, Hirotoshi Yano, Seiichi Nakagawa. "A spoken dialog system with automatic recovery mechanism from misrecognition," IEEE 2006 Workshop on Spoken Language Technology (SLT2006), pp. 202-205, Dec. 2006.
Norihide Kitaoka, Souta Hamaguchi, Seiichi Nakagawa. "Noisy speech recognition based on selection of multiple noise suppression methods using noise GMMs," ICSLP-2006, pp. 2566-2569, Sep. 2006.
Hirotoshi Yano, Norihide Kitaoka, Seiichi Nakagawa. "Correction utterance detection method for spoken dialog systems," 10th International Conference Speech and Computer (SPECOM2005), pp. 199-204, Nov. 2005.
Norihide Kitaoka, Hironori Oshikawa, Seiichi Nakagawa. "Multimodal interface for organization name input based on combination of isolated word recognition and continuous base-word recognition", EUROSPEECH2005, pp.1201-1204, Sep. 2005.
Longbiao Wang, Norihide Kitaoka, Seiichi Nakagawa. "Robust distant speech recognition based on position dependent CMN using a novel multiple microphone processing technique", EUROSPEECH2005, pp.2661-2664, Sep. 2005.
Longbiao Wang, Norihide Kitaoka, Seiichi Nakagawa. "Robust distant speaker recognition based on position dependent cepstral mean normalization," EUROSPEECH2005, pp.1977-1980, Sep. 2005.
Souta Hamaguchi, Norihide Kitaoka, Seiichi Nakagawa. "Robust speech recognition under noisy environments based on selection of multiple noise suppression methods," IEEE-EURASIP Workshop on Nonlinear Signal and Image Processing (NSIP2005), pp. 308-313, May. 2005.
Masakiyo Fujimoto, Satoshi Nakamura, Kazuya Takeda, Shingo Kuroiwa, Takeshi Yamada, Norihide Kitaoka, Kazumasa Yamamoto, Mitsunori Mizumachi, Takanobu Nishiura, Akira Sasou, Chiyomi Miyajima, and Toshiki Endo, "CENSREC-3: Data collection for in-car speech recognition and its common evaluation framework," International Workshop on Realworld Multimedia Corpora in Mobile Environment, Apr. 2005.
Norihide Kitaoka, Masashi Takeuchi, Seiichi Nakagawa, "Response timing detection using prosodic and linguistic information for human-friendly spoken dialog systems ," Second International Workshop on Man-Machine Symbiotic System, pp.81-91, 2004.
Satoshi Nakamura, Kazumasa Yamamoto, Kazuya Takeda,Shingo Kuroiwa, Norihide Kitaoka,Takeshi Yamada,Mitsunori Mizumachi, Takanobu Nishiura, Masakiyo Fujimoto, Akira Saso, Toshiki Endo, "AURORA-2J: Japanese speech data collection for performance evaluation of speech recognition in noise," International Conference on Speech and Language Technology/Oriental-COCOSDA 2004, 2004.
Longbiao Wang, Norihide Kitaoka and Seiichi Nakagawa, "Robust distant speech recognition based on position dependent CMN", ICSLP-2004, pp. 2049-2052, 2004.
Hironori Oshikawa, Norihide Kitaoka and Seiichi Nakagawa, "Speech interface for name Input based on combination of recognition methods using syllable-based N-gram and word dictionary," ICSLP-2004, pp. 177-180, 2004.
Longbiao Wang, Norihide Kitaoka and Seiichi Nakagawa, "Distant speech recognition based on position dependent cepstral mean normalization," IASTED SIP-2004, pp.249-254, 2004.
Masashi Takeuchi, Norihide Kitaoka and Seiichi Nakagawa, "Timing detection for realtime dialog systems using prosodic and linguistic information," International Conference: Speech Prosody 2004, pp. 529-532, 2004.
Satoshi Nakamura, Kazumasa Yamamoto, Kazuya Takeda, Shingo Kuroiwa, Norihide Kitaoka, Takeshi Yamada, Mitsunori Mizumachi, Takanobu Nishiura, Masakiyo Fujimoto, Akira Saso and Toshiki Endo. "Data collection and evaluation of AURORA-2 Japanese corpus," IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU), pp. 619-623, 2003.
Norihide Kitaoka, Masahisa Shingu, Seiichi Nakagawa. "Comparison of effects of acoustic and language knowledge on spontaneous speech perception/recognition between human and automatic speech recognizer," EUROSPEECH2003, pp. 2725-2728, 2003.
Takeshi Yamada, Jiro Okada, Kazuya Takeda, Norihide Kitaoka, Masakiyo Fujimoto, Shingo Kuroiwa, Kazumasa Yamamoto, Takanobu Nishiura, Mitsunori Mizumachi and Satoshi Nakamura. "Integration of noise reduction algorithms for AURORA2 task," EUROSPEECH2003, pp. 1769-1772, 2003.
Norihide Kitaoka, Naoko Kakutani, Seiichi Nakagawa. "Detection and recognition of correction utterance in spontaneously spoken dialog", EUROSPEECH2003, pp. 625-628, 2003.
Masashi Takeuchi, Norihide Kitaoka, Seiichi Nakagawa. "Generation of natural response timing using decision tree based on prosodic and linguistic information," EUROSPEECH2003, pp. 609-612, 2003.
Norihide Kitaoka, Masahisa Shingu, Seiichi Nakagawa. "Effects of acoustic and language knowledge of human and automatic speech recognizer on spontaneous speech perception/recognition," ISCA & IEEE Workshop on Spontaneous Speech Processing and Recognition, pp. 91-94, 2003.
Norihide Kitaoka, Seiichi Nakagawa. "Evaluation of spectral subtraction with smoothing of time direction on the AURORA 2 task," ICSLP-2002, pp. 465-468, 2002.
Naoko Kakutani, Norihide Kitaoka, Seiichi Nakagawa. "Detection and recognition of repaired speech on misrecognized utterances for speech input of car navigation system," ICSLP-2002, pp. 833-836, 2002.
Norihide Kitaoka, Daisuke Yamada, Seiichi Nakagawa. "Speaker independent speech recognition using features based on glottal sound source", ICSLP-2002, pp. 2125-2128, 2002.
Norihide Kitaoka, Ichiro Akahori, Seiichi Nakagawa. "Speech recognition under noisy environments using spectral subtraction with smoothing of time direction and real-time cepstral mean normalization," HSC2001, pp.159-162, 2001.
Tatsuya Kawahara, Norihide Kitaoka, Shuji Doshita. "Concept-based phrase spotting approach for spontaneous speech understanding", IEEE-ICASSP-96, pp.291-294, 1996.
(Abstract reviews)
Kazuya Tsubokura, Yurie Iribe, Norihide Kitaoka, "Dialog Breakdown Detection Using Multimodal Features for Non-Task-Oriented Dialog Systems," GCCE2022, pp. 359-363, Oct., 2022.
Akio Kobayashi, Junji Onishi, Hiromitsu Nishizaki, Norihide Kitaoka, "End-to-End Speech to Braille Translation in Japanese," ICCE2021, 2 pages, Jan., 2022.
Akio Kobayashi, Keiichi Yasu, Hiromitsu Nishizaki, Norihide Kitaoka, "Corpus Design and Automatic Speech Recognition for Deaf and Hard-Of-Hearing People," GCCE2021, pp. 17-18, Oct., 2021.
Chee Siang Leow, Tomoaki Hayakawa, Hiromitsu Nishizaki, Norihide Kitaoka, "Development of a Low-Latency and Real-Time Automatic Speech Recognition System," GCCE2020, pp. 464-467, Oct., 2020.
Jiahao Chen, Ryota Nishimura, Norihide Kitaoka, "E2E Streaming Speech Recognition Using CTC and Local Attention," Proc. NCSP'20, 4 pages, Mar. 2020.
Akihira Komatsu, Ryota Nishimura, Norihide Kitaoka, "Environmental sounds recognition with convolutional-LSTM," GCCE2019, pp. 717-719, 2018.
Norihide Kitaoka, Takuma Nakagawa, Ryota Nishimura, Yoshio Ishiguro, Shin’ichi Kojima, Shin Ohsuga, “A multimodal control system for autonomous vehicles using speech, gesture, and gaze recognition,” DSP in Vehicles 2018, (no paper), 2018.
Ryota Nishimura, Miho Higaki, Norihide Kitaoka, “Mapping acoustic vector space and document vector space by RNN-LSTM,” 2018 IEEE 7th Global Conference on Consumer Electronics, GCCE 2018, pp.296-297, 2018.
Meiko Fukuda, Ryota Nishimura, Norihide Kitaoka, Hiromitsu Nishizaki, Yurie Iribe, “Construction of a corpus for elderly Japanese speech recognition,” 2018 IEEE 7th Global Conference on Consumer Electronics, GCCE 2018, pp.652-653, 2018.
Kanta Kiyohara, Ryota Nishimura, Norihide Kitaoka, “Multi-modal geometry tutoring system using speech and touchscreen figure tracing,” 2018 IEEE 7th Global Conference on Consumer Electronics, GCCE 2018, pp.225-226, 2018.
Takuma Nakagawa, Ryota Nishimura, Yurie Iribe, Yoshio Ishiguro, Shin Osuga, Norihide Kitaoka, "A human machine interface framework for autonomous vehicle control," Proc. GCCE 2017, pp. 411-413, Oct., 2017.
Takuma Nakagawa, Norihide Kitaoka, "Multimodal control system for autonomous vehicles using speec and gesture recognition," 5th ASA/ASJ Joint Meeting, Nov., 2016.
Eichi Seto, Norihide Kitaoka, "Example-based spoken chat system which can be cutomized for each user," 5th ASA/ASJ Joint Meeting, Nov., 2016.
Norihide Kitaoka, Shuhei Segawa, Kazuya Takeda, "Emotion recognition from speech using a physical model," Proc. ICA2016, ICA2016-714 (8 pages), Sep., 2016.
Yurie Iribe, Norihide Kitaoka and Shuhei Segawa, "Speech Corpus Spoken by Young-old, Old-old and Oldest-old Japanese," Proc. LREC 2016, pp. 4674-4677, May, 2016.
Shuhei Segawa, Norihide Kitaoka, Kazuya Takeda, "Elderly person's emotional state estimation in conversation based on speech features for spoken dialogue systems," 12th Western pacific Acoustics Conference 2015 (WESPAC2015), pp. 299-301, Dec., 2015.
Bohan Chen, Norihide Kitaoka, Kazuya Takeda, "Effect of speaking rate and speech complexity on transmission quality during driving navigation task," 7th Biennial Workshop on DSP for In-Vehicle Systems and Safety, 4 pages, Oct., 2015.
Satoshi Tamura, Hiroshi Ninomiya, Norihide Kitaoka, Shin Osuga, Yurie Iribe, Kazuya Takeda, Satoru Hayamizu, "Audio-visual processing toward robust speech recognition in cars," 7th Biennial Workshop on DSP for In-Vehicle Systems and Safety, 4 pages, Oct., 2015.
Yuto Dekiura, Tetsuya Matsumoto, Yoshinori Takeuchi, Hiroaki Kudo, Noboru Onishi, Norihide Kitaoka, Kazuya Takeda, "Fast Separation and Accurate Recognition of Overlapped Speech --- Separation by Spectral Subtraction and Acoustic Model Training using Separated Speeches---," 2015 RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing (NCSP'15), pp. 1-4, Mar., 2015.
Katsuya Sakoyama, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "Tracking Roadside Signage Observed by Drivers," 2014 RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing (NCSP'15), pp. 429-432, Mar., 2015.
Tomoki Hayashi, Norihide Kitaoka, Kazuya Takeda, "Investigation of robustness of deep bottleneck features for speakers of a variety of ages in speech recognition," FORUM ACUSTICUM 2014, (6 pages), Sep., 2014.
Masataka Mori, Chiyomi Miyajima, Takatsugu Hirayama, Norihide Kitaoka, Kazuya Takeda, "Use of driver gaze information for detecting risky lane change," 2014 RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing (NCSP'14), pp. 441-444, Mar., 2014.
Masataka Mori, Chiyomi Miyajima, Takatsugu Hirayama, Norihide Kitaoka, and Kazuya Takeda, "Modeling driver gaze and vehicle operation behavior during lane changes," International Joint Workshop on Advanced Sensing/Visual Attention and Interaction - Toward Creation of Human-Harmonized Information Technology (ASVAI 2013), Okinawa, Japan, Nov. 5, 2013.
Chiyomi Miyajima, Hiroaki Ishikawa, Masataka Kaneko, Norihide Kitaoka, and Kazuya Takeda, "Analysis of driving behavior signals recorded from different types of vehicles using CAN and Smartphone," International Symposium on Future Active Safety Technology toward zero traffic accidents (FAST-zero'13), 6 pages, Nagoya, Sept. 2013.
Masataka Mori, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda, "Comparison of lane change behavior of expert and non-expert drivers," International Symposium on Future Active Safety Technology toward zero traffic accidents (FAST-zero'13), 6 pages, Nagoya, Sept., 2013.
Yiyang Li, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda, "An integrated similarity measure for driving scene retrieval using driving behavior and environmental information," International Symposium on Future Active Safety Technology toward zero traffic accidents (FAST-zero'13), 6 pages, Nagoya, Sept. 2013.
Masataka Mori, Chiyomi Miyajima, Takatsugu Hirayama, Norihide Kitaoka, and Kazuya Takeda, "Analysis of lane change maneuvers based on driver gaze and vehicle operation behavior," International Conference on Driver Distraction and Inattention 2013, (DDI 2013), (oral), Gothenburt, Sweden, Sept. 4-6 , 2013 (to apear).
Norihide Kitaoka, Yuto Dekiura, Kazuya Takeda, "Generative approach for robust acoustic model training for blindly separated speech recognition," Proc. ICA2013/ASA/CAA, p. 3245, Mar. 2013.
Satoru Tsuge, Hiromasa Ohashi, Norihide Kitaoka, Kazuya Takeda, Kenji Kita, "Spoken document retrieval using combinational use of distances of multiple vector spaces and query expansion with optimized weight parameters," Proc. NCSP'13, pp. 9-12, Mar., 2013.
Sunao Hara, Norihide Kitaoka and Kazuya Takeda, "Causal analysis of task incompletion for spoken dialogs focused on interactions of user and the system," Proc. LREC 2012, pp. 1365-1372, May, 2012.
Atsushi Ando, Hiromasa Ohashi, Sunao Hara, Norihide Kitaoka, Kazuya Takeda, "Multi-band speech recognition using band-dependent confidence measures of blind source separation," Acoustics 2012, (6 pages), May, 2012.
Shota Kawabuchi, Chiyomi Miyajima, Norihide Kitaoka and Kazuya Takeda, "Data collection for individuality analysis on subjective music similarity evaluation," Acoustics 2012, (6 pages), May, 2012.
Arata Ito, Sunao Hara, Norihide Kitaoka, and Kazuya Takeda, "Rapid acoustic model adaptation using inverse MLLR-based feature generation," International Congress of Acoustics (ICA2010), pp. 942-947, Aug., 2010.
Sunao Hara, Norihide Kitaoka, and Kazuya Takeda, "Estimation method of user satisfaction using N-gram-based dialog history model for spoken dialog system," LREC2010, pp. 78-83, May, 2010.
Takanobu Nishiura, Masato Nakayama, Yuki Denda, Norihide Kitaoka, Kazumasa Yamamoto, Takeshi Yamada, Satoru Tsuge, Chiyomi Miyajima, Masakiyo Fujimoto, Tetsuya Takiguchi, Satoshi Tamura, Shingo Kuroiwa, Kazuya Takeda, Satoshi Nakamura, "Evaluation framework for distant-talking speech recognition under reverberant environments --- Newest part of the CENSREC series ---," LREC2008, 7 pages, May, 2008.
Akira Ozaki, Sunao Hara, Takashi Kusakawa, Chiyomi Miyajima, Takanori Nishino, Norihide Kitaoka, Katunobu Itou, Kazuya Takeda, "In-car speech data collection along with various multimodal signals," LREC2008, 6 pages, May, 2008.
Longbiao Wang, Norihide Kitaoka, and Seiichi Nakagawa, "Robust speech recognition by combining short-term spectrum based CMN with long-term spectrum based CMN," the Japan-China Joint Conference on Acoustics (JCA2007), P-2-13 (6 pages), Jun., 2007.
Longbiao Wang, Norihide Kitaoka and Seiichi Nakagawa, "Robust distant speaker recognition based on position dependent CMN by combining speaker-specific GMM with speaker adapted syllable-based HMM," Joint Workshop on Hands-Free Speech Communication and Microphone Arrays, 2005.
Norihide Kitaoka, Naoko Kakutani and Seiichi Nakagawa, "A statistical detection method of speaking direction using surrounding microphones," Joint Workshop on Hands-Free Speech Communication and Microphone Arrays, 2005.
Longbiao Wang, Naoko Kakutani, Norihide Kitaoka and Seiichi Nakagawa, "Robust speech recognition in distant environment based on speaker position and speaking direction detection," The 18th International Congress on Acoustics (ICA2004), Vol. IV, pp. 2825-2828, 2004.
Norihide Kitaoka, Ichiro Akahori, Seiichi Nakagawa. "A smoothing method of time direction on speech recognition under noisy environments using spectral subtraction," ICSP-99, pp.381-386, 1999.
Tatsuya Kawahara, Toshihiko Munetsugu, Norihide Kitaoka, Shuji Doshita. "Keyword and phrase spotting with heuristic language model," ICSLP-94, pp.815-818, 1994.
北條圭悟, 高橋快斗, 坂井利光, 若林佑幸, 北岡教英, “Parakeet-TDTを用いた構音障害音声認識の高精度化,” 日本音響学会秋季研究発表会, 1-Q-37, pp. 1-4, Sep., 2025.
高城巽成, 若林佑幸, 北岡教英, “WhisperとLLMによる生成的誤り修正に基づく構音障害音声認識システムの構築,” 日本音響学会秋季研究発表会, 1-Q-38, pp. 1-2, Sep., 2025.
三河多聞, 藤井康寿, 若林佑幸, 太田健吾, 西村良太, 北岡教英, “自己教師あり学習による音声表現を用いた聞き手頭部動作生成,” 日本音響学会秋季研究発表会, 1-Q-38, pp. 1-4, Sep., 2025.
山中 稜斗, 斉藤 翼, 若林 佑幸, 北岡 教英, “大規模言語モデルによるSOAP項目自動生成に対応した電子カルテ音声入力インタフェース,” FIT2025, E-008, p. 1-2, Sep., 2025.
北條圭悟, 若林佑幸, 太田健吾, 小川厚徳, 北岡教英, "注意機構に基づく中間特徴量を用いたCTC音声認識の精度向上," 日本音響学会春季研究発表会, pp. 1-4, Mar., 2025.
高橋快斗, 若林佑幸, 太田健吾, 小林 彰夫, 北岡教英, "聴覚障害者音声における音響と言語の交互適応による音声認識の高精度化" 日本音響学会春季研究発表会, 1-R-15, pp. 1-4, Mar. 2025.
高城巽成, 若林佑幸, 小川厚徳, 北岡教英, "非自己回帰型音声認識モデルにおける内部言語情報推定によるドメイン適応の評価," 日本音響学会春季研究発表会, 1-2-13, pp. 1-4, Mar., 2025
加藤動,ZHOU QIHANG,北岡教英,實廣貴敏, "異常検知技術に基づく畳み込みAutoencoderによる非母国語話者の日本語発話誤り検出," 日本音響学会春季研究発表会, 1-R-11, pp. 1-2, Mar. 2025.
杉本飛馬,西村良太,太田健吾,北岡教英, "HuBERT の中間層別特徴量を用いた相槌生成タイミングの予測," 日本音響学会春季研究発表会, 3-P-11, pp. 1-4, Mar. 2025.
江本城太郎,西村良太,太田健吾,北岡教英, "雑音環境下でのリアルタイムVADレス音声認識モデルの構築と他モデルとの比較," 1-R-2, pp. 1-4, Mar. 2025.
山中稜斗,斉藤翼,北岡教英,"音声認識と複数の大規模言語モデルを活用した電子カルテ自動入力インタフェース,"情報処理学会第87回全国大会,pp.1-2,Mar.2025
斉藤翼, 山中稜斗, 北岡教英, "大規模言語モデルを用いた電子カルテのSOAP作成支援システムの開発", 言語処理学会第31回年次大会, pp.1-6, Mar., 2025.
坪倉和哉, 入部百合絵, 北岡教英, "日本語日常会話における他者開始修復の分析," 言語処理学会第31回年次大会, Mar., 2025.
桑山芳明, 坪倉和哉, 入部百合絵, 横井克典, 中村昭範, 北岡教英, 勝野雅央, "自己教師あり学習を用いた 自由会話音声からの早期アルツハイマー病の予測," 言語処理学会第31回年次大会, Mar., 2025.
山田竜彰, 坪倉和哉, 入部百合絵, 北岡教英,"対話システムにおける個人特性を考慮した破綻度合い推定," 言語処理学会第31回年次大会, Mar., 2025.
北條圭悟, 若林佑幸, 太田健吾, 小川厚徳, 北岡教英, "中間層出力を用いた自己教師あり学習に基づく音声認識モデルの構築," SPEASIPワークショップ2025, pp. 1-6, Mar., 2025.
金井 良賢,若林 佑幸,西村 良太,北岡 教英,"音声対話システムのための発話終了時間推定手法の高精度化とその評価," SPEASIPワークショップ2025, pp. 1-6, Mar., 2025.
三河多聞, 若林佑幸, 太田健吾, 西村良太, 北岡教英, "音声自己教師ありモデルによる日本語雑談対話における聞き手の頭部反応動作のマルチモーダル生成," SPEASIPワークショップ2025, pp. 1-6, Mar., 2025.
高橋快斗, 若林佑幸, 太田健吾, 北岡教英, "音響と言語の交互適応に基づく高齢者音声認識の性能改善," SPEASIPワークショップ2025, pp. 1-6, Mar., 2025.
内山慎太郎, 高城巽成, 若林佑幸, 北岡教英, "非自己回帰音声認識モデルのドメイン適応における温度パラメータの効果," SPEASIPワークショップ2025, pp. 1-6, Mar., 2025.
三河 多聞, 若林 佑幸, 太田 健吾, 西村 良太, 北岡 教英, "マルチモーダル対話システムの構築に向けたマルチモーダル日本語雑談対話データセットの構築と分析," 対話システムシンポジウム, Nov. 2024.
坂井 利光, 若林 佑幸, 北岡 教英, "雑音・無音ラベリングによる音声区間検出が不要な音声認識," 音響学会秋季研究発表会, 2 pages, Sep., 2024.
金井 良賢, 若林 佑幸, 西村 良太, 北岡 教英, "wav2vec 2.0による言語特徴を考慮した音声対話システムへの入力発話の終了時間推定," 音響学会秋季研究発表会, 2 pages, Sep., 2024.
高橋 快斗, 若林 佑幸, 太⽥ 健吾, ⼩林 彰夫, 北岡 教英, "聴覚障害者音声におけるエンコーダ層置換による音声認識の高精度化," 音響学会秋季研究発表会, 2 pages, Sep., 2024.
北條 圭悟 , 若林 佑幸, 太田 健吾, 小川 厚徳, 北岡 教英, "注意機構を用いたエンコーダ層の重みづけによるCTC音声認識モデルの性能改善," 音学シンポジウム, Jun. 2024.
YANG TINGCHENG, 細田 侑也, 若林 佑幸, 北岡 教英, “LSTMに基づいたL2学習者の日本語発音スコアリング,” 情報処理学会第86回全国大会, 4R-08, Mar., 2024.
坪倉 和哉, 岡田 真依, 入部 百合絵, 北岡 教英, “対話破綻修復コーパスの収集と分析 ーユーザの個人特性とシステムとの関係性を考慮した修復文生成に向けてー,” 言語処理学会第30回年次大会, pp. 1436-1440 (P5-18), Mar., 2024.
岡田 智哉, 入部 百合絵, 横井 克典, 中村 昭範, 北岡 教英, 勝野 雅央, “認知症病因物質がもたらす会話内容への影響分析と発症前アルツハイマー病の予測,” 言語処理学会第30回年次大会, pp. 571-575 (P2-22), Mar., 2024.
長江 勇樹, 岡田 智哉, 入部 百合絵, 横井 克典, 中村 昭範, 北岡 教英, 勝野 雅央, “自由会話のトピックモデルに基づいた軽度認知障害の検出,” 言語処理学会第30回年次大会,pp. 472-476 (P2-4), Mar., 2024.
丸山 由華, 入部 百合絵, 北岡 教英, 横井 克典, 勝野 雅央, “パーキンソン病患者の会話音声における音素・音節の比較分析, ” 日本音響学会春季研究発表会, 2-P-18, Mar., 2024.
高城 巽成, 若林 佑幸, 小川 厚徳, 北岡 教英, “CTCを用いたストリーミング音声認識における言語情報の置換によるドメイン適応,” 日本音響学会春季研究発表会, 1-Q-22, Mar., 2024.
金井 良賢, 若林 佑幸, 西村 良太, 北岡 教英, “円滑な音声対話システムのための発話終了時間の事前推定,” 日本音響学会春季研究発表会, 2-P-7, Mar., 2024.
高橋 快斗, 木内 貴浩, 高城 巽成, 若林 佑幸, 太田 健吾, 小林 彰夫, 北岡 教英, “聴覚障害者音声における自己教師あり学習に基づく音声認識の評価,” 日本音響学会春季研究発表会, 1-Q-23, Mar., 2024.
三河 多聞, 藤井 康寿, 太田 健吾, 若林 佑幸, 北岡 教英, “マルチモーダル雑談対話データセットにおける対話相手の音声に対する人間の頭部動作の解析,” 日本音響学会春季研究発表会, 2-P-8, Mar., 2024.
Li Chengfeng, 高城 巽成, 若林 佑幸, 北岡 教英, “ChatGPTによるデータ拡張に基づく電子カルテ入力用に適応した音声認識モデルの構築,” 日本音響学会春季研究発表会, 1-Q-24, Mar., 2024.
木内 貴浩, 小川 厚徳, 若林 佑幸, 太田 健吾, 北岡 教英, “多言語SSLモデルに基づく音声認識の大規模音声データのみを用いたドメイン適応,” 日本音響学会春季研究発表会, 1-2-2, Mar., 2024.
新惠 拓実, 木内 貴浩, 若林 佑幸, 北岡 教英, “年齢推定タスクの併用による高齢者音声認識の高精度化,” 日本音響学会春季研究発表会, 1-2-5, Mar., 2024.
今本 麟太朗, 西村 良太, 太田 健吾, 北岡 教英, “相槌生成と話者交替のモデルを組み込んだリアルタイム音声対話システムの構築と評価,” 日本音響学会春季研究発表会, 2-P-6, Mar., 2024.
江本 城太郎, 西村 良太, 太田 健吾, 北岡 教英, “雑音・無音棄却型リアルタイムVADレス音声認識モデルの開発,” 日本音響学会春季研究発表会, 1-Q-14, Mar., 2024.
福永 善理, 西村 良太, 太田 健吾, 北岡 教英, “深層学習を用いた自然な音声対話システムのための相槌表層選択モデルの構築,” 日本音響学会春季研究発表会, 2-P-4, Mar., 2024.
福田 芽衣子, 西村 良太, 入部 百合絵, 山本 一公, 北岡 教英, “EARS:日本人超高齢者音声コーパスの構築,” 日本音響学会春季研究発表会, 1-2-4, Mar., 2024.
高城 巽成, 若林 佑幸, 小川 厚徳, 北岡 教英, “CTC音声認識モデルにおけるビームサーチデコーディング内での暗黙的言語情報の置換,” SPEASIPワークショップ2024, pp. 1-6, Mar., 2024.
細井 颯太, 木内 貴浩, 若林 佑幸, 北岡 教英, “x-vectorの話者空間を利用した2話者間の中間話者音声合成,” SPEASIPワークショップ2024, pp. 1-6, Mar., 2024.
木内 貴浩, 小川 厚徳, 若林 佑幸, 太田 健吾, 北岡 教英, “多言語SSLモデルに基づく音声認識のノンパラレルコーパスのみを用いたドメイン適応,” SPEASIPワークショップ2024, pp. 1-6, Mar., 2024.
高橋 快斗, 木内 貴浩, 若林 佑幸, 太田 健吾, 小林 彰夫, 北岡 教英, “話者適応による聴覚障害者音声認識の評価,” SPEASIPワークショップ2024, pp. 1-6, Mar., 2024.
北條 圭悟, 若林 佑幸, 太田 健吾, 小川 厚徳, 北岡 教英, “複数音声認識モデルを統合した音声認識システムの高精度化,” SPEASIPワークショップ2024, pp. 1-6, Mar., 2024.
新惠 拓実, 木内 貴浩, 若林 佑幸, 北岡 教英, “年齢情報とのマルチタスク学習による高齢者音声認識の高精度化,” SPEASIPワークショップ2024, pp. 1-6, Mar., 2024.
前島 亮, 北岡 教英, “大規模言語モデルを活用した電子カルテ一括音声入力インタフェースの構築と評価,” SPEASIPワークショップ2024, pp. 1-6, Mar., 2024.
塩根 凪人, 若林 佑幸, 北岡 教英, “言語現象と非言語現象も検出する音声認識システムの提案,” 日本音響学会秋季研究発表会, 2-Q-3, Sep., 2023.
木内 貴浩, 小川 厚徳, 若林 佑幸, 北岡 教英, “SSLに基づく音声データのみを用いた音声認識モデルのドメイン適応,” 日本音響学会秋季研究発表会, 2-Q-9, Sep., 2023.
北條 圭悟, 森 大輝, 若林 佑幸, 小川 厚徳, 北岡 教英, “Density Ratio Approach に基づく複数音声認識モデルの統合による頑健な音声認識システムの構築,” 日本音響学会秋季研究発表会, 2-Q-10, Sep., 2023.
古藤 快都, 西村 良太, 太田 健吾, 北岡 教英, “単言語話者による多言語音声合成モデルの構築と評価,” 日本音響学会秋季研究発表会, 2-Q-37, Sep., 2023.
三河 多聞, 山岡 大志, 北岡 教英, “End-to-end モデルを用いたオーバーラップに頑健な音声認識モデルの評価,” 日本音響学会秋季研究発表会, 3-Q-1, Sep., 2023.
北條 圭悟, 河東 宗祐, 北岡 教英, “認識困難な単語に注目した文章生成と音声合成による音声認識のためのデータ拡張,” 日本音響学会秋季研究発表会, 3-Q-2, Sep., 2023.
高城 巽成, 小川 厚徳, 北岡教 英, 若林 佑幸, “CTC デコーダを用いたストリーミング可能な音声認識におけるDensity Ratio Approach に基づくドメイン適応,” 日本音響学会秋季研究発表会, 3-Q-6, Sep., 2023.
前島 亮, 森 大輝, 若林 佑幸, 北岡 教英, “音声認識を活用した医療用電子カルテ項目別自動入力インタフェースの構築,” FIT2023, Sep., 2023.
前島 亮, 北岡 教英, “連続音声認識とChatGPTを活用した医療用電子カルテ項目別自動入力インタフェースの構築,” 東海支部連合大会, Aug., 2023.
長江 勇樹, 岡田 智哉, 入部 百合絵, 北岡 教英, 横井 克典, 勝野 雅央, “認知症患者の自由会話音声から抽出した言語的特徴の解析,” 東海支部連合大会, Aug., 2023.
高城 巽成, 小川 厚徳, 北岡 教英, 若林 佑幸, “暗黙的言語情報を置換するCTCデコーダを用いたストリーミングEnd-to-End音声認識,” 音学シンポジウム, Jun., 2023.
木内 貴浩, 小川 厚徳, 若林 佑幸, 北岡 教英, “目標ドメイン音声を用いた自己教師あり学習に基づく音声認識モデルのドメイン適応,” 音学シンポジウム, Jun., 2023.
塩根 凪人, 若林 佑幸, 北岡 教英, “言語情報と言語・非言語現象を同時認識する音声認識モデルの構築,” 音学シンポジウム, Jun., 2023.
前島 亮・森 大輝・若林佑幸・北岡教英, "小規模学習データドメインのための文生成に基づく音声認識用言語モデルの構築," SPEASIPワークショップ, Mar., 2023.
塩根凪人・若林佑幸・北岡教英, "言語・非言語情報タグを付与する音声認識モデルの検討," SPEASIPワークショップ, Mar., 2023.
堀井 こはる,太田 健吾,西村 良太,小川 厚徳,北岡 教英, "自発的発話認識のためのBERTによる非流暢文生成に基づく言語モデリング," 日本音響学会講演論文集, 1-3-2, Mar., 2023.
伊達 龍斗,太田 健吾,西村 良太,北岡 教英, "深層学習による口唇情報を用いた雑音下での音声認識精度の改善," 日本音響学会講演論文集, 1-3P-3, Mar., 2023.
北條 圭悟,森 大輝,若林 佑幸,小川 厚徳,北岡 教英, "複数Encoder-Decoder 音声認識モデルの統合による頑健な音声認識システムの構築," 日本音響学会講演論文集, 1-3Q-3, Mar., 2023.
杉山 雅和,太田 健吾,西村 良太,北岡 教英, "割り込み発話にも対応可能なリアルタイム話者交替システム," 日本音響学会講演論文集, 2-3P-1, Mar., 2023.
坪倉和哉, 武田拓也, 入部百合絵 , 北岡教英, "音声対話システムの対話破綻に対するユーザの反応と個人特性との関連," 言語処理学会第29回年次大会, pp. 2002-2006, Mar., 2023.
堀田慎,堀井こはる,北岡教英,西崎博光,"日本語音声認識結果の整形に基づく分かりやすい英語字幕の生成," 情報処理学会第85回全国大会, 1W-01, Mar., 2023.
鳥井章宏, 西村良太, 北岡教英, "音声対話システムにおける対話破綻検出器の構築," 令和4年度 電気・電子・情報関係学会 四国支部連合大会 講演論文集, vol. 15?8, pp. 145?145, 2022.
福村考洋, 西村良太, 北岡教英, "BERT による雑談対話話題拡張," 令和4年度 電気・電子・情報関係学会 四国支部連合大会 講演論文集, vol. 15?9, pp. 146?146, 2022.
堀井こはる, 福田芽衣子, 太田健吾, 西村良太, 小川厚徳, 北岡教英, "End-to-End非流暢整形音声認識システムの対話音声による評価," 日本音響学会講演論文集, 2-8-5, Sep., 2022.
森大輝, 太田健吾, 西村良太, 北岡教英, "ドメイン外音響情報で補強したEncoder-Decoder音声認識モデルの設計," 日本音響学会講演論文集, 2-Q-26, Sep., 2022.
坪倉和哉, 入部百合絵, 北岡教英, "マルチモーダル対話システムにおける対話破綻時のユーザの個人差," 日本音響学会講演論文集, 3-Q-13, Sep., 2022.
岡田智哉, 入部百合絵, 北岡教英, "BERTを用いた雑談対話音声からの認知症疑い検出," 日本音響学会講演論文集, 3-Q-29, Sep., 2022.
福田 芽衣子,杉山 雅和,西村 良太,入部 百合絵,山本 一公,北岡 教英, "超高齢者コーパスとS-JNASを用いた高齢者音声の音響的特徴の分析," 日本音響学会講演論文集, 3-Q-32, Sep., 2022.
丸山由華, 入部百合絵, 北岡教英, 横井克典, 勝野雅央, "パーキンソン病の重症度に基づく音響的特徴量の分析," 日本音響学会講演論文集, 3-Q-43, Sep., 2022.
丸山由華,入部百合絵,北岡教英,横井克典,勝野雅央, "音響情報を用いた短い発話音声からのハ゜ーキンソン病検出," 日本音響学会講演論文集, 2-3P-10, Mar., 2022.
森 大輝,太田 健吾,西村 良太,小川厚徳, 北岡 教英, "タスク外音響情報を付加したEnd-to-End音声認識モデルの設計," 日本音響学会講演論文集, 2-3Q-2, Mar., 2022.
堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,小川厚徳,北岡 教英, "非流暢ラベルを用いた言い淀み整形End-to-End音声認識," 日本音響学会講演論文集, 1-3-5, Mar., 2022.
堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,北岡 教英, “言い淀みを考慮したEnd-to-End音声認識,” 第19回情報学ワークショップ(WiNF2021), S-5-2, Nov. 2021.
木内 貴浩, 北岡 教英, "発話整形した対話履歴を用いた雑談応答生成システム," 第19回情報学ワークショップ(WiNF2021), S-5-3, Nov. 2021.
森 大輝,太田 健吾,西村 良太,北岡 教英, "Encoder-Decoder音声認識モデルにおける暗黙的言語情報の置換法," 第19回情報学ワークショップ(WiNF2021), S-5-5, Nov. 2021.
森 大輝,太田 健吾,西村 良太,小川 厚徳,北岡 教英, “Encoder-Decoder音声認識モデルにおける暗黙的言語情報の置換法,” 日本音響学会講演論文集, 1-3-1, Sep., 2021.
堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,北岡 教英, “言い淀みを考慮した自由発話のEnd-to-End音声認識,” 日本音響学会講演論文集, 1-3-3, Sep., 2021.
Zolzaya Byambadorj,Ryota Nishimura,Altangerel Ayush,Kengo Ohta,Norihide Kitaoka, “Cross-lingual, multi-speaker text-to-speech synthesis for low resource languages,” 日本音響学会講演論文集, 1-3-7, Sep., 2021.
Narangerel Purevdorj,Ryota Nishimura,Altangerel Ayush,Kengo Ohta,Norihide Kitaoka, “How language similarity affects the Mongolian ASR using cross-lingual transfer learning,” 日本音響学会講演論文集, 2-3-7, Sep., 2021.
小林 彰夫,大西 淳児,西崎 博光,北岡 教英, “読み上げ文を対象としたEnd-to-End音声点訳,” 日本音響学会講演論文集, 2-3P-3, Sep., 2021.
福田 芽衣子,西村 良太,西崎 博光,入部 百合絵,山本 一公,北岡 教英, “超高齢者音声コーパスEARSにおける超高齢者の音響的特徴,” 日本音響学会講演論文集, 2-3P-11, Sep., 2021.
西村 良太,森 貴大,北岡 教英, “ROSを利用したリアルタイム制御が可能な音声対話システムの構築,” 日本音響学会講演論文集, 2-3Q-4, Sep., 2021.
北岡 教英,西村 良太,太田 健吾,石川 晃之,石川 友香,中野 涼太,田中 五大,鍋倉彩那,佐藤 辰耶,渡邊 凌太,大須賀 晋, “3D CGエージェントSayaとの対話における応答制御,” 日本音響学会講演論文集, 3-3-14, Sep., 2021.
横井 克典, 坪井 崇, 服部 誠, 佐竹 勇紀, 平賀 経太, 田中 康博, 佐藤 茉紀, 堀 明洋, 入部 百合絵, 北岡 教英, 勝野 雅央, "パーキンソン病患者の音読と会話の自然言語処理," パーキンソン病・運動障害疾患コングレスプログラム・抄録集 15回 p. 81, Jul., 2021.
森大輝,太田健吾,西村良太,小川厚徳,北岡教英 "End-to-end音声認識モデルにおける暗黙的言語情報の置換法" 音学シンポジウム, Jun., 2021.
堀井こはる,福田芽衣子,太田健吾,西村良太,北岡教英 "言い淀みラベル付けによる非流暢発話のEnd-to-End音声認識" 音学シンポジウム, Jun., 2021.
北岡 教英,西村 良太,太田 健吾,石川 晃之,石川 友香(TELYUKA),中野 涼太,田中 五大,鍋倉彩那,佐藤 辰耶,渡邊 凌太,大須賀 晋, “フォトリアルCGエージェントとのマルチモーダル対話システムの構築,” 日本音響学会講演論文集, 1‐2‐6, Mar., 2021.
太田 健吾,西村 良太,北岡 教英, “アクセント句を考慮した日本語End-to-End音声合成サーバの構築,” 日本音響学会講演論文集, 1-2-7, Mar., 2021.
小林 彰夫,安 啓一,西崎 博光,北岡 教英, “聴覚障害者の音声データの収集と音素認識による評価,” 日本音響学会講演論文集, 2-2-4, Mar., 2021.
下笠 元暉,西崎 博光,北岡 教英, “超高齢者音声認識のためのCycleGANを用いたデータ拡張,” 日本音響学会講演論文集, 2-2P-6, Mar., 2021.
Narangerel Purevdorj,Ryota Nishimura,Altangerel Ayush, Kengo Ohta, Norihide Kitaoka, "Building low resource speech recognizer: Transfer learning and data augmentation," 日本音響学会講演論文集, 3-2-9, Mar., 2021.
Zolzaya Byambadorj,Ryota Nishimura,Altangerel Ayush, Kengo Ohta,Norihide Kitaoka, "Text to speech system for low resource languages by cross-lingual transfer learning and data augmentation," 日本音響学会講演論文集, 3-2-10, Mar., 2021.
梅澤舞菜, 入部百合絵, 北岡教英, "音声言語情報に基づいた認知症高齢者の判別," 信学技報(SP2020-12, WIT2020-12), 6 pages, Oct. 2020.
福田芽衣子, 入部百合絵, 西崎博光, 山本一公, 西村良太, 北岡教英, "超高齢者音声コーパスEARSの構築と音声認識へ利用の予備的検討," 情処研報, Vol.2020-SLP-133 No.6, pp. 1-6, Oct. 2020.
レオ チーシャン,西崎 博光,北岡 教英, "Kaldiベースの低遅延リアルタイム音声認識システムの開発と評価," 日本音響学会講演論文集, 2-P1-3, pp. ???-???, Sep.., 2020.
鈴木 海斗, 入部 百合絵,北岡 教英, "顔表情と音響情報を用いた対話破綻検出," 日本音響学会講演論文集, 2-P1-4, pp. ???-???, Sep.., 2020.
山崎 大河,西村 良太,北岡 教英, "感情表現が可能なEnd-to-End日本語音声合成システムの構築," 日本音響学会講演論文集, 2-P1-2, pp. ???-???, Sep.., 2020.
石原 颯人,入部 百合絵,北岡 教英, "文章の複雑さを考慮した雑談対話音声からの認知症傾向検出," 日本音響学会講演論文集, 2-P1-2, pp. ???-???, Sep.., 2020.
Byambadorj Zolzaya, Ryota Nishimura, Ayush Altangerel, Norihide Kitaoka "Normalization of transliterated words using seq2seq model with spell checker," 言語処理学会第26回年次大会, E5-3, pp.1133-1136, Mar. 2020.
陳 家浩,西村 良太,北岡 教英, "Uni-directional LSTM と Local Attentionを用いたストリーミング音声認識," 日本音響学会講演論文集, 2-Q-12, pp. 943-946, Mar., 2020.
福田 芽衣子,西崎 博光,入部 百合絵,西村 良太,北岡 教英, "高齢者音声コーパス構築と音声認識への年齢・方言の影響の分析," 日本音響学会講演論文集, 2-Q-13, pp. 947-950, Mar., 2020.
小橋 優矢,西村 良太,北岡 教英, "書き言葉から話し言葉へのテキスト変換を用いた話し言葉音声認識用言語モデルの評価," 日本音響学会講演論文集, 2-Q-13, pp. 951-954, Mar., 2020.
森 雷太,西村 良太,北岡 教英, "自由発話に対応した照応解析を備えた音声対話システム," 日本音響学会講演論文集, 3-P-13, pp. 1023-1026, Mar., 2020.
清原侃太,西村良太,北岡教英, "音声と指差しの統合理解によるマルチモーダル幾何問題解答システムの構築," 情報処理学会第82回全国大会, 5F-03, pp. 4-5 - 4-6, Mar., 2020.
石原颯人, 入部百合絵, 北岡教英, "語彙と係り受け構造に着目した雑談対話からの認知症傾向検出," 情報処理学会第82回全国大会, 5ZE-03, pp. 4-459 - 4-460, Mar., 2020.
小橋 優矢,西村 良太,北岡 教英, "Sequence-to-Sequence model を用いた話し言葉音声認識用言語モデルのための書き言葉から話し言葉へのテキスト変換," 日本音響学会講演論文集, 1-3-8, pp. 807-810, Sep., 2019.
陳 家浩,西村 良太,北岡 教英, "CTCとAttentionを用いたEnd-to-endストリーミング音声認識," 日本音響学会講演論文集, 1-P-16, pp. 871-874, Sep., 2019.
福田 芽衣子,西村 良太,西崎 博光,入部 百合絵,北岡 教英, "高齢者音声認識のための音声コーパス構築と方言への適応の効果," 日本音響学会講演論文集, 1-P-17, pp. 875-878, Sep., 2019.
山本 泰暉,西村 良太,三崎 正之,北岡 教英, "Convolutional LSTMを用いた省メモリMagic Word検出," 日本音響学会講演論文集, 2-3-4, pp. 819-822, Sep., 2019.
秋水紫苑, 入部百合絵, 北岡教英, "音響情報と視線情報を用いた音声対話システムにおける対話破綻検出," 日本音響学会講演論文集, 2-Q-13 pp. 913-914, Sep., 2019.
小松 明久,西村 良太,北岡 教英, "CNNとCLSTMを用いた環境音認," 日本音響学会講演論文集, 2-Q-17 pp. 925-928, Sep., 2019.
梅澤 舞菜,入部 百合絵,北岡 教英, "発話内容に応じた音響言語情報に基づく認知症高齢者の判定," 日本音響学会講演論文集, 2-Q-20 pp. 1061-1064, Sep., 2019.
秋水紫苑, 入部百合絵, 北岡教英, "非言語情報を用いた対話システムにおける対話破綻の検出" 情報処理学会第81回全国大会, 2T-08, pp. 2-365-2-366, Mar., 2019.
梅澤舞菜, 入部百合絵, 北岡教英, "方言を考慮した音声言語情報に基づく高齢者認知症傾向の検出," 情報処理学会第81回全国大会, 4ZE-07, pp. 4-463-4-464, Mar., 2019.
梅原 靖之,西村 良太,北岡 教英, "様々な対話戦略を統合した音声対話システムの構築法," 日本音響学会講演論文集, 2-P-1, pp. 945-948, Mar., 2019.
梶並 和明,西村 良太,入部 百合絵,北岡 教英, "音声対話破綻検出手法の開発に向けた音声対話データ収録システム," 日本音響学会講演論文集, 2-P-2, pp. 949-952, Mar., 2019.
太田 健吾,西村 良太,北岡 教英, "LSTM によるマルチタスク学習を用いた雑談音声対話システムの応答種別選択," 日本音響学会講演論文集, 2-P-3, 953-956, Mar., 2019.
清原 侃太,西村 良太,北岡 教英, "幾何問題における音声と指差しを用いた学習支援システムの構築とその評価," 日本音響学会講演論文集, 2-P-17, pp. 989-992, Mar., 2019.
下笠 元暉,西崎 博光,福田 芽衣子,西村 良太,北岡 教英, "超高齢者の自然発話音声のための音声認識モデルの検討," 日本音響学会講演論文集, 1-R-10, pp. 977-978, Sep., 2018.
山本 泰暉,西村 良太,三崎 正之,北岡 教英, "LSTM Neural Network を用いた連続発話中のMagic Word検出手法," 日本音響学会講演論文集, 1-R-21, pp. 1009-1012, Sep., 2018.
小橋 優矢,西村 良太,北岡 教英, "Twitter中の使用単語の変化に基づく未知語の発見とそれに基づく音声認識用言語モデルの適応," 日本音響学会講演論文集, 1-R-24, pp. 1017-1020, Sep., 2018.
西村良太, 檜垣美帆, 北岡教英, “RNNに基づく音響ベクトル時系列の文書ベクトルへのマッピング,” 信学技報 (PRMU2018-32, SP2018-12), Jun., 2018.
清原侃太,西村良太,北岡教英,"指差しと口述説明を理解する幾何学問題学習支援システム," FIT-2018, J-011, (2 pages), Mar., 2018.
西村良太, 陳 伯翰, 北岡教英, "音声認識における言語モデルへの未知語登録法の検討," 日本音響学会講演論文集, 1-Q-23, pp. 127-130, Mar., 2018.
太田健吾,西村良太,北岡教英, "単語順を考慮したLSTM-RNN に基づく雑談音声対話システムの応答種別選択, " 日本音響学会講演論文集, 2-8-7, pp. 45-48, Mar., 2018.
瀬戸栄地,西村良太,北岡教英, "単語の分散表現に基づく事例ベース雑談音声対話システムのユーザ適応," 日本音響学会講演論文集, 2-8-8, pp. 49-52, Mar., 2018.
中川拓磨,西村良太,入部百合絵,石黒祥生,大須賀晋,北岡教英, "自動運転車の操作におけるマルチモーダルインタラクション," 日本音響学会講演論文集, 2-8-10, pp. 57-60, Mar., 2018.
梶並和明,西村良太,北岡教英, "音声対話破綻検出手法の開発に向けた対話データベースの構築," 日本音響学会講演論文集, 2-Q-14, pp. 177-180, Mar., 2018.
川島愛美,入部百合絵,北岡教英, "高齢者の対話音声から抽出した言語的・音響的特徴に基づく認知症傾向の判別," 日本音響学会講演論文集, 2-Q-36, pp. 369-370, Mar., 2018.
太田健吾,西村良太,北岡教英, "発話の分散表現に基づく雑談音声対話システムの応答種別選択," 音声言語シンポジウム, 信学技報, SP2017-55, pp. 1-5, Dec. 2018.
中川拓磨, 大須賀普, 北岡教英, "音声・指差し・視線認識を用いた自動運転車とのマルチモーダルインタラクション," 電子情報通信学会総合大会, D-14-4 (1 page), Mar., 2017.
黒川有紀,入部百合絵,北岡教英, "音響的特徴を利用した高齢者の認知症傾向の分析," 日本音響学会講演論文集, 1-Q-36, pp. 313-314, Mar., 2017.
澤田優希, 入部百合絵, 北岡教英, "マルチモーダル情報を用いた運転中におけるシステム向け発話の推定," 日本音響学会講演論文集, 2-P-6, pp. 149-150, Mar., 2017.
冬野雄三, 北岡教英, 彭志遠, "対話システムとのタスク指向型・非タスク指向型対話における特徴と嗜好の関係分析," 日本音響学会講演論文集, 2-P-13, pp. 171-172, Mar., 2017.
太田健吾,丸本理貴人,北岡教英, "ユーザ発話の音響情報に基づく雑談対話システムの応答種別選択," 日本音響学会講演論文集, 3-5-4, pp. 71-74, Mar., 2017.
瀬戸栄地, 北岡教英, "単語の分散表現を用いた雑談対話システムの事例適応," 日本音響学会講演論文集, 2-Q-8, (4 pages), Sep., 2016.
中川拓磨, 北岡教英, "音声と指差しを用いた自動運転車とのマルチモーダルインタラクション," 日本音響学会講演論文集, 3-Q-11, (4 pages), Sep., 2016.
林知樹,北岡教英,戸田智基,武田一哉, "Deep Neural Networkに基づく日常生活行動認識における適応手法," 電子情報通信学会 技術報告,SP2016-27, pp. 1-6, Aug., 2016.
陳 伯翰,北岡教英, 武田一哉, "Difference of prosodic information transmission efficiency casued by verbally meaningless acoustic difference : An experimental study," 日本音響学会講論集, 2-Q-32, (2 pages), Mar., 2016.
田村哲嗣, 二宮宏史, 北岡教英, 大須賀晋, 入部百合絵, 武田一哉, 速水 悟, "深層学習によるマルチモーダル音声認識 - 深層学習の活用法の調査," 第2回サイレント音声認識ワークショップ, ID 16, p. 8 (abstract), Oct., 2015.
田村哲嗣, 二宮宏史, 北岡教英, 大須賀晋, 入部百合絵, 武田一哉, 速水 悟, "深層学習によるマルチモーダル音声認識 - 画像特徴量の改善," 第2回サイレント音声認識ワークショップ, ID 15, p. 8 (abstract), Oct., 2015.
田村哲嗣, 二宮宏史, 北岡教英, 大須賀晋, 入部百合絵, 武田一哉, 速水 悟, "深層学習によるボトルネック特徴量を用いたマルチモーダル音声認識," 電子情報通信学会 技術研究報告, SP2015-69, vol.115, no.253, pp.57-62, Oct., 2015.
田村哲嗣,二宮宏史,北岡教英,大須賀晋,入部百合絵,武田一哉,速水悟 "深層学習による音響・画像特徴量を用いたマルチモーダル音声認識," 日本音響学会講論集, 3-2-5, (2 pages), Sep., 2015.
瀬川周平,北岡教英,武田一哉, "音声対話システムの対話戦略への応用を目的とした音声からの高齢者の感情認識," 日本音響学会講論集, 3-Q-19, (2 pages), Sep., 2015.
陳 伯翰,北岡教英,大武美保子, 武田一哉 "話者交替の確率モデル化と情報量を用いた話者活性度の評価," 日本音響学会講論集, 1-Q-35, (4 pages), Sep., 2015.
Bohan Chen, Norihide Kitaoka, Mihoko Otake, Kazuya Takeda, "Evaluation of speaker engagement using turn-taking behavior entropy," 電子情報通信学会技術報告SP, SP2015-52, pp. 13-17, Jun., 2014.
川合窒登,北岡教英,武田一哉, "韻律補正した学習者の音声と日本語音節に基づく近似発音の提示による英語発音矯正手法," 日本音響学会講論集, 1-2-10, (4 pages), Mar., 2015.
陳伯翰, 北岡教英, 武田一哉, "音声情報伝達における合理的な音声特徴制御とその伝達効率への影響," 日本音響学会講論集, 1-R-20, (4 pages), Mar., 2015.
林 知樹, 西田昌史,北岡教英, 武田一哉, "DNN による環境音と加速度信号を用いた日常生活行動認識," 日本音響学会講論集, 2-1-16, (4 pages), Mar., 2015.
森田一輝, 宮島千代美, 北岡教英, 武田一哉, "楽曲構成の違いに着目したアレンジ曲検索性能の評価," 電子情報通信学会総合大会, D-12-4, (1 page), Mar., 2015.
陳伯翰, 北岡教英, 武田一哉, "対話者間の音声特徴類似度と対話の情報伝達効果の関係," 音声言語シンポジウム, SP2014-124, pp. 147-152, Dec., 2014.
林 知樹, 北岡教英, 武田一哉, "深層学習を用いた音声特徴量の年齢の変動に対する頑健性の調査," 日本音響学会講論集, 1-R-8, (4 pages), Sep., 2014.
森田一輝, 川渕翔太, 宮島千代美, 北岡教英, 武田一哉, "原曲の部分区間を用いたアレンジ曲検索, 日本音響学会講論集, 2-4-16, (4 pages), Sep., 2014.
陳伯翰, 北岡教英, 武田一哉, "対話者間音声の類似度と対話の情報伝達効率の関係," 日本音響学会講論集, 2-Q-20, (4 pages), Sep., 2014.
西田昌史, 北岡教英, 武田一哉, "ユビキタスセンシングに基づく日常生活行動データベースの構築," 日本音響学会講論集, 3-8-13, (4 pages), Sep., 2014.
出木浦悠人, 松本哲也, 竹内義則, 工藤博章, 大西 昇, 北岡教英, 武田一哉, "同時発話の高性能な音声認識ースペクトル減算による分離の高速化と分離音を用いた音響モデル学習ー," 電子情報通信学会技術報告SP, SP2014-56, pp. 57-62, Jun., 2014.
北岡教英, 市川賢, 柘植覚, 武田一哉,北研二, "種々のテキスト検索モデルの頑健性向上による音声ドキュメント検索の高精度化," 音声ドキュメント処理ワークショップ, 9 pages, Mar., 2014.
北 研二, 松本和幸, 吉田 稔, 柘植 覚, 北岡教英, 武田一哉, "ビット 演算に基づく高速な音声ドキュメント検索語検出," 音声ドキュメント処理ワークショップ, 5 pages, Mar., 2014.
窄山勝也, 森 真貴, 宮島千代美, 北岡教英, 武田一哉, "Kinectを用いたドライバの視線方向推定とその評価," 電子情報通信学会総合大会講演論文集, A-17-1, (1 page), Mar., 2014.
市川賢, 柘植覚, 北岡教英, 武田一哉,北研二, "クエリ拡張を用いた種々の検索モデルによる音声ドキュメント検索," 3-Q5-7, 4 pages, Mar., 2014.
齋藤 航,北岡 教英,武田 一哉, "ブラインド空間的サブトラクションアレーとマッチド音響モデルによる雑音下音声認識の評価," 日本音響学会講論集, 2-Q4-24, 4 pages, Mar., 2014.
市川賢, 柘植覚, 北岡教英, 武田一哉,北研二, "音声ドキュメント検索手法における拡張クエリの超平面によるモデル化と潜在意味解析の適用," 日本音響学会講論集, 2-P-19, pp. 191-194, Sep. 2013.
太田健吾,北岡教英,中川聖一, "音声対話システムの応答文におけるフィラーとポーズがユーザに与える影響," 日本音響学会講論集, 2-8-10, pp. 83-86, Sep. 2013.
川渕将太,宮島千代美、北岡教英,武田一哉, "楽曲間主観的類似判定における個人性分析手法の検討," 日本音響学会講論集, 2-3-16, pp. 913-916, Sep. 2013.
水野雄介, 近藤多伸, 西野隆典, 北岡教英, 武田一哉, "有効観測データ選択に基づくFDICA 音源分離に関する検討," 日本音響学会講論集, 2-10-5, pp. 737-740, Mar. 2013.
川岸基成, 宮島千代美, 北岡教英, 武田一哉, "ばね質量系を利用した合唱における歌声のF0 ダイナミクスのモデル化," 情報処理学会SIGMUS研究会/EC研究会, 2013-EC-27, 2013-MUS-98, 6 pages, Mar., 2013.
川渕将太, 宮島千代美, 北岡教英, 武田一哉, "楽曲間の類似判定における許容度の推定," 情報処理学会SIGMUS研究会/EC研究会, 2013-EC-27, 2013-MUS-98, 6 pages, Mar., 2013.
市川賢, 北岡教英, 柘植覚, 武田一哉, 北研二, "単語空間と音節空間を併用した音声ドキュメント検索手法への潜在的意味解析の適用," 音声ドキュメント処理ワークショップ, (6 pages), Mar., 2013.
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "Classification of speech under stress using physical features based on two-mass model," 電子情報通信学会技術報告SP, SP2012-128, pp. 47-52, Mar., 2013.
陳伯翰, 北岡教英, 武田一哉, "クラスタ選定によるボトムアップ話者ダイアライゼーションの高精度化," 音声言語シンポジウム, (6 pages), Dec. 2012.
安藤厚志, 丹羽健太, 北岡教英, 武田一哉, "特徴両領域音源分離のためのクロススペクトル抑圧," 音声言語シンポジウム, (6 pages), Dec. 2012.
水野雄介, 近藤多伸, 西野隆典, 北岡教英, 武田一哉, "音源数評価に基づくFDICA音源分離の計算量削減," 電子情報通信学会研究報告EA, pp. 5-10, Dec. 2012.
常田諭史, 西野隆典, 宮島千代美, 北岡教英, 武田一哉, "移動音源を対象とする音源分離におけるBlockwise ICA 法の性能評価," 電気関係学会東海支部連合大会, I3-1 (1 page), Sept., 2012.
中川諒, 宮島千代美, 北岡教英, 武田一哉, "ノンパラメトリックベイズ法に基づく運転行動の個人性のモデル化," 電気関係学会東海支部連合大会, A2-8 (1 page), Sept., 2012.
森真貴,宮島千代美,北岡教英,武田一哉, "安全性の異なるドライバの車線変更時の運転行動の比較," 電気関係学会東海支部連合大会, A2-7 (1 page), Sept., 2012.
李亦楊, 宮島千代美, 北岡教英, 武田一哉, "Driving Scene Retrieval Based on Driving Behavior and Surrounding Environment," 電気関係学会東海支部連合大会, A2-4 (1 page), Sept., 2012.
川岸基成, 宮島千代美, 北岡教英, 武田一哉, "合唱における基本周波数軌跡のモデル化に関する研究," 日本音響学会講演論文集, 3-Q-33, (4 pages), Sept., 2012.
安藤厚志,宮島千代美,北岡教英,武田一哉, "音声認識のための特徴量領域音源分離," 日本音響学会講演論文集, 3-9-12, (4 pages), Sept., 2012.
小松達也, 近藤多伸, 西野隆典, 北岡教英, 武田一哉, "相補ウィナーフィルタに基づく残響抑圧手法の性能評価実験," 日本音響学会講演論文集, 1-P-31, (4 pages), Sept., 2012.
姚 瀟, 實廣貴敏, 宮島千代美, 北岡教英, 武田一哉, "Evaluation for vowel-independent classification of speech under stress based on interaction between the vocal folds and the vocal tract," 日本音響学会講演論文集, 1-2-19, (4 pages), Sept., 2012.
陳伯翰, 北岡教英, 武田一哉, "クラスタ検証による話者ダイアライゼーション高精度化," 日本音響学会講演論文集, 1-1-14, (4 pages), Sept., 2012.
森 真貴, 宮島千代美, 北岡教英, 武田一哉, "高速道路追い越し運転時のドライバの視行動の個人性の分析," ロボティクス・メカトロニクス講演会2012 (ROBOMEC 2012), 1P1ーE05, (2 pages), May, 2012.
姚 瀟, 實廣貴敏, 宮島千代美, 北岡教英, 武田一哉, "Detection for stressed speech based on two-mass model," 日本音響学会講演論文集, 1-7-2, pp. 3-6, Mar., 2012.
安藤厚志, 大橋宏正, 原 直, 北岡教英, 武田一哉, "周波数帯域ごとの音源分離信頼度を利用したマルチバンド音声認識," 日本音響学会講演論文集, 1-P-15, pp. 153-156, Mar., 2012.
水野雄介, 江崎 知, 近藤 多伸, 西野隆典, 北岡教英, 武田一哉, "観測信号のパワーに基づくFDICA 音源分離の計算量削減, " 日本音響学会講演論文集, 1-Q-18, pp. 863-866, Mar., 2012.
川合窒登, 北岡教英, 武田一哉, "話者パラメータの操作に基づく特徴量生成による音響モデル構築," 日本音響学会講演論文集, 2-7-3, pp. 53-54, Mar., 2012.
川渕将太, 宮島千代美, 北岡教英, 武田一哉, "楽曲間主観的類似度データの収集実験," 日本音響学会講演論文集, 3-6-9, pp. 1039-1042, Mar., 2012.
大橋宏正, 柘植 覚, 北岡教英, 武田一哉, 北 研二, "クエリ拡張と音節認識の統合による音声ドキュメント検索," 日本音響学会講演論文集, 3-P-20, pp. 259-262, Mar., 2012.
石川博章,宮島千代美,北岡教英,武田一哉, "車載ネットワークを用いた運転データの収集と車種による運転行動の違いの分析," 電子情報通信学会技術報告ITS, IE, IEICE-ITS2011-50, IEICE-IE2011-126, pp. 257-262, Feb., 2012.
大橋宏正, 柘植 覚, 北岡教英, 武田一哉, 北 研二, "音声ドキュメント検索におけるクエリ拡張と音節認識の併用の効果," 電子情報通信学会技術報告SP, pp. 249-254, Feb., 2012.
安藤厚志, 大橋宏正, 原 直, 北岡教英, 武田一哉, "ブラインド音源分離の信頼度を用いたマルチバンド音声認識," 電子情報通信学会技術報告SP, pp. 219-224, Feb., 2012.
安藤厚志,北岡教英,武田一哉, "プライバシー保護のための音源分離による音声抑圧手法," 電気関係学会東海支部連合大会, Q4-4 (1 page), Sept., 2011.
川渕将太, 宮島千代美, 北岡教英, 武田一哉, "楽曲間の主観的類似性判断における個人性の要因の分析," 電気関係学会東海支部連合大会, Q3-7 (1 page), Sept., 2011.
永石陽祐, 宮島千代美, 北岡教英, 武田一哉, "ベクトル量子化によるカバーソング認識技術の高速化," 電気関係学会東海支部連合大会, Q3-6 (1 page), Sept., 2011.
中川 諒,宮島千代美,北岡教英,武田一哉, "運転行動信号間の類似度に基づいた類似運転状況検索," 電気関係学会東海支部連合大会, F3-8 (1 page), Sept., 2011.
石川博章,宮島千代美,北岡教英,武田一哉, "車載ネットワークを用いた可搬型運転行動信号収録システムの開発," 電気関係学会東海支部連合大会, F3-7 (1 page), Sept., 2011.
水野雄介, 江崎知, 近藤多伸, 西野隆典, 北岡教英, 武田一哉, "振幅二乗コヒーレンス基準による独立成分分析音源分離の計算量削減の検討," 日本音響学会講演論文集, 1-P-6, pp. 721-722, Sept., 2011.
水野雄介, 江崎知, 近藤多伸, 西野隆典, 北岡教英, 武田一哉, "観測信号間のコヒーレンスに基づくICA音源分離の計算量の削減," 電子情報通信学会 技術報告, vol.111, no.89, EA2011-33, pp.19-24, June 2010.
Yao Xiao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda, "On the use of the two-mass vocal cord model in characterizing the stress speech," 電子情報通信学会 技術報告, vol.111, no.97, SP2011-36, pp.35-40, June 2010.
畔柳雄一, 石川博章, 宮島千代美, 北岡教英, 武田一哉, "潜在危険分析マニュアルに基づく実環境運転データの分析," 自動車技術2011年春季大会, 講演番号227, May, 2011.
江崎知, 水野雄介, 西野隆典, 宮島千代美, 北岡教英, 武田一哉, "ICA仮想音源の空間分布を用いた室内音場の解析,” 電子情報通信学会 技術報告, vol.110, no.471, EA2010-132, pp.35-40, Mar. 2011.
伊藤新, 原直, 北岡教英, 武田一哉, "MLLR 変換行列に基づいた音響特徴量生成による音響モデル学習," 日本音響学会講演論文集, 2-P-4, (4 pages), Mar. 2011.
原直, 北岡教英, 武田一哉, "音声対話システムにおける発話・行動タグN-gramを用いた課題未達成対話の検出手法と分析," 日本音響学会講演論文集, 2-P-41, (2 pages), Mar. 2011.
大橋宏正, 原直, 北岡教英, 武田一哉, "雑談音声の認識に基づく楽曲連想再生システム," 日本音響学会講演論文集, (2 pages), Mar. 2011.
矢澤大心, 西崎博光, 関口芳廣, 北岡教英, "潜在的意味解析を用いた車内発話の話題推定に基づく目的地提案," 情報処理学会第73回全国大会, Mar., 2011.
耒見田健二, 畔柳雄一, 宮島千代美, 北岡教英, 武田一哉, "過去の走行データに基づく運転診断・教示システムの構築," 信学技報, vol. 110, no. 381, PRMU2010-163, pp. 87-92, Jan., 2011.
伊藤 新,原 直,北岡教英,武田一哉, "MLLR変換行列により制約された音響特徴量生成による頑健な音響モデル," 電子情報通信学会技術報告(音声言語シンポジウム), SP2010-92, NLC2010-19, pp. 55-60, Dec. 2010.
大橋宏正, 北岡教英, 武田一哉, "雑談音声の常時認識による楽曲提案システム," 電子情報通信学会技術報告, SP,PRMU,WIT pp. 59-64, Oct. 2010.
原 直,北岡教英,武田一哉, "音声対話システムの発話系列N-gramを用いた課題未達成対話のオンライン検出," 日本音響学会講論集, 1-Q-33, (4 pages), Sep. 2010.
畔柳雄一,宮島千代美,北岡教英,武田一哉, "実環境運転データにおける潜在危険状況の分析," 電気関係学会東海支部連合大会, (1page), Aug. 2010.
石川博章,宮島千代美,北岡教英,武田一哉, "ベイジアンネットワークを用いた運転中の2 次タスク有無の推定," 電気関係学会東海支部連合大会, (1 page), Aug. 2010.
田村 哲嗣,宮島 千代美,北岡 教英,武田 一哉,山田 武志,滝口 哲也,柘植 覚,山本 一公,西浦 敬信,中山 雅人,傳田 遊亀,藤本 雅清,松田 繁樹,小川 哲司,黒岩 眞吾, 中村 哲, "CENSREC-1-AV: マルチモーダル音声認識コーパスの構築," 日本音響学会講論集,(2 pages), 1-Q-28, Mar. 2010.
伊藤 新,原 直,北岡 教英,武田 一哉, "MLLR 変換行列により生成した音声特徴量に基づく高速モデル適応," 日本音響学会講論集, (4 pages), 2-Q-13, Mar. 2010.
高橋量衛,大石康智,原直,北岡教英,武田一哉, "楽曲連想再生のための文書特徴量と音響特徴量の対応付け," 音声ドキュメント処理ワークショップ,7 pages, Feb. 2010.
天田 英臣, 宮島 千代美, 西野 隆典, 北岡 教英, 武田 一哉, "信号なし交差点における運転行動予測モデル," 2009年電子情報通信学会基礎・境界ソサイエティ大会, 新潟大学 (新潟市), (A-17-5), Sept. 15-18, 2009.
武田一哉, 宮島 千代美, 北岡教英, "分散センサ群による運転行動の記録・分析・コンテンツ化," 2009年電子情報通信学会基礎・境界ソサイエティ大会, 新潟大学 (新潟市), (BS-11-4), Sept. 15-18, 2009.
内藤 正志, 尾崎 晃, 宮島 千代美, 西野 隆典, 北岡 教英, 武田 一哉, "大規模実環境運転データベースのためのブラウジングシステムの開発," 2009年電気関係学会東海支部連合大会, 愛知工業大学 (豊田市), O-270, CD-ROM Proceedings, Sept. 10-11, 2009.
内藤 充美, 宮島 千代美, 武田 一哉, "急減速時の加速度パターンの分類に基づくドライバの危険性の評価," 2009年電気関係学会東海支部連合大会, 愛知工業大学 (豊田市), O-443, CD-ROM Proceedings, Sept. 10-11, 2009.
畔柳 雄一, 宮島 千代美, 西野 隆典, 北岡 教英, 武田 一哉, "サポートベクターマシンを用いた車線変更の意図の予測," 2009年電気関係学会東海支部連合大会, 愛知工業大学 (豊田市), O-272, CD-ROM Proceedings, Sept. 10-11, 2009.
伊藤 新, 原 直, 宮島 千代美, 北岡 教英, 武田 一哉, "複数音響モデルからの最適選択による音声認識," 2009年電気関係学会東海支部連合大会, 愛知工業大学 (豊田市), ?-???, CD-ROM Proceedings, Sept. 10-11, 2009.
小川哲司, 川野弘, 西浦敬信, 山田武志, 北岡教英, 小林哲則. "ロンバード発声音声コーパスの設計と評価," 日本音響学会講論集,1-R-2, Sep. 2009.
武田 一哉, 尾崎 晃, マルタ ルーカス, 西脇 由博, 宮島 千代美, 北岡 教英, "自動車運転コーパスにおける行動観測信号の統合と利用," 2009年マルチメディア,分散,協調とモバイルシンポジウム(DICOMO2009), Vol. 2009, No. 1, pp. 480-487, July 2009.
西脇由博, 宮島千代美, 北岡教英, 武田一哉, "車線変更軌跡の確率的予測モデル," 情報処理学会ITS研究会, 37-8, June, 2009. (ITS研究会優秀論文賞)
尾崎晃, 荻野恒太郎, 宮島千代美, 西野隆典, 北岡教英, 武田一哉, "実環境大規模運転データベースの構築と閲覧システムの開発," 電子情報通信学会総合大会, A--17--22, Mar. 2009.
伊藤 弘章,西野 隆典,北岡 教英,武田 一哉, "確率モデルに基づく単一チャネル音源分離を用いた背景音楽抑圧," 日本音響学会講論集,1-P-9, Mar. 2009.
坂井 誠,北岡 教英,武田 一哉, "平均クラス誤り最小基準と最大クラス誤り最小基準を組み合わせた音響特徴変換," 日本音響学会講論集,1-P-18, Mar. 2009.
木下 裕司,宮島 千代美,北岡 教英,武田 一哉, "理解状態グラフの探索による音声対話戦略," 日本音響学会講論集,3-5-3, Mar. 2009.
森本 泰子,西野 隆典,北岡 教英,武田 一哉, "時空間周波数解析を用いたHRTF データの比較," 日本音響学会講論集,3-P-17, Mar. 2009.
原 直,北岡 教英,武田 一哉, "音声対話システムのユーザ満足度推論におけるネットワークモデルの構築と評価," 日本音響学会講論集,3-Q-22, Mar. 2009.
北岡教英,大淵康成,滝口哲也,中村哲,藤本雅清, "音声認識の頑健性," パネルセッションオーガナイザ,情報処理学会研究会SLP75-5, Feb. 2009
伊藤 弘章,西野 隆典,北岡 教英,武田 一哉, "ベイジアンネットワークを用いた単一チャネル信号による背景音楽の抑圧," 音声言語シンポジウム, pp. 19-24, Dec. 2008.
原 直, 北岡教英, 武田一哉, "音声認識システムの満足度評価におけるユーザモデル," 音声言語シンポジウム, pp. 61-66, Dec. 2008.
Lucas Malta・Chiyomi Miyajima・Akira Ozaki・Norihide Kitaoka, Kazuya Takeda, "Driver's irritation detection using speech recogntion results," 音声言語シンポジウム, pp. 245-250, Dec. 2008.
尾崎 晃, マルタ ルーカス, 西脇由博, 宮島千代美, 北岡教英, 武田一哉, "自動車運転行動のマルチモーダル信号コーパス," 電子情報通信学会研究報告SP, pp. 33-38, Nov. 2008.
木下裕司, 宮島千代美, 北岡教英, 武田一哉. "理解状態のグラフ探索に基づいた音声対話戦略," 電子情報通信学会研究報告NLC2008-19, pp. 1-6, Nov. 2008.
伊藤敏彦, 北岡教英, 西村良太. "音声対話における発話タイミングの影響," 電子情報通信学会研究報告NLC2008-20, pp.7-12, Nov. 2008.
西脇由博, 宮島千代美, 北岡教英, 武田一哉, "個人性を考慮した車線変更時の車両軌跡生成過程のモデル化," 電子情報通信学会パターン認識・メディア理解研究会, Oct., 2008.
伊藤 弘章,西野 隆典,北岡 教英,武田 一哉, "符号化された既知の楽曲が重畳した音声の雑音抑圧手法に関する検討," 日本音響学会講論集,3-Q-7, pp. 163-166, Sep. 2008.
王 龍標, 中川聖一, 北岡教英, 甲斐充彦, "マルチチャンネルLMSアルゴリズムによるスペクトルサブトラクションとCMNに基づくブラインド残響除去," 日本音響学会講論集,3-Q-10, pp. 171-174, Sep. 2008.
木下 裕司,宮島 千代美,北岡 教英,武田 一哉, "検索タスクのための効率的で自然な音声対話戦略," 電気関係学会東海支部連合大会,1 page, Sep. 2008.
森本 泰子,西野 隆典, 宮島 千代美, 北岡 教英,武田 一哉, "無線加速度センサを用いた頭部運動の計測," FIT2008,4 pages, (査読有) Sep. 2008.
伊藤弘章, 大石康智, 宮島千代美, 北岡教英, 武田一哉, "ベイジアンネットワークを用いたバイナリマスキングに基づく音源分離," 情報処理学会研究報告, 2008-SLP-72, pp. 51-56, Jul, 2008.
伊藤敏彦, 北岡教英, 西村良太, "音声対話における発話タイミングの影響に関する知覚実験," 情報処理学会研究報告, 2008-SLP-72, pp. 99-104, Jul, 2008.
天田英臣, 宮島千代美, 北岡教英, 武田一哉, "車載ドライブレコーダで収録された左右加速度に基づく急ハンドル操作の推定," 電子情報通信学会総合大会, Mar, 2008.
尾崎晃, 草川高志, 宮島千代美, 西野隆典, 北岡教英, 武田一哉, "運転データ同期収録車両の開発と実走行環境における計測," 電子情報通信学会総合大会, Mar, 2008.
王 龍標, 中川聖一, 北岡教英. "遠隔発話音声認識のためのマルチチャンネルLMSアルゴリズムによるスペクトルサブトラクションに基づくブラインド残響除去," 日本音響学会講論集,1-10-10, Mar. 2008.
原 直,宮島千代美,北岡教英,伊藤克亘,武田一哉, "ベイジアンネットワークを用いた楽曲検索音声対話データの分析," 日本音響学会講論集,1-10-15, Mar. 2008.
草水智浩,山本一公,北岡教英,中川聖一, "音声区間検出が音声認識性能に与える影響についての検討," 日本音響学会講論集, 1-Q-8, Mar. 2008.
西浦敬信,中山雅人,傳田遊亀,北岡教英,山本一公,山田武志,藤本雅清,柘植覚,宮島千代美,滝口哲也,田村哲嗣,小川哲司,松田繁樹,黒岩眞吾,武田一哉,中村哲, "残響下音声認識評価基盤(CENSREC-4)の構築," 日本音響学会講論集,1-Q-10, Mar. 2008.
坂井誠,北岡教英,服部佑哉,中川聖一,武田一哉. "判別分析に基づく音響特徴と識別学習の組み合わせによる単語音声認識," 日本音響学会講論集,1-Q-16, Mar. 2008.
西村良太,北岡教英,中川聖一. "人間同士の対話の印象と韻律変化との関係の分析とそのモデル化," 日本音響学会講論集,2-10-15, Mar. 2008.
三木まどか, 宮島千代美, 西野隆典, 北岡教英, 武田一哉. "動作を伴う発話の収集とその認識," 情報処理学会研究報告, 2008-SLP-70, pp. 95-100, Feb, 2008.2
杉本夏樹, 矢野浩利, 北岡教英, 中川聖一. "誤認識に対処した自然で効率的な音声対話戦略の評価," 情報処理学会研究報告, 2008-SLP-70, pp.181-186, Feb, 2008.
北岡教英,山田武志,滝口哲也,柘植覚,山本一公,宮島千代美,西浦敬信,中山雅人,傳田遊亀,藤本雅清,田村哲嗣,松田繁樹,小川哲司,黒岩眞吾,武田一哉,中村哲, "雑音下音声認識評価ワーキンググループ活動報告:認識に影響する要因の個別評価環境(2)," 音声言語シンポジウム, 2007-SLP-69-1, Dec. 2007.
森本一広, 宮島千代美, 北岡教英, 伊藤克亘, 武田一哉, "ジェスチャインタフェースのための指先動作軌跡の統計的分割と正規化," 電子情報通信学会研究報告,SP-2007-45, pp. 1-6, Sep. 2007.
三木まどか, 宮島千代美, 西野隆典, 北岡教英, 武田一哉, "動作を伴う発話の収集とその認識に関する検討," 日本音響学会講論集,3-Q-30, 2 pages, Sep. 2007.
原直, 宮島千代美, 北岡教英, 伊藤克亘, 武田一哉, "音声対話システムを用いたフィールドテストの実環境音声データ分析に関する検討," 日本音響学会講論集,3-Q-27, 2 pages, Sep. 2007.
王 龍標, 北岡教英, 中川聖一. "発話毎CMNと長短の複数時間窓のスペクトルに基づく位置依存CMNの併用による音声認識," 日本音響学会講論集,3-3-8, 4 pages, Sep. 2007.
三木まどか, 宮島千代美, 西野隆典, 北岡教英, 武田一哉, "動作を伴う発話の収集とその認識に関する検討," 情報学ワークショップ2007 (WiNF 2007), pp.71-74, Sep. 2007.
草水智浩, 山本一公, 北岡教英, 中川聖一. "VADが音声認識性能に与える影響," 第6回情報科学技術フォーラム 一般講演論文集(FIT2007),vol.6, no.2, E-055, pp.269-270, Sep. 2007.
原 直, 宮島千代美, 北岡教英, 伊藤克亘, 武田一哉, "楽曲検索システムにおけるプレイリストに適応した音響モデル構築手法に関する検討," 情報処理学会研究報告, 2007-SLP-67, pp. 87-90, July, 2007.
藤井康寿, 北岡教英, 中川聖一. "講義音声自動要約のための重要文手がかり表現の自動抽出," 情報処理学会研究報告, 2007-SLP-66, pp.85-90, May, 2007.
石原正光,宮島千代美,北岡教英,伊藤克亘,武田一哉, "認識対象語彙に応じた音響モデルの構築に関する検討," 日本音響学会講論集,1-P-15, Mar. 2007.
高橋量衛,大石康智,北岡教英,伊藤克亘,武田 一哉, "楽曲のレビューと音響特徴量との関連付けの検討," 日本音響学会講論集,3-7-4, Mar. 2007.
西村良太, 北岡教英, 中川聖一. "音声対話システムにおける対話中の韻律変化のモデル化と適用," 日本音響学会講論集,1-9-3, Mar. 2007.
藤井康寿, 北岡教英, 中川聖一. "講義音声中の重要表現の自動抽出と自動要約への適用," 日本音響学会講論集,1-9-17, Mar. 2007.
王 龍標, 北岡教英, 中川聖一. "発話毎CMNと発話位置依存CMNの併用による遠隔発話音声認識," 日本音響学会講論集,3-9-17, Mar. 2007.
中山仁史, 北岡教英, 中川聖一. "音節単位と単語単位の音響モデルを用いた自由発話音声認識," 日本音響学会講論集,2-9-6, Mar. 2007.
坂井 誠, 北岡教英, 中川聖一. "線形判別分析の一般化によるセグメント単位入力HMMに基づく音声認識," 日本音響学会講論集,3-10-10, Mar. 2007.
江本祐太, 宮島千代美, 北岡教英, 武田一哉, "連続指文字認識における手話者の違いに関する検討," 2007年電子情報通信学会総合大会, A-19-10, p.375, Mar. 2007.
高木俊一, 北岡教英, 中川聖一. "自動車音声対話システムのための運転中の過付加状態の検出," 情報処理学会第69回全国大会, 5E-1, 2007.
富樫慎吾, 北岡教英, 中川聖一. "講義音声ドキュメントのコンテンツ化と視聴システムの試作," 音声ドキュメント処理ワークショップ, Feb., 2007.
森本一広, 宮島千代美, 北岡教英, 伊藤克亘, 武田一哉, "ジェスチャインタフェースのための動作軌跡信号の統計的分割と認識," 情報処理学会 研究報告, 2007-HI-122-14, (2007-SLP-65-14), vol.2007, no.11, pp.73-78, Feb. 2007.
尾崎晃, 宮島千代美, 西野隆典, 北岡教英, 武田一哉, "マイクロコンピュータを用いた単発音入力インタフェースの開発," 情報処理学会研究報告, 2007-HI-122-1, (2007-SLP-65-1), vol.2007, no.11, pp.1-4, Feb. 2007.
富樫慎吾, 北岡教英, 中川聖一. "講義音声認識における収録装置とケプ ストラム正規化法の検討," 音声言語シンポジウム, 2006-SLP-65-37, Dec. 2006.
北岡教英,山田武志,滝口哲也,柘植覚,山本一公,宮島千代美,西浦敬信,中山雅人,傳田遊亀,藤本雅清,田村哲嗣,黒岩眞吾,武田一哉,中村哲, "雑音下音声認識評価ワーキンググループ活動報告:認識に影響する要因の個別評価環境," 音声言語シンポジウム, 2006-SLP-65-1, Dec. 2006.
西村良太, 北岡教英, 中川聖一. "対話における韻律変化・タイミングのモデル化と音声対話システムへの適用," 人工知能学会 音声・言語と対話理解研究会, SIG-SLUD-A602-07, pp. 37-42, Nov. 2006.
北岡教英,山田武志,柘植覚,宮島千代美,西浦敬信,中山雅人,傳田遊亀、藤本雅清,山本一公,滝口哲也,黒岩眞吾,武田一哉,中村哲, "CENSREC-1-C: 雑音下音声区間検出手法評価基盤の構築," 情報処理学会研究報告, 2006-SLP-63-1, pp. 1-6, Oct. 2006.
藤井康寿, 冨樫慎吾, 山口 優, 北岡教英, 中川聖一, "韻律・表層的言語情報に基づく重要文抽出による講義音声要約の評価," 日本音響学会講論集,2-P-28, pp. 149-150, Sep. 2006.
王 龍標, 北岡教英, 中川聖一. "発話位置依存ケプストラム平均正規化に基づく遠隔発話話者認識の評価," 日本音響学会講論集,2-P-9, pp. 111-112, Sep. 2006.
北岡教英,西浦敬信,中山雅人,藤本雅清,山田武志,滝口哲也,山本一公,宮島千代美,柘植覚,黒岩眞吾,武田一哉,中村哲. "雑音下音声区間検出手法評価基盤の構築," 日本音響学会講論集,2-P-5, pp. 103-104, Sep. 2006.
北岡教英,梁 頴,中川聖一, "Trigram・4-gramと文脈依存音響モデルを用いた1パス大語彙連続認識アルゴリズムとその高精度化," 電子情報通信学会研究報告,SP2006-16, pp.31-36, Jun. 2006.
北岡教英, 矢野浩利, 中川聖一, "誤認識の修復のための自然で効率的な音声対話戦略," 情報処理学会研究報告, 2006-SLP-61-7, pp. 37-42, May 2006.
杉本夏樹, 北岡教英, 中川聖一, "音響特徴を用いた対システム発話と対人間発話の識別," 電子情報通信学会 総合大会, p.133, Mar, 2006.
富樫慎吾, 北岡教英, 中川聖一, "スライド情報を用いた言語モデル適応による講義音声認識," 日本音響学会講論集,1-P-24, pp. 191-192, Mar. 2006.
清田和誠,押川洋徳,北岡教英,中川聖一, "人名・組織名認識を備えたWebフォームへの音声入力インタフェース," 日本音響学会講論集,1-1-6, pp.11-12, Mar. 2006.
梁 頴,北岡教英,中川聖一, "複数の音響モデルの同時使用による1パストライグラム大語彙連続音声認識," 日本音響学会講論集,1-P-27, pp. 197-198, Mar. 2006.
矢野浩利, 北岡教英, 中川聖一, "誤認識の修復機能を備えた音声対話システムの構築," 言語処理学会第12回年次大会, Mar. 2006.
西村良太, 北岡教英, 中川聖一, "応答タイミングを考慮した雑談音声対話システム," 人工知能学会 音声・言語と対話理解研究会,SLUD-A503-05, pp. 21-29, Mar. 2006.
中村哲, 武田一哉, 黒岩眞吾, 北岡教英, 山田武志, 山本一公, 西浦敬信, 佐宗晃, 水町光徳, 宮島千代美, 藤本雅清, 遠藤俊樹, 滝口哲也. "SLP雑音下音声認識評価WG活動報告-評価用データと評価手法について," 音声言語シンポジウム, 2005-SLP-54-26, Dec. 2005.
北岡教英, 押川洋徳, 中川聖一, "孤立単語認識と連続基本単語認識の併用に基づく組織名の音声入力インタフェース," 音声言語シンポジウム, pp. 31-36, Dec. 2005.
濱口早太,北岡教英,中川聖一, "複数の雑音抑圧手法の統合に基づく雑音下音声認識," 音声言語シンポジウム, pp. 59-60, Dec. 2005.
王龍標, 北岡教英, 中川聖一, "発話位置依存CMNとマルチマイクロフォンアレイ処理の併用による遠隔発話音声認識," 音声言語シンポジウム, pp. 103-108, Dec. 2005.
王 龍標,北岡教英,中川聖一, "発話位置依存CMN とマルチマイクロフォン処理による遠隔発話音声認識," 日本音響学会講論集,2-7-13, Sep. 2005.
濱口早太,北岡教英,中川聖一, "GMM を用いた雑音抑圧手法統合に基づく雑音下音声認識," 日本音響学会講論集, 3-7-24, Sep. 2005.
北岡教英, "音声認識・音声対話の研究動向," 電気関係学会東海支部連合大会,S2-3 (招待講演), Sep. 2005.
藤本雅清, 中村 哲, 武田一哉, 黒岩眞吾, 山田武志, 北岡教英, 山本一公, 水町光徳, 西浦敬信, 佐宗 晃, 宮島千代美, 遠藤俊樹, "実走行車内音声認識の評価データベースCENSREC-3とその共通評価ベースライン," 日本音響学会講論集, 2-Q-23, pp. 143-144, Mar. 2005.
矢野浩利, 北岡教英, 中川聖一, "対話システムにおける否定表現の検出," 日本音響学会講論集, 2-5-4, pp. 61-62, Mar. 2005.
押川洋徳, 北岡教英, 中川聖一, "高頻度組織名と基本単語を用いた任意組織名入力インタフェース," 日本音響学会講論集, 2-5-10, pp.73-74, Mar. 2005.
王龍標, 北岡教英, 中川聖一, "発話位置依存ケプストラム平均正規化に基づくGMMと話者適応化音節HMMの併用による遠隔発話の話者認識," 日本音響学会講論集, 1-5-7, pp. 13-14, Mar. 2005.
藤本雅清, 中村 哲, 武田一哉, 黒岩眞吾, 山田武志, 北岡教英, 山本一公, 水町光徳, 西浦敬信, 佐宗晃, 宮島千代美, 遠藤俊樹, "実走行車内単語音声データベースCENSREC-3と共通評価環境の構築," 情報処理学会研究報告, 2005-SLP-55-13, pp.41-46, Feb. 2005.
矢野浩利, 北岡教英, 中川聖一, "対話システムにおける言い直し・否定表現に着目した訂正発話の検出," 情報処理学会研究報告, 2005-SLP-55-17, pp. 95-100, Feb. 2005.
中村 哲, 武田一哉, 黒岩眞吾, 北岡教英, 山田武志, 山本一公, 西浦敬信, 佐宗晃, 水町光徳, 宮島千代美, 藤本雅清, 遠藤俊樹, (招待講演) "実環境下音声認識の評価の標準化とその動向," 音声言語シンポジウム, 2004-SLP-54-20, pp. 139-144, Dec. 2004.
藤本雅清, 中村 哲, 武田一哉, 黒岩眞吾, 山田武志, 北岡教英, 山本一公, 水町光徳, 西浦敬信, 佐宗晃, 宮島千代美, 遠藤俊樹, "CENSREC-3: 実走行車内単語音声データベースと評価環境の構築", 音声言語シンポジウム, 2004-SLP-54-40, pp. 235-240, Dec. 2004.
濱口草太, 北岡教英, 中川聖一, "GMMによる雑音抑圧手法選択に基づく雑音下音声認識," 音声言語シンポジウム, 2004-SLP-54-41, pp. 241-246, Dec. 2004.
王龍標, 北岡教英, 中川聖一, "発話位置依存ケプストラム平均正規化による遠隔発話の音声認識と話者認識," 電子情報通信学会技術報告, SP2004-79, pp. 47-52, Nov. 2004.
王龍標, 北岡教英, 中川聖一, "発話位置依存ケプストラム平均正規化による遠隔発話の音声認識," 情報処理学会研究報告、2004-SLP-51, pp. 25-30, May 2004.
北岡教英, 梁 頴, 中川聖一. "1-best近似木構造辞書探索と線形辞書探索を併用した大語彙連続音声認識システムSPOJUSの探索性能の評価," 日本音響学会講論集, 3-8-4, pp.129-130, Mar. 2004.
山田武志, 武田一哉, 北岡教英, 藤本雅清, 黒岩眞吾, 山本一公, 西浦敬信, 宮島千代美, 佐宗 晃, 水町光徳, 遠藤俊樹, 中村 哲, "AURORA-2Jと種々の評価指標を用いたETSI STQ Aurora WI008 Advanced DSR Frontendの評価," 日本音響学会講論集, 2-8-12, pp.83-84, Mar. 2004.
竹内真士, 北岡教英, 中川聖一, "韻律・表層的言語情報を発話タイミング制御に用いた雑談対話システム," 情報処理学会研究報告, 2004-SLP-50, pp. 87-92, Feb. 2004.
山田武志, 武田一哉, 北岡教英, 藤本雅清, 黒岩眞吾, 山本一公, 西浦敬信, 佐宗晃, 水町光徳, 遠藤俊樹, 中村 哲, "AURORA-2Jを用いたETSI STQ Aurora WI008 Advanced DSR Frontendの評価," 音声言語シンポジウム, pp. 103-108, Dec. 2003.
押川洋徳, 北岡教英, 中川聖一, "音節N-gramと単語辞書併用による姓名入力インタフェース," 音声言語シンポジウム, pp. 175-180, Dec. 2003.
山田武志, 岡田治郎, 武田一哉, 北岡教英, 藤本雅清, 黒岩眞吾, 山本一公, 西浦敬信, 佐宗晃, 水町光徳, 遠藤俊樹, 中村 哲, "複数の雑音抑圧手法の統合によるロバスト音声認識とそのAURORA-2Jによる評価," 日本音響学会講論集, 3-Q-12, pp.149-150, Sep. 2003.
山本一公, 中村 哲, 武田一哉, 黒岩眞吾, 北岡教英, 山田武志, 水町光徳, 西浦敬信, 藤本雅清, 佐宗晃, 遠藤俊樹, "雑音下音声認識共通評価データベース AURORA-2J とその評価ベースライン," 日本音響学会講論集, 3-Q-11, pp. 147-148, Sep. 2003.
渡邊友裕, 西崎博光, 山本一公, 北岡教英, 宇津呂武仁, 中川聖一, "複数の認識システムの出力の統合法による講演音声の認識," 日本音響学会講論集, 3-6-9, pp.119-120, Sep. 2003.
押川洋徳, 北岡教英, 中川聖一, "音節N-gramと単語辞書を併用した姓名の音声認識," 日本音響学会講論集, 2-6-11, pp.81-82, Sep. 2003.
押川洋徳, 北岡教英, 中川聖一, "音声による姓名入力インタフェース", 情報科学技術フォーラム(FIT)講論集, F-026, Sep. 2003.
山本一公, 中村 哲, 武田一哉, 黒岩眞吾, 北岡教英, 山田武志, 水町光徳, 藤本雅清, 西浦敬信, "AURORA-2J/AURORA-3Jデータベースとその評価ベースライン," 情報処理学会研究報告, 2003-SLP-47-19, pp.101-106, 2003.
山田武志, 岡田治郎, 武田一哉, 北岡教英, 藤本雅清, 黒岩眞吾, 山本一公, 西浦敬信, 水町光徳, 中村 哲, "雑音下音声認識のための複数の前処理手法の統合とそのAURORA-2Jによる評価," 情報処理学会研究報告, 2003-SLP-47-18, pp.95-100, 2003.
北岡教英, 新宮将久, 中川聖一. "言語的・音響的コンテキストが講演音声の聴取および認識に及ぼす効果," 電子情報通信学会技術報告, SP-2003-33, pp.43-48, 2003.
北岡教英, 高橋伸寿, 中川聖一, "N-best線形辞書探索と1-best近似木構造辞書探索の併用による大語彙連続音声認識," 電子情報通信学会技術報告, SP-2003-26, pp.1-6, 2003.
北岡教英, 角谷直子, 中川聖一, "対話音声中の言い直し発話の検出と認識," 情報処理学会研究報告, 2003-SLP-46-6, 2003-NL-155-17, pp.31-36, 2002.
竹内真士, 北岡教英, 中川聖一, "韻律・言語情報を素性とした決定木による自然な応答生成タイミングの検出," 日本音響学会講論集, 2-4-9, pp.75-76, Mar. 2003.
角谷直子, 北岡教英, 中川聖一, "対話音声中の言い直し発話の検出," 日本音響学会講論集, 2-4-11, pp.79-80 Mar., 2003.
高橋伸寿, 北岡教英, 中川聖一, "連続音正認識システムSPOJUSの改善," 日本音響学会講論集, 3-4-9, pp.145-146, Mar. 2003.
新宮将久, 北岡教英, 中川聖一, "前後のコンテキストが講演音声の聴取および認識に及ぼす効果," 日本音響学会講論集, 2-4-2, pp.61-62 Mar. 2003.
中村 哲, 武田一哉, 黒岩眞吾, 山田武志, 北岡教英, 山本一公, 西浦敬信, 藤本雅清, 水町光徳. "SLP雑音下音声認識評価のためのWG: 評価データ収集について," 情報処理学会研究報告, 2003-SLP-45-9, pp.51-55, 2003.
中村 哲, 西浦敬信, 武田一哉, 黒岩眞吾, 山田武志, 北岡教英, 山本一公, 藤本雅清, 水町光徳, "ETSI AURORAプロジェクトの動向と雑音下音声認識評価ワーキンググループの活動報告," 人工知能学会研究報告, 2002.
中村 哲, 武田一哉, 黒岩眞吾, 山田武志, 北岡教英, 山本一公, 西浦敬信, 藤本雅清, 水町光徳, "SLP雑音下音声認識評価ワーキンググループ活動報告," 情報処理学会研究報告, 2002-SLP-42-11, pp.65-69, 2002.
角谷直子, 北岡教英, 中川聖一, "音声による地名入力タスクにおける誤認識時の言い直し発話の検出と認識," 情報処理学会研究報告, 2002-SLP-42-4, pp.17-22, 2002.
北岡教英, 山田大輔, 中川聖一, "スペクトル特徴量と音源特徴量を用いた音声認識用音響モデルとその評価," 電子情報通信学会技術報告, SP-2002-44, 2002.
山田大輔, 北岡教英, 中川聖一, "音声認識における音源情報の特徴量に関する検討," 日本音響学会講論集, 1-5-5, pp.9-10, 2002.
角谷直子, 北岡教英, 中川聖一, "カーナビの地名入力における誤認識時の言い直し発話の検出手法," 日本音響学会講論集, 2-5-17, pp.107-108, 2002.
押川洋徳, 北岡教英, 中川聖一, "ウェブブラウザにおける任意文字列入力を目的とした音声入力インタフェース," 日本音響学会講論集, 2-P-26, pp.217-218, 2002.
竹内真士, 北岡教英, 中川聖一. "韻律情報を用いた相槌生成システムとその評価," 情報処理学会第64回全国大会, Vol.2, pp.101-102, 2002.
角谷直子, 北岡教英, 中川聖一, "カーナビの地名入力における誤認識時の訂正発話の分析と検出," 情報処理学会研究報告, 2001-SLP-37-11, pp.61-66, 2001.
小林雅史, 北岡教英, 北村達也, 北澤茂良, "HMMを用いた対話音声の話者区分化に関する検討," 日本音響学会講論集, 1-3-2, pp.3-4, 2001.
北岡教英, 赤堀一郎, 中川聖一, "認識結果の正解確率に基づく信頼度とリジェクション," 電子情報通信学会技術報告, SP-99-122, NLC-99-54, 1999.
北岡教英, 赤堀一郎, 中川聖一, "スペクトルサブトラクションを用いた雑音環境下音声認識における時間方向スムージングと分析窓長増加の効果," 日本音響学会講論集1-1-10, pp.19-20, Mar., 1999.
北岡教英, 赤堀一郎, 中川聖一. "スペクトルサブトラクションと時間方向スムージングを用いた雑音環境下音声認識," 電子情報通信学会技術報告, SP-98-27, pp.31-38, June 1998.
北岡教英, 赤堀一郎, 田村震一, 中川聖一, "スペクトルサブトラクションを用いた雑音環境下音声認識における時間方向スムージングの効果", 日本音響学会講論集3-6-6, pp.93-94, Mar. 1998.
北岡教英, 加藤利文, 杉浦 恒, 赤堀一郎, "車載機器用音声対話システム", 情報処理学会研究報告, 96-SLP-12-12, pp.57-61, 1996.
赤堀一郎, 加藤利文, 北岡教英, "地名認識システムとその応用", 情報処理学会研究報告, 95-SLP-7-9, pp.55-60, 1995.
河原達也, 北岡教英, 堂下修司, "A*探索に基づいたフレーズスポッティングによる会話音声理解," 日本音響学会講論集, 1-8-15, Oct. 1994.
河原達也, 北岡教英, 堂下修司, "フレーズスポッティングに基づく頑健な音声理解," 電子情報通信学会技術報告, SP-94-68, NLC94-37, (94-SLP-4-6), 1994.
河原達也, 北岡教英, 額賀信尾, "フレーズスポッティングに基づく音声理解," 音声認識・理解の今後の課題に関する共催研究会, SPREC93-3, pp. 33-35, 1994.
北岡教英, 河原達也, 堂下修司, "自由発話認識・理解のためのフレーズスポッティング," 電子情報通信学会技術報告, SP93-116, NLC93-56, 1993.
北岡教英, 河原達也, 堂下修司, "Right-to-leftパーザを用いた会話音声認識," 人工知能学会全国大会論文集, pp.507-510, 1993.
北岡教英, 河原達也, 堂下修司, "格構造を利用したright-to-left A*探索に基づく会話音声理解", 電子情報通信学会技術報告, SP93-19, 1993.
北岡教英, 河原達也, 堂下修司, "マルチテンプレートを用いた対判別組み合わせ法による男女話者音素認識," 情報処理学会第45回全国大会, Vol.2, pp.1-2, 1992.
Norihide Kitaoka, Takuma Nakagawa, Ryota Nishimura, Yoshio Ishiguro, Shin'ichi Kojima and Shin Ohsuga, "A multimodal control system for autonomous vehicles using speech, gesture and gaze recognition," pp. 101-111, in Vehicles, Drivers, and Safety, De Gruyter, 2020.
間瀬健二・北岡教英,人工知能学大辞典(9章総論),人工知能学会編, pp. 696-705, ISBN978-4320124202, Jul. 2017.
北岡教英(編集委員(分野幹事・音声)), 音響キーワードブック, ISBN978-4-339-00880-7, Mar., 2016.
北岡教英, 進化するヒトと機械の音声コミュニケーション (第4篇第2章 タスク指向対話), ニッケイ印刷, ISBN978-4-86469-065-2, Sep., 2015.
Yiyang Li, Ryo Nakagawa, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda, "Content-based driving scene retrieval using driving behavior and environmental driving Signals," Chap. 14, pp. 243-256, Book chapter in G. U. Schmidt et al. (Eds.), Smart Mobile In-Vehicle Systems - Next Generation Advancements, Springer, Feb. 2014.
中川聖一 編著, 音声言語処理と自然言語処理(5章 対話システム), コロナ社, ISBN978-4-339-02469-2, Mar., 2013.
Longbiao Wang, Kyohei Odani, Atsuhiko Kai, Norihide Kitaoka, and Seiichi Nakagawa, "Dereverberation based on spectral subtraction by multi-channel LMS algorithm for hands-free speech recognition," Book chapter in S. Ramakrishnan (Eds.), Modern Speech Recognition Approaches with Case Studies, 2012.
Yoshihiro Nishiwaki, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda, "A stochastic approach for modeling lane-change trajectories," Digital Signal Processing for In-Vehicle Systems and Safety, Chap.19, Springer, 2011.
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, and Kazuya Takeda, "An analysis of the speech under stress using the two-mass vocal fold model," pp. 57-62,
Sunao Hara, Norihide Kitaoka, and Kazuya Takeda, "On-line detection of task incompletion for spoken dialog systems using utterance and behavior tag N-gram vectors," pp. 215-224, in Ramon Lopez-Cozar Delgado and Tetsunori Kobayashi (Eds.), Proceedings of the Paralinguistic Information and its Integration in Spoken Dialogue Systems Workshop, Springer, ISBN 978-1-4614-1334-9, 2011.
Hiromasa Ohashi, Sunao Hara, Norihide Kitaoka, Kazuya Takeda, "Music recommendation system based on human-to-human conversation recognition," in J. C. Augusto, H. Aghajan, V. Callaghan, D. J. Cook, J. O'Donghue, S. Egerton, M. Gardner, B. D. Johnson, Y. Kovalchuk, R. Lopez-Cozar, P. Mikulecky, J. W. P. Ng, R. Poppe, M. J. Wang, V. Zamudio (Eds), Workshop proceedings of the 7th International Conference on Intelligent Environments: Ambient Intelligence and Smart Environments, Vol. 10, pp. 352-361, ISBN 978-1-60750-794-9, IOS Press, 2011.
Norihide Kitaoka and Satoshi Nakamura, Section 5.1.(3) "Evaluation frameworks for noisy speech recognition," pp. 235-238, in Shuichi ITAHASHI and Chiu-yu TSENG (Eds.), COMPUTER PROCESSING OF ASIAN SPOKEN LANGUAGES, Consideration Books, c/o The Americas Group, Los Angeles, CA, USA, ISBN 978-0-935047-72-1 Soft cover, Mar., 2010.
末永康仁 編著, メディア情報処理(4~6章), オーム社, ISBN978-4-274-20620-7, Nov. 2008.
Makoto Sakai, Norihide Kitaoka and Seiichi Nakagawa, "Feature transformation based on generalization of linear discriminant analysis," Chapter 6 (pp. 103-118) in Mihelic, F, and Zibert, J., (Eds.), Speech Recognition, Chapter 6, IN-TECH, ISBN 978-953-7619-29-9 Hard cover, 550 pages, Nov. 2008.
Chiyomi Miyajima, Takashi Kusakawa, Takanori Nishino, Norihide Kitaoka, Katsunobu Itou, Kazuya Takeda, "On-going data collection of driving behavior signals," pp. 45-54, in Takeda, K.; Erdogan, H.; Hansen, J.H.L.; Abut, H. (Eds.), In-Vehicle Corpus and Signal Processing for Driver Behavior, Springer-Verlag, ISBN978-0-387-79581-2, Nov. 2008.
Ryota Nishimura, Norihide Kitaoka, Seiichi Nakagawa, "A spoken dialog system for chat-like conversations considering response timing," pp. 599-606, in Vaclav Matousek and Pavel Mautner (Eds.), Text, Speech, and Dialogue, Springer, Sep. 2007.
広瀬啓吉 編著(分担執筆),韻律と音声言語情報処理,丸善, ISBN4-621-07674-4, 2006.
松下 温, 屋代智之 共編 (分担執筆), ITSと情報通信技術, 裳華房, ISBN4-7853-6813-6, 2003.
学位論文
頑健な音声認識手法とその実環境への応用に関する研究, 2000.