名前
實廣 貴敏(じつひろ たかとし)
教授 博士(工学)
工学部 情報メディア学科
TEL: 0533-68-1135(代)
【研究分野】
音声認識(音響モデル,言語モデル,未知語リジェクション,非母国語話者発声への対応,音声入力インタフェース評価,音声認識エンジン開発,など)
【学 歴】
1991年3月 名古屋大学工学部卒業
1993年3月 名古屋大学大学院工学研究科博士前期課程修了
2002年4月 奈良先端科学技術大学 情報科学研究科
博士後期課程 入学
(ATR在籍中)
2005年3月 同 修了
【職 歴】
1993年4月 日本電信電話株式会社 入社
ヒューマンインタフェース研究所に配属.
(1999年1月 サイバースペース研究所)
2000年4月 (株)国際電気通信基礎技術研究所 (ATR)
音声言語通信研究所へ出向
(現 音声言語コミュニケーション研究所)
2006年4月 ATRメディア情報科学研究所
(5月~ ATR知識科学研究所)へ異動.
2008年3月 日本電信電話株式会社 退職
2008年4月 愛知工科大学 工学部 情報メディア学科 准教授
ATR知識科学研究所 客員研究員 兼務
2009年4月 名古屋大学大学院工学研究科 特任准教授 兼務
2010年4月~2014年3月 名古屋大学大学院情報科学研究科 特任准教授 兼務
2018年4月 愛知工科大学 工学部 情報メディア学科 教授
現在に至る.
[Journal paper]
渡邊 風太, 實廣 貴敏: 姿勢推定を用いた管楽器奏者の演奏前動作検出,
愛知工科大学紀要,第23巻,pp.21-27 (2026.3.25).
古木 淳也,實廣 貴敏: 音声対話システムにおけるゲシュタルトマッチングによる質問種別推定,
愛知工科大学紀要,第22巻,pp.15-21 (2025.3.25).
金田 涼吾,實廣 貴敏: ポピュラー音楽におけるピアノ伴奏のMusic Transformerによる自動生成,
愛知工科大学紀要, 第21巻, pp.11-18 (2024.3).
神谷 俊樹,實廣 貴敏: 音声対話システム周辺での環境音に対するデータ拡張による識別精度の向上,
愛知工科大学紀要, 第20巻, pp.15-22 (2023.3).
山中 裕介,實廣 貴敏: 感情音声合成を用いた高齢者向けコミュニケーションツール,
愛知工科大学紀要, 第19巻, pp.9-18 (2022.3.25).
堀 弘志, 實廣 貴敏: Convolutional Neural Networkを用いた楽曲からのアーティスト識別および類似アーティストの推定, 愛知工科大学紀要, 第18巻, pp.15-20 (2021.3).
早川元貴, 實廣貴敏: Kinectセンサーを用いた音声対話システム前における人物の動作識別,
愛知工科大学紀要, 第17巻, pp.15-22 (2020.3).
實廣 貴敏,宮嶋 博, 布目 貴大, 武田 一哉,
単一マイクロホン入力音声からのDeep Belief Networkによる発話者までの距離推定,
愛知工科大学紀要, 第16巻, pp.39-44 (2019.3).
實廣 貴敏, 伊藤 俊樹, 早瀬 友博,
“スマートフォンの加速度センサを用いたぬいぐるみに与えた動作の認識,”
愛知工科大学紀要, 第15巻, pp.27—32, (2018.3).
李津, 實廣貴敏, 武田一哉,
“単一マイクロホン入力音声から音響モデルを用いた発話者との距離推定,”
愛知工科大学紀要, 第14巻, pp. 1—7, (2017.3).
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda,
``Modeling of Physical Characteristics of Speech under Stress,’’
IEEE Signal Processing Letters, Vol.22, Issue.10, pp.1801-1805, 2015.
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda,
``Classification of speech under stress based on physical modeling,''
Acoustical Science and Technology, vol. 34, no. 5, pp. 311--321, 2013.
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda,
``Classification of speech under stress based on modeling of the vocal folds and vocal tract,''
EURASIP Journal on Audio, Speech, and Music Processing 2013, 2013:17.
Takatoshi Jitsuhiro, Tomoji Toriyama, Kiyoshi Kogure, ``Multi-Model Noise Suppression Integrating Particle Filtering for Speech Recognition in Real Environments," IEICE Trans. D, vol. J91-D, no. 10, pp. 2519--2528, Oct., 2008 (in Japanese).
C. T. Ishi, Shigeki Matsuda, Takayuki Kanda, Takatoshi Jitsuhiro, Hiroshi Ishiguro, Satoshi Nakamura, Norihiro Hagita, "A Robust Speech Recognition System for Communication Robots in Noisy Environments," IEEE Trans. Robotics, vol. 24, no. 3, pp. 759--763, June, 2008.
Takatoshi Jitsuhiro, Tomoji Toriyama, Kiyoshi Kogure, ``Noise Suppression Based on Multi-Model Compositions Using Multi-Pass Search with Multi-Label N-gram Models,’’ IEICE Trans. Inf. & Syst., vol. E91-D, No. 3, pp. 402--410, 2008.
Takatoshi Jitsuhiro, Shigeki Matsuda, Yutaka Ashikari, Satoshi Nakamura, Ikuko Eguchi Yairi, Seiji Igi, ``Speech Interface of Mobility Support Geographic Information System and Its Evaluation for Elderly People,'' Human Interface Society, vol. 8, no. 2, pp. 271--282, 2006 (in Japanese).
Satoshi Nakamura, Konstantin Markov, Hiromi Nakaiwa, Genichiro Kikui, Hisashi Kawai, Takatoshi Jitsuhiro, Jin-Song Zhang, Hirofumi Yamamoto, Eiichiro Sumita, Seiichi Yamamoto, ``The ATR Multilingual Speech-to-Speech Translation System,'' IEEE Trans. on Audio, Speech and Language Processing, Vol. 14, No. 2, pp. 365--376, 2006.
Shigeki Matsuda, Takatoshi Jitsuhiro, Konstantin Markov, Satoshi Nakamura, ``ATR Parallel Decoding Based Speech Recognition System Robust to Noise and Speaking Styles,'' IEICE Trans. Inf. & Syst., vol. E89-D, no. 3, pp. 989--997, 2006.
Takatoshi Jitsuhiro, Satoshi Nakamura, ``Automatic Generation of Non-uniform and Context-Dependent HMMs Based on the Variational Bayesian Approach,'' IEICE Trans. Inf. & Syst., vol. E88-D, no. 3, pp. 391--400, 2005.
Takatoshi Jitsuhiro, Tomoko Matsui, Satoshi Nakamura, ``Automatic Generation of Non-uniform HMM Topologies Based on the MDL Criterion,'' IEICE Trans. Inf. & Syst., vol. E87-D, no. 8, pp. 2121--2129, 2004.
Takatoshi Jitsuhiro, Hirofumi Yamamoto, Setsuo Yamada, Genichiro Kikui, Yoshinori Sagisaka, ``Language Modeling Using Patterns Extracted from Parse Trees for Speech Recognition,'' IEICE Trans. Inf. & Syst., vol. E86-D, no. 3, pp. 446--453, 2003.
Takatoshi Jitsuhiro, Satoshi Takahashi, Kiyoaki Aikawa, ``Rejection of Unknown Words Using Phoneme Confidence Likelihood for Isolated-Word Speech Recognition,'' IEICE Trans. D-II, vol. J83-D-II, no. 2, pp. 478--485, 2000 (in Japanese).
[International conference]
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda,
``ESTIMATION OF VOCAL TRACT PARAMETERS FOR THE CLASSIFICATION OF SPEECH UNDER STRESS,'' Proc. of ICASSP2013, pp. 7532--7536, 2013.
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda,
``Classification of speech under stress by modeling the aerodynamics of the laryngeal ventricle,''
Proc. of INTERSPEECH2013, pp. 837--841, 2013.
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda,
``Classification of Stressed Speech Using Physical Parameters Derived from Two- Mass Model,''
Proc. of INTERSPEECH2012, Portland, Sept., 2012.
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda,
``PHYSICAL CHARACTERISTICS OF VOCAL FOLDS DURING SPEECH UNDER STRESS,''
Proc. of ICASSP2012, pp. 4609--4612, Kyoto, 2012.
Xiao Yao, Takatoshi Jitsuhiro, Chiyomi Miyajima, Norihide Kitaoka, Kazuya Takeda,
``An Analysis of the Speech Under Stress Using the Two-Mass Vocal Fold Model,''
Proc. of Workshop on Paralinguistic Information and its Integration in
Spoken Dialogue Systems (IWSDS), pp.53--58, 2011.
Kotaro Ogino, Takatoshi Jitsuhiro, Chiyomi Miyajima, Kazuya Takeda, ``Analyzing Grasping for Inferring Cognitive States of users,'' Proc. of ICASSP2010, pp.2230--2233, Dallas, Mar., 2010.
Takatoshi Jitsuhiro, Tomoji Toriyama, Kiyoshi Kogure, ``Multi-model Noise Suppression Using Particle Filtering,'' Proc. of ICASSP2008, pp. 4397--4400 , Las Vegas, Apr., 2008.
Takatoshi Jitsuhiro, Tomoji Toriyama, Kiyoshi Kogure, ``Robust Speech Recognition Using Noise Suppression Based on Multiple Composite Models and Multi-Pass Search,'' 2007 IEEE Automatic Speech Recognition and Understanding Workshop (ASRU2007), pp. 53--58, Kyoto, Dec., 2007.
Takatoshi Jitsuhiro, Tomoji Toriyama, Kiyoshi Kogure, ``Noise Suppression Using Search Strategy with Multi-Model Compositions,'' Proc. of INTERSPEECH2007, pp. 1078--1081, 2007.
Takatoshi Jitsuhiro, Shigeki Matsuda, Yutaka Ashikari, Satoshi Nakamura, Ikuko Eguchi Yairi, Seiji Igi, ``Spoken Dialog System and Its Evaluation of Geographic Information System for Elderly Persons' Mobility Support,'' Proc. of INTERSPEECH2005, pp. 197--200, 2005.
W. Herbordt, T. Horiuchi, M. Fujimoto, T. Jitsuhiro, S. Nakamura, ``Hands-Free Speech Recognition and Communication on PDAs Using Microphone Array Technology,'' Proc. of 2005 IEEE Workshop on ASRU, pp. 302--307, 2005.
Takatoshi Jitsuhiro, Satoshi Nakamura, ``Variational Bayesian Based Topology Training and Mixture Component Splitting for Acoustic Modeling,'' Beyond HMM Workshop, Technical Report of IEICE, NLC2004-51, SP204-91, IPSJ SIG Technical Reports, 2004-SLP-54, pp. 61--66, 2004.
Takatoshi Jitsuhiro, Satoshi Nakamura, ``Increasing the Mixture Components of Non-Uniform HMM Structures Based on a Variational Bayesian Approach,'' Proc. of INTERSPEECH2004 (ICSLP), vol. 1, pp. 697--700, 2004.
Shigeki Matsuda, Takatoshi Jitsuhiro, Konstantin Markov, Satoshi Nakamura, ``Speech Recognition System Robust to Noise and Speaking Styles,'' Proc. of INTERSPEECH2004 (ICSLP), 2004.
Takatoshi Jitsuhiro, Satoshi Nakamura, ``Automatic Generation of Non-Uniform HMM Structures Based on Variational Bayesian Approach,'' Proc. of ICASSP2004, vol. I, pp. 805--808, 2004.
Takatoshi Jitsuhiro, Tomoko Matsui, Satoshi Nakamura, ``A Successive State Splitting Algorithm Based on The MDL Criterion by Data-driven and Decision Tree Clustering,'' Proc. of SSPR2003, pp. 43-46, 2004.
Takatoshi Jitsuhiro, Satoshi Nakamura, ``Variational Bayesian Approach for Automatic Generation of HMM Topologies,'' Proc. of 2003 IEEE Workshop on ASRU, pp. 77--82, 2003.
Takatoshi Jitsuhiro, Tomoko Matsui, Satoshi Nakamura, ``Automatic Generation of Non-Uniform Context-Dependent HMM Topologies Based on The MDL Criterion,'' Proc. of EUROSPEECH2003, vol. 4, pp. 2721--2724, 2003.
Takatoshi Jitsuhiro, Hirofumi Yamamoto, Setsuo Yamada, Yoshinori Sagisaka, ``New Language Models Using Phrase Structures Extracted From Parse Trees,'' Proc. of EUROSPEECH2001, vol. 1, pp. 697--700, 2001.
Takatoshi Jitsuhiro, Satoshi Takahashi, Kiyoaki Aikawa, ``Rejection of Out-Of-Vocabulary Words Using Phoneme Confidence Likelihood,'' Proc. of ICASSP'98, vol. 1, pp. 217--220, 1998.
Takatoshi Jitsuhiro, Tomokazu Yamada, Shigeki Sagayama, ``Syllabic Duration Control for Vocabulary-Free Speech Recognition,'' Proc. of EUROSPEECH95, pp. 15--18, 1995.
[Doctoral Dissertation]
``Automatic Model Generation for Speech Recognition''
Nara Institute of Science and Technology, 2005