周藤 唯 / Yui Sudo, Ph.D.
博士(工学)
Researcher
Research interests include automatic speech recognition, computational auditory scene analysis, and robot audition.
2009年慶應義塾大学システムデザイン工学科卒業、2011年慶應義塾大学同大学院理工学研究科総合デザイン工学専攻修了。2021年東京工業大学工学院システム制御系後期博士過程修了。2011年本田技研工業㈱入社。2012年より、ホンダエンジニアリング㈱にて異常音検査装置や自律移動搬送ロボットなどの開発を行う。2016年北米事業所 (Honda Engineering North America Co., Ltd.) 駐在、開発した装置を導入。2018年東京工業大学博士後期課程へ進学、2021年修了。2019年、本田技術研究所に異動、自律移動ロボットの開発に従事。2020年より、ホンダ・リサーチ・インスティチュート・ジャパン勤務。現在、ロボット聴覚や音環境理解、音声認識の研究に従事。情報処理学会、日本音響学会、ISCA、IEEE会員。
Yui Sudo received the B.S. and M.S. degrees from Keio University, Kanagawa, Japan, in 2009 and 2011, respectively, and the Ph.D. degree from Tokyo Institute of Technology, Tokyo, Japan, in 2021. He worked with Honda Motor Co., Ltd., Tokyo, Japan, in 2011, Honda Engineering Co., Ltd., Tochigi, Japan, from 2012 to 2018, and Honda R&D Co., Ltd., Saitama, Japan, from 2019 to 2020. Currently, he is a Senior Engineer at Honda Research Institute Japan Co., Ltd., Saitama, Japan. His research interests include automatic speech recognition, signal processing, computational auditory scene analysis, and robot audition. He is a member of the IEEE and ISCA.
略歴 / Biography
- 2005年3月 神奈川県立湘南高等学校 卒業
- 2009年3月 慶應義塾大学 理工学部 システムデザイン工学科 卒業
- 2011年3月 慶應義塾大学大学院 理工学研究科 総合デザイン工学専攻 博士前期課程 修了
- 2011年4月 本田技研工業 株式会社 入社
- 2012年4月 ホンダエンジニアリング 株式会社 勤務
- 2016年4月 Honda Engineering North America Co., Ltd. 勤務
- 2019年1月 株式会社 本田技術研究所 勤務
- 2021年3月 東京工業大学大学院 工学院 システム工学系 博士後期課程 修了
- 2020年12月~現在 株式会社 ホンダ・リサーチ・インスティチュート・ジャパン 勤務
受賞 / Award
2023年 Best Reviewer Award, ASRU, IEEE
2023年 人工知能学会研究会優秀賞 (大崎 崇博, 周藤 唯, 糸山 克寿, 西田 健次, 中臺 一博, “Parallel Adapter ModelとNear-Identity初期化を用いた音声認識の雑音耐性向上”, 第62回人工知能学会 AIチャレンジ研究会予稿集, 2023年11月)
2011年 精密工学会 第8回2011年度 研究奨励賞 (周藤 唯, 柿沼 康弘, 大西 公平, 青山 藤詞郎, "エンドミル加工における外乱オブザーバを用いたセンサレスびびり振動検出技術の開発(第1報)," 精密工学会誌, Vol. 77, No. 7, 2011, pp. 707-712.)
ジャーナル、レター / Journal, letter
大崎 崇博, 周藤 唯, 糸山 克寿, 西田 健次, 中臺 一博, “音声強調ネットワークとアダプターを用いた音声認識モデルの耐ノイズ性向上”, ロボット学会誌 (Accepted).
Y. Sudo, K. Itoyama, K. Nishida, and K. Nakadai, "Multichannel Environmental Sound Segmentation with Separately Trained Spectral and Spatial Features," Journal of Applied Intelligence, 2021, 51, pp. 8245–8259.
Y. Sudo, K. Itoyama, K. Nishida, and K. Nakadai, "Sound event aware environmental sound segmentation with Mask U-Net," Journal of Advanced Robotics; 2020, 34, 1280–1290.
Y. Kakinuma, Y. Sudo, and T. Aoyama, “Detection of Chatter Vibration in End Milling applying Disturbance Observer”, CIRP Annals-Manufacturing Technology, Vol. 60, No.1, 2011, pp. 109-112.
周藤唯, 柿沼康弘, 大西公平, 青山藤詞郎, "エンドミル加工における外乱オブザーバを用いたセンサレスびびり振動検出技術の開発(第1報)," 精密工学会誌, Vol. 77, No. 7, 2011, pp. 707-712 (精密工学会 第8回2011年度 研究奨励賞).
査読あり国際会議 / Peer-reviewed conference paper
Y. Peng, Y. Sudo, M. Shakeel, and S. Watanabe, “OWSM-CTC: An Open Encoder-Only Speech Foundation Model for Speech Recognition, Translation, and Language Identification”, in Proc. ACL, 2024 (accepted).
T. Osaki, Y. Sudo, K. Itoyama, K. Nishida, and K. Nakadai, "Improving Noise Robustness of Automatic Speech Recognition based on a Parallel Adapter Model with Near-Identity Initialization," in Proc. IEA/AIE, 2024 (accepted).
Y. Sudo, M. Shakeel, Y. Peng, and S. Watanabe, “Contextualized Automatic Speech Recognition with Attention-Based Bias Phrase Boosted Beam Search”, in Proc. ICASSP, 2024, pp. 10896-10900.
M. Shakeel, Y. Sudo, Y. Peng, and S. Watanabe, “Joint Optimization of Streaming and Non-streaming Automatic Speech Recognition with Multi-decoder and Knowledge Distillation”, satellite workshop HSCMA in ICASSP, 2024.
Y. Peng, J. Tian, B. Yan, D. Berrebbi, X. Chang, X. Li, J. Shi, S. Arora, W. Chen, R. Sharma, W. Zhang, Y. Sudo, M. Shakeel, J. Jung, S. Maiti, S. Watanabe, "Reproducing Whisper-Style Training Using an Open-Source Toolkit and Publicly Available Data ”, in Proc. ASRU.
R. Takeda, Y. Sudo, and T. Komatani, “Flexible Evidence Model to Reduce Uncertainty Mismatch Between Speech Enhancement and ASR Based on Encoder-Decoder Architecture”, in Proc. APSIPA, 2023.
Y. Sudo, M. Takigahira, H. Tsuru, K. Nakadai, and H. Nakajima, “Online Adaptation of Fourier Series Based Acoustic Transfer Function Model to Improve Sound Source Localization and Separation”, in Proc. RO-MAN, 2023.
Y. Sudo, M. Shakeel, B. Yan, J. Shi, and S. Watanabe, “4D ASR: Joint modeling of CTC, Attention, Transducer, and Mask-Predict decoders”, in Proc. INTERSPEECH, 2023, pp. 3312-3316.
Y. Sudo, M. Shakeel, Y. Peng, and S. Watanabe, “Time-synchronous one-pass Beam Search for Parallel Online and Offline Transducers with Dynamic Block Training”, in Proc. INTERSPEECH, 2023, pp. 4479-4483.
Y. Sudo, K. Hata, and K. Nakadai, “Retraining-free Customized ASR for Enharmonic Words Based on a Named-Entity-Aware Model and Phoneme Similarity Estimation”, in Proc. INTERSPEECH, 2023, pp. 491-495.
Y. Peng, Y. Sudo, M. Shakeel, and S. Watanabe, “DPHuBERT: Joint Distillation and Pruning of Self-Supervised Speech Models”, in Proc. INTERSPEECH, 2023, pp. 62-66.
Y. Long, R. Yasuda, Y. Sudo, K. Itoyama, K. Nakadai, Hideharu Amano, and Kenji Nishida, “Sound event localization and detection utilizing overlapping end-to-end learning ”, Proceedings of Asia Pacific Conference on Robot IoT System Development and Platform (APRIS), 2023
Y. Sudo, M. Shakeel, K. Nakadai, J. Shi and S. Watanabe, “Streaming Automatic Speech Recognition with Re-blocking Processing Based on Integrated Voice Activity Detection”, in Proc. INTERSPEECH, 2022, pp. 4641-4645.
R. Takeda, Y. Sudo, K. Nakadai, and T. Komatani, “Empirical Sampling from Latent Utterance-wise Evidence Model for Missing Data ASR based on Neural Encoder-Decoder Model”, in Proc. INTERSPEECH, 2022, pp. 3789-3793.
Y. Sudo, K. Itoyama, K. Nishida, and K. Nakadai, “Multi-channel Environmental sound segmentation utilizing Sound Source Localization and Separation U-Net”, in Proc. SII, 2021, pp. 382-387.
Y. Sudo, K. Itoyama, K. Nishida, and K. Nakadai, “Multi-channel Environmental sound segmentation”, in Proc. SII, 2020, pp. 820-825.
Y. Sudo, K. Itoyama, K. Nishida, and K. Nakadai, “Environmental sound segmentation utilizing Mask U-Net”, in Proc. IROS, 2019, pp. 5340-5345.
Y. Sudo, K. Itoyama, K. Nishida, and K. Nakadai, “Improvement of DOA estimation by using quaternion output in sound event localization and detection”, in Proc. DCASE, 2019, pp. 244-247.
M. Iwatsuki, Y. Sudo, K. Itoyama, K. Nishida, and K. Nakadai, "Listen and Tell: Acoustic Scene Caption Generation using Deep Learning", in The Third International Workshop on Symbolic-Neural Learning (SNL) 2019.
Y. Sudo, Y. Kakinuma, K. Ohnishi, and T. Aoyama, "Development of Chatter Vibration Detecting System utilizing Sensor-less Process Monitoring, " in Proc. of 43rd CIRP International Conference on Manufacturing Systems, Vienna, Austria, May 26-28, 2010, pp. 551-554.
査読なし会議 / Non-peer reviewed conference paper
大崎 崇博, 周藤 唯, 糸山 克寿, 西田 健次, 中臺 一博, “Parallel Adapter ModelとNear-Identity初期化を用いた音声認識の雑音耐性向上”, 第62回人工知能学会 AIチャレンジ研究会予稿集, 2023年11月, 人工知能学会, 慶應義塾大学 (人工知能学会 研究会 優秀賞).
周藤 唯, 瀧ケ平 将行 , 中臺 一博, 中島 弘史 , “フーリエ級数展開を用いた軽量伝達関数のオンライン適応による音源定位・分離の向上 ”, 第62回人工知能学会 AIチャレンジ研究会予稿集, 2023年11月, 人工知能学会, 慶應義塾大学.
M. Shakeel, Y. Sudo, Y. Peng, S. Watanabe, “End-to-end integration of online and offline encoders using auxiliary losses for automatic speech recognition”, 第62回人工知能学会 AIチャレンジ研究会予稿集, 2023年11月, 人工知能学会, 慶應義塾大学.
Y. Long, R. Yasuda, Y. Sudo, K. Itoyama, K. Nakadai, H. Amano, and K. Nishida, “An efficient end-to-end learning method for sound event localization and detection”, 第41回日本ロボット学会学術講演会予稿集 (RSJ 2023), 2023年09月, 日本ロボット学会.
周藤 唯, Muhammad Shakeel, 中臺 一博, 史 嘉彤, 渡部 晋治, “Blockwiseストリーミング音声認識と発話区間検出の統合”, 第61回人工知能学会 AIチャレンジ研究会予稿集, 2022年11月, 人工知能学会, 慶應義塾大学, pp.51-56.
岩月 道生, 周藤 唯, 糸山 克寿, 西田 健次, 中臺 一博, “音環境説明ロボットの実現に向けた環境音キャプションコーパスの構築”, 第37回日本ロボット学会学術講演会予稿集 (RSJ 2019), 2019年09月, 日本ロボット学会, 早稲田大学.
岩月 道生, 周藤 唯, 糸山 克寿, 西田 健次, 中臺 一博, “Listen and Tell: 深層学習を用いた音響シーンのキャプション生成”, 第81回情報処理学会全国大会講演論文集, 2019年03月, 情報処理学会, 早稲田大学, pp. 407-408.
周藤 唯, 糸山 克寿, 西田 健次, 中臺 一博, “Mask U-Net を用いた環境音セグメンテーションの提案”, 第52回人工知能学会 AIチャレンジ研究会予稿集, 2018年12月, 人工知能学会, 早稲田大学, pp. 21-26.
周藤 唯, 柿沼 康弘, 大西 公平, 青山 藤詞郎, “エンドミル加工における外乱オブザーバを用いたセンサレスびびり振動検出技術の開発”, 2011年度精密工学会春季大会学術講演会, 2011-03, pp.333-334.
三又昭範, 周藤 唯, 柿沼 康弘, 青山 藤詞郎, 柳川 章全, "工作機械主軸用ラビリンスシールへの油滴の浸入メカニズムの数値解析," 精密工学会学術講演会講演論文集 2009 年度精密工学会春季大会, pp. 1049-1050.
講演 / Tech talk
Y. Sudo, "End-to-end Automatic Speech Recognition with Module Integration using Deep Learning and Its Application to Systems for the Hearing Impaired," Honda Technical Forum, Tochigi, Japan, 2022
周藤 唯, "深層学習を用いた音源定位、音源分離、クラス分類の統合 〜環境音セグメンテーション手法の紹介〜, " Tokyo BISH Bash #05, online, 2021
特許 / Patent
Abnormal sound determination apparatus and determination method, Patent US10607632B2
Abnormal sound detection apparatus and detection method, Patent US10475469B2
音検査方法:出願日:2013年3月22日,特願2013-060012,特許公開2014-185902,特許第6033718号(2016年11月4日登録)
車両診断装置の電源バックアップ回路:出願日:2013年8月27日,特願2013-175347,特許公開2015-046964,特許第6101174号(2017年3月3日登録)
加工びびり振動検出装置,および工作機械:出願日:2011年3月30日,特願2011-75298,特許公開2012-206230,特許第5609739号(2014年9月12日登録)
学術貢献活動 / Academic service
座長 / Session Chair
IEEE International conference on robot and human interactive communication (RO-MAN), regular session, Linguistic Communication and Dialogue, 2023
ワークショップ主催 / Workshop organizer
査読 / Reviewer
■ 論文誌 / Journal
IEEE/ACM Transactions on Audio, Speech, and Language Processing (2023-)
Speech Communication (2023)
IEEE Access (2023)
Signal, Image and Video Processing (2023)
Institute of Electronics, Information and Communication Engineers (2021)
■ 国際会議 / International conference
ISCA Interspeech (2024)
Annual Meeting of the Association for Computational Linguistics (ACL 2024)
IEEE International Conference on Robot and Human Interactive Communication (RO-MAN 2024)
IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2023-)
IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU 2023)
IEEE Spoken Language Technology Workshop (SLT 2022)
IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2022)
教育 / Teaching
慶應義塾大学 大学院 理工学研究科, 先進システムデザイン工学(2024/6/27回担当)
慶應義塾大学 理工学部 システムデザイン工学部, システムデザイン工学演習 (TA), 2009-2010
語学 / Language
TOEIC 895 (2022/2)
英検準1級(2022)
VERSANT 59(2021)
独検3級(2016)
資格 / Certification
日商簿記検定3級(2021)
基本情報処理技術者(2015)