Profile (Japanese)

増村 亮 (Ryo Masumura)

博士(工学)

News

  • IPSJ-ONE2020にてトークをさせていただく予定です。
  • 主著2件の論文がASRU 2019に採録されました。タイトルは"Generalized Large-Context Language Models based on Forward-Backward Hierarchical Recurrent Encoder-Decoder Models"、および"Improving Speech-Based End-of-Turn Detection via Cross-Modal Representation Learning with Punctuated Text Data"です。
  • 2020年1月22日に応用脳科学コンソーシアムで音声認識に関するセミナーを行います.
  • 2019年8月28日に情報機構のセミナーで「音声認識とその周辺技術・アプリケーション」というセミナーを行います.
  • 5件(主著1件、共著4件)の論文がAPSIPA ASC2019に採録されました。
  • 主著の論文"Latent Words Recurrent Neural Network Language Models for Automatic Speech Recognition "がIEICE Transaction on Information and Systems に採録されました。
  • 5件(主著2件、共著3件)の論文がINTERSPEECH2019に採録されました。主著の発表は、"End-to-End Automatic Speech Recognition with a Reconstruction Criterion Using Speech-to-Text and Text-to-Speech Encoder-Decoders "および"Improving Conversation-Context Language Models with Multiple Spoken Language Understanding Models " というタイトルです。
  • 主著の論文"Context-Aware Neural Voice Activity Detection Using Auxiliary Networks for Phoneme Recognition, Speech Enhancement and Acoustic Scene Classification"が2019年9月2-6日にスペインで開催される国際会議EUSIPCO2019に採録されました。
  • 共著の本論文がComputer Speech & Languageに採録されました。
  • 電子情報通信学会から主著の連作論文に対して、情報・システムソサイエティ論文賞を受賞しました。編集委員、査読者の皆様、心より感謝いたします。
  • NTT研究所の採用ページで紹介していただきました。
  • 2019年4月1日付で、NTTの特別研究員になりました。
  • 主著の論文"Large Context End-to-End Automatic Speech Recognition via Extension of Hierarchical Recurrent Encoder-Decoder Models"が2019年5月12-17日に開催される国際会議ICASSP 2019に採録されました。
  • 2019年3月14-15日の音声研究会にて、"条件付き階層再帰型エンコーダデコーダに基づく複数人会話音声認識向け言語モデル"というタイトルで発表します。
  • 2019年3月5日の2019年春季音響学会全国大会にて、"学会に発表者として継続的に参加するためのセルフマネージメント "というセミナーを行います。
  • 2019年3月5-7日の2019年春季音響学会全国大会にて、主著2件、共著3件の発表を行います。主著の発表は、"階層再帰型 Encoder-Decoder に基づく談話コンテキスト End-to-End 音声認識"、および"対話コンテキストを扱うターン交替点検出の検討"というタイトルです。
  • 2019年2月8-9日の第14回テキストアナリティクス・シンポジウムにて、"対話コンテキストを考慮したニューラル通話シーン分割"というタイトルで発表します。
  • 2018年12月12日の情報処理学会自然言語処理研究会(自然言語処理シンポジウム)にて、"複数言語複数タスクを扱う発話意図推定モデリングのための敵対的学習の検討"という研究で優秀研究賞を受賞しました。
  • 2019年1月22日に応用脳科学コンソーシアムで音声認識に関するセミナーを行います.
  • 2018年12月6日に日本テクノセンターセミナーで「深層学習による音声認識・音声対話技術の基礎」というセミナーを行います.
  • 2018年12月12日に、第5回自然言語処理シンポジウムで、"複数言語複数タスクを扱う発話意図推定モデリングのための敵対的学習の検討"というタイトルで発表します。
  • 主著の論文"Viterbi Approximation of Latent Words Language Models for Automatic Speech Recognition"がIPSJ Journalに採録されました。2019年2月に公開予定です。
  • 主著の論文"Adversarial Training for Multi-task and Multi-lingual Joint Modeling of Utterance Intent Classification"がEMNLP2018に採択されました。
  • 4件(主著2件、共著2件)の論文がAPSIPA ASC2018に採択されました。主著の発表は、"Online Call Scene Segmentation of Contact Center Dialogues based on Role Aware Hierarchical LSTM-RNNs"および、"Relevant Phonetic-aware Neural Acoustic Models using Native English and Japanese Speech for Japanese-English Automatic Speech Recognition"というタイトルです。
  • 音響学会2018年秋季研究発表会で主著2件共著3件の発表を行います。主著の発表は、"ニューラル言語モデルとニューラル音声合成を用いた音響モデル用学習データの生成モデルの検討"および、"ネイティブ日本語とネイティブ英語の音声データを活用した日本人英語向けニューラル音響モデルの検討"というタイトルです。
  • 3件(主著1件、共著2件)の論文がINTERSPEECH2018に採択されました。主著の発表は、"Role Play Dialogue Aware Language Models based on Conditional Hierarchical Recurrent Encoder-Decoder" というタイトルです。
  • 主著の論文"Multi-task and Multi-lingual Joint Learning of Neural Lexical Utterance Classification based on Partially-shared Modeling"がCOLING2018に採択されました。
  • 主著の論文"Neural Dialogue Context Online End-of-Turn Detection"がSIGDIAL2018に採択されました。

Bioglaphy

  • 2005年3月 新潟県立新潟高等学校 卒業.
  • 2009年3月 東北大学 工学部 電気情報物理工学科 牧野・伊藤研究室 卒業.
  • 2010年8月 NTTコミュニケーション科学基礎研究所 メディア情報研究部 インターンシップ (大庭 隆伸 博士).
  • 2011年3月 東北大学大学院 工学研究科 電気通信工学専攻 伊藤(彰)研究室 博士前期課程 修了.
  • 2011年4月 日本電信電話株式会社 入社.
  • 2011年4月-2011年9月 NTT東日本-青森 研修.
  • 2011年9月-2012年6月 NTTサイバースペース研究所 所属.
  • 2015年4月 東北大学大学院 工学研究科 電気通信工学専攻 伊藤(彰)研究室 博士後期課程 編入学.
  • 2016年9月 東北大学大学院 工学研究科 電気通信工学専攻 伊藤(彰)研究室 博士後期課程 修了.
  • 2012年7月-2019年6月 NTTメディアインテリジェンス研究所 音声言語メディアプロジェクト 所属.
  • 2019年7月-現在 NTTメディアインテリジェンス研究所 心理情報処理プロジェクト所属.
  • 2019年4月-現在 NTTメディアインテリジェンス研究所 特別研究員

Research Topics

  • 音声認識全般 (専門: 言語モデル、音響モデル,発音モデル、End-to-End音声認識)
  • 音声言語処理全般(専門:音声言語識別、音声区間検出、キーワードスポッティング、音声ドキュメント検索、シーンセグメンテーション)
  • 自然言語処理全般 (専門: 文分類、文書分類、系列ラベリング、トピックモデル、情報検索、形態素解析)
  • 動画像処理全般(専門:イメージキャプショニング、シーンテキスト認識)
  • 対話処理全般(専門:音声言語理解、応答生成、ターンテイキング、相槌タイミング検出)
  • 機械学習全般 (専門: ベイジアンモデリング、ニューラルネットワーク)

Member

  • 情報処理学会: #201001676
  • 日本音響学会: #16976
  • 言語処理学会: #333617
  • 電気情報通信学会: #1608681
  • IEEE: #92969452
  • ISCA

Academic Activities

Reviewer

  • INTERSPEECH (2018, 2019)
  • ICASSP (2019, 2020)
  • ASRU (2015, 2017, 2019)
  • SLT (2016, 2018)
  • ACL (2019)
  • EMNLP (2019)
  • APSIPA (2019)
  • AAAI (2020)
  • IEICE Transaction on Information and Systems (2013, 2014, 2015, 2016, 2017, 2018, 2019)
  • Journal of Information Processing (2013)
  • Computer Speech and Language (2019)
  • IEEE Transactions Audio, Speech and Language (2019)
  • IEEE Access (2019)

Awards

  • 2010年 日本音響学会 学生優秀発表賞 受賞 (主著表彰).
  • 2010年 IEEE Sendai Section Student Awards 2010 The Best Paper Prize 受賞 (主著表彰).
  • 2013年 日本音響学会 粟屋潔学術奨励賞 受賞 (主著表彰).
  • 2013年 日本電信電話株式会社 サービスイノベーション総合研究所 所長表彰 研究開発奨励賞 受賞 (個人表彰).
  • 2014年 情報処理学会 山下記念研究賞 受賞 (主著表彰).
  • 2015年 言語処理学会 若手奨励賞 受賞 (主著表彰).
  • 2015年 日本電信電話株式会社 メディアインテリジェンス研究所 所長表彰 研究活動賞 受賞 (個人表彰).
  • 2015年 電気情報通信学会 音声研究会奨励賞 受賞 (主著表彰).
  • 2017年 日本電信電話株式会社 メディアインテリジェンス研究所 所長表彰 論文賞 受賞 (個人表彰).
  • 2017年 情報処理学会 研究会推薦博士論文 受賞 (個人表彰).
  • 2018年 日本電信電話株式会社 メディアインテリジェンス研究所 所長表彰 研究活動賞 受賞 (個人表彰).
  • 2018年 情報処理学会 音声言語処理研究会 企業賞 受賞 (インターンシップ指導学生主著の表彰).
  • 2018年 情報処理学会 自然言語処理研究会 優秀研究賞 受賞 (主著表彰).
  • 2019年 日本電信電話株式会社 メディアインテリジェンス研究所 所長表彰 研究活動賞 受賞 (個人表彰).
  • 2019年 電子情報通信学会 情報・システムソサイエティ論文賞 (主著表彰).

Contact