Profile (Japanese)

増村 亮 (Ryo Masumura)

博士(工学)

Brief overview

  • NTTの研究開発において、次世代メディア処理AI「MediaGnosis」を主導してます。

News

  • Nvidia GTC 2022 SpringでMediaGnosisに関する講演をします。

  • DSTCのコンペティションTrack 4「Reasoning for Audio Visual Scene-Aware Dialog 」で、我々のシステムが2つの客観評価で1位、主観評価で2位を達成しました。

  • MediaGnosisを活用したアプリケーションMOTESSENSEの企画サイトを公開しました

  • 1件の共著論文がAAAI2022 DSTC Workshopに採録されました

  • 1件の共著原著論文がAPSIPA Transactions on Signal and Information Processingに採録されました

  • 1件の共著論文がACM Multimedia Asia2021に採録されました。

  • 1件の共著論文がASRU2021に採録されました。

  • 2021年9月7-9日に開催される2021年秋季音響学会全国大会で共著5件を発表します。

  • 20218月25-27日に開催されるFIT2021で共著1件を発表します。

  • 20217月25-28日に開催されるMIRU2021で共著1件を発表します。

  • 6件(主著1件、共著5件)の論文がInterspeech 2021に採録されました。主著の発表は、"Unified Autoregressive Modeling for Joint End-to-End Multi-Talker Overlapped Speech Recognition and Speaker Attribute Estimation"というタイトルです。

  • 5件(主著1件、共著4件)の論文がICASSP 2021に採録されました。主著の発表は、"Hierarchical Transformer-based Large-Context End-to-End ASR with Large-Context Knowledge Distillation"というタイトルです。

  • IPSJ-ONE2021にてトークをさせていただく予定です。

  • 第91回 言語・音声理解と対話処理研究会で"複数人会話データを活用した音声言語処理とアプリケーション"というタイトルで招待講演を行います。

  • 2021年3月15-19日に開催される言語処理学会第27回年次大会で共著1件を発表します。

  • 2021年3月10-12日に開催される2021年春季音響学会全国大会で共著6件を発表します。

  • "IOWNで未来を描くNTTの研究者たち"という本に、研究の取り組みを取り上げてもらいました。

  • 1件の主著論文がSLT2020に採録されました。"Large-Context Conversational Representation Learning: Self-Supervised Learning for Conversational Documents"というタイトルです。

  • 1件の共著論文がINLG2020に採録されました。"Memory Attentive Fusion: External Language Model Integration for Transformer-based Sequence-to-Sequence Model "というタイトルです。

  • 3件(主著1件、共著2件)の論文がAPSIPA 2020に採録されました。主著の発表は、"End-to-End Automatic Speech Recognition with Deep Mutual Learning"というタイトルです。

  • 5件(主著1件、共著4件)の論文がInterspeech 2020に採録されました。主著の発表は、"Phoneme-to-Grapheme Conversion Based Large-Scale Pre-Training for End-to-End Automatic Speech Recognition "というタイトルです。

  • 2020年8月2-5日に開催されるMIRU2020で主著1件共著1件を発表します。

  • 2020年9月9-11日に開催される2020年春季音響学会全国大会で主著1件共著3件を発表します。

  • 言語処理学会第26回年次大会の発表で年次大会優秀賞を受賞しました。

  • 3件の共著論文がLREC2020に採録されました。

  • 3件(主著1件、共著2件)の論文がICASSP 2020に採録されました。主著の発表は、"Sequence-level Consistency Training for Semi-Supervised End-to-End Automatic Speech Recognition "というタイトルです。

Bioglaphy

  • 2005年3月 新潟県立新潟高等学校 卒業.

  • 2009年3月 東北大学 工学部 電気情報物理工学科 牧野・伊藤研究室 卒業.

  • 2010年8月 NTTコミュニケーション科学基礎研究所 メディア情報研究部 インターンシップ (大庭 隆伸 博士).

  • 2011年3月 東北大学大学院 工学研究科 電気通信工学専攻 伊藤(彰)研究室 博士前期課程 修了.

  • 2011年4月 日本電信電話株式会社 入社.

  • 2011年4月-2011年9月 NTT東日本-青森 研修.

  • 2011年9月-2012年6月 NTTサイバースペース研究所 所属.

  • 2015年4月 東北大学大学院 工学研究科 電気通信工学専攻 伊藤(彰)研究室 博士後期課程 編入学.

  • 2016年9月 東北大学大学院 工学研究科 電気通信工学専攻 伊藤(彰)研究室 博士後期課程 修了.

  • 2012年7月-2019年6月 NTTメディアインテリジェンス研究所 音声言語メディアプロジェクト 所属.

  • 2019年7月-2021年6月 NTTメディアインテリジェンス研究所 心理情報処理プロジェクト所属.

  • 2021年7月-現在 NTTコンピュータ&データサイエンス研究所 次世代AI研究プロジェクト所属

  • 2019年4月-現在 日本電信電話株式会社 特別研究員

Research Topics

  • 音声認識全般 (専門: 言語モデル、音響モデル,発音モデル、End-to-End音声認識)

  • 音声言語処理全般(専門:音声言語識別、音声区間検出、音声感情推定、性別年齢推定、話者識別、キーワードスポッティング、音声ドキュメント検索、シーンセグメンテーション)

  • 自然言語処理全般 (専門: 文生成、文変換、文分類、文書分類、系列ラベリング、トピックモデル、情報検索、形態素解析)

  • 動画像処理全般(専門:顔感情推定、顔向き推定、イメージキャプショニング、シーンテキスト認識)

  • 対話処理全般(専門:音声言語理解、応答生成、ターンテイキング、相槌タイミング検出)

  • 機械学習全般 (専門: ベイジアンモデリング、ニューラルネットワーク)

Member

  • 情報処理学会: #201001676

  • 日本音響学会: #16976

  • 言語処理学会: #333617

  • 電気情報通信学会: #1608681

  • IEEE: #92969452

  • ISCA: #14007

Academic Activities

Program Committe

  • INTERSPEECH (2018-), ICASSP (2019-), ASRU (2015-), SLT(2016-), APSIPA (2019-)

  • ACL (2019-), EMNLP (2019-), AACL (2020-), AAAI (2020-)

  • IEICE Transaction on Information and Systems (2013-)

  • Journal of Information Processing (2013-)

  • Computer Speech and Language (2019-)

  • IEEE Transactions Audio, Speech and Language (2019-)

  • IEEE Access (2019-)

Awards

  • 2010年 日本音響学会 学生優秀発表賞 受賞 (主著表彰).

  • 2010年 IEEE Sendai Section Student Awards 2010 The Best Paper Prize 受賞 (主著表彰).

  • 2013年 日本音響学会 粟屋潔学術奨励賞 受賞 (主著表彰).

  • 2013年 日本電信電話株式会社 サービスイノベーション総合研究所 所長表彰 研究開発奨励賞 受賞 (個人表彰).

  • 2014年 情報処理学会 山下記念研究賞 受賞 (主著表彰).

  • 2015年 言語処理学会 若手奨励賞 受賞 (主著表彰).

  • 2015年 日本電信電話株式会社 メディアインテリジェンス研究所 所長表彰 研究活動賞 受賞 (個人表彰).

  • 2015年 電気情報通信学会 音声研究会奨励賞 受賞 (主著表彰).

  • 2017年 日本電信電話株式会社 メディアインテリジェンス研究所 所長表彰 論文賞 受賞 (個人表彰).

  • 2017年 情報処理学会 研究会推薦博士論文 受賞 (個人表彰).

  • 2018年 日本電信電話株式会社 メディアインテリジェンス研究所 所長表彰 研究活動賞 受賞 (個人表彰).

  • 2018年 情報処理学会 音声言語処理研究会 企業賞 受賞 (インターンシップ指導学生主著の表彰).

  • 2018年 情報処理学会 自然言語処理研究会 優秀研究賞 受賞 (主著表彰).

  • 2019年 日本電信電話株式会社 メディアインテリジェンス研究所 所長表彰 研究活動賞 受賞 (個人表彰).

  • 2019年 電子情報通信学会 情報・システムソサイエティ論文賞 (主著表彰).

  • 2020年 言語処理学会 第26回年次大会優秀賞 (主著表彰).

  • 2020年 日本電信電話株式会社 メディアインテリジェンス研究所 所長表彰 研究活動賞 受賞 (個人表彰).

Contact