Search this site
Embedded Files
Masato Mita
  • En
  • Ja
Masato Mita
  • En
  • Ja
  • More
    • En
    • Ja

三田雅人 

  • 博士(情報科学)

  • 株式会社サイバーエージェント(AI Lab), リードリサーチサイエンティスト

  • 東京都立大学 自然言語処理研究室(小町研究室), 特任助教

  • 理化学研究所革新知能統合研究センター 自然言語理解チーム, 客員研究員

研究発表

論文誌

  1. 小山 碧海, 喜友名 朝視顕, 小林 賢治, 新井 美桜, 三田 雅人, 岡 照晃, 小町 守. 日本語文法誤り訂正のための誤用タグ付き評価コーパスの構築. 自然言語処理 30巻2号. (2023.6) [Paper]

  2. Hongfei Wang, Michiki Kurosawa, Satoru Katsumata,  Masato Mita, Mamoru Komachi. Chinese Grammatical Error Correction Using Pre-trained Models and Pseudo Data. Transactions on Asian and Low-Resource Language Information Processing (TALIP). [Paper]

  3. 山下 郁海, 金子 正弘, 三田 雅人, 勝又 智, Aizhan Imankulova, 小町 守. 言語間での転移学習のための事前学習モデルと多言語の学習者データを用いた文法誤り訂正. 自然言語処理 29巻2号. (2022.6). [Paper]

  4. 藤井 諒, 三田 雅人, 阿部 香央莉, 塙 一晃, 森下 睦, 鈴木 潤, 乾 健太郎. 機械翻訳モデルの頑健性評価に向けた言語現象毎データセットの構築と分析.  自然言語処理 28巻2号. (2021.6). [Paper]

  5. 三田 雅人, 水本 智也, 金子 正弘, 永田 亮, 乾 健太郎. 文法誤り訂正モデルの横断評価. 自然言語処理 28巻1号. (2021.3). [Paper]


国際会議・ワークショップ(査読あり)

  1. Zizheng Zhang, Masato Mita, Mamoru Komachi.ClozEx: A Task toward Generation of English Cloze Explanation. Findings of EMNLP 2023. [Paper]

  2. Yusuke Ide, Masato Mita, Adam Nohejl,  Hiroki Ouchi, and Taro Watanabe. Japanese Lexical Complexity for Non-Native Readers: a New Dataset. ACL Workshop, BEA 2023. [Paper]

  3. Zizheng Zhang, Masato Mita, Mamoru Komachi. Cloze Quality Estimation for Language Assessment. Findings of EACL 2023. [Paper]

  4. Yujin Takahashi, Masahiro Kaneko, Masato Mita, Mamoru Komachi. Proficiency Matters Quality Estimation in Grammatical Error Correction. Proceedings of the LREC 2022. [Paper]

  5. Daisuke Suzuki, Yujin Takahashi, Ikumi Yamashita, Taichi Aida, Tosho Hirasawa, Michitaka Nakatsuji, Masato Mita, Mamoru Komachi. Construction of a Quality Estimation Dataset for Automatic Evaluation of Japanese Grammatical Error Correction. Proceedings of the LREC 2022. [Paper]

  6. Ryo Nagata, Masato Hagiwara, Kazuaki Hanawa, Masato Mita, Artem Chernodub, Olena Nahorna. Shared Task on Feedback Comment Generation for Language Learners. Proceedings of the INLG 2021. [Paper]

  7. Masato Mita, Hitomi Yanaka. Do Grammatical Error Correction Models Realize Grammatical Generalization?. Findings of the ACL-IJCNLP 2021. [Paper]

  8. Takumi Gotou, Ryo Nagata, Masato Mita, Kazuaki Hanawa. Taking the Correction Difficulty into Account in Grammatical Error Correction Evaluation. Proceedings of the COLING 2020. [Paper]

  9. Ryo Fujii, Masato Mita, Kaori Abe, Kazuaki Hanawa, Makoto Morishita, Jun Suzuki, Kentaro Inui. PheMT: A Phenomenon-wise Dataset for Machine Translation Robustness on User-Generated Contents. Proceedings of the COLING 2020. [Paper]

  10. Masato Mita, Shun Kiyono, Masahiro Kaneko, Jun Suzuki, Kentaro Inui. A Self-Refinement Strategy for Noise Reduction in Grammatical Error Correction. Findings of the EMNLP 2020. [Paper]

  11. Hiroaki Funayama, Shota Sasaki, Yuichiro Matsubayashi, Tomoya Mizumoto, Jun Suzuki, Masato Mita, Kentaro Inui. Preventing Critical Scoring Errors in Short Answer Scoring with Confidence Estimation. Proceedings of the ACL SRW 2020. [Paper]

  12. Masahiro Kaneko, Masato Mita, Shun Kiyono, Jun Suzuki, Kentaro Inui. Can Encoder-decoder Models Benefit from Pre-trained Language Representation in Grammatical Error Correction?. Proceedings of the ACL 2020. [Paper] [Code]

  13. Masato Hagiwara, Masato Mita. GitHub Typo Corpus: A Large-Scale Multilingual Dataset of Misspellings and Grammatical Errors. Proceedings of the LREC 2020. [Paper] [Project (code&data)]

  14. Shun Kiyono, Jun Suzuki, Masato Mita, Tomoya Mizumoto, Kentaro Inui. An Empirical Study of Incorporating Pseudo Data to Grammatical Error Correction. Proceedings of EMNLP-IJCNLP 2019. [Paper] [Code]

  15. Hiroki Asano,  Masato Mita, Tomoya Mizumoto, Jun Suzuki. The AIP-Tohoku System at the BEA-2019 Shared Task. ACL Workshop BEA, 2019.  2nd place at the unrestricted track [Paper] [Results]

  16. Masato Mita, Tomoya Mizumoto, Masahiro Kaneko, Ryo Nagata, Kentaro Inui.  Cross-Corpora Evaluation and Analysis of Grammatical Error Correction Models — Is Single-Corpus Evaluation Enough?. Proceedings of the NAACL-HLT 2019. [Paper] [Code]

  17. Tomoya Mizumoto, Masato Mita, Yuji Matsumoto. Grammatical Error Correction Considering Multi-word Expressions. ACL-IJCNLP Workshop TEA, 2015. [Paper]


国際会議・ワークショップ・プレプリント (査読なし)

  1. Masato Mita, Keisuke Sakaguchi, Masato Hagiwara, Tomoya Mizumoto, Jun Suzuki, Kentaro Inui. Towards Automated Document Revision: Grammatical Error Correction, Fluency Edits, and Beyond. arXiv:2205.11484. [Paper] [Data]

  2. Ryo Nagata, Masato Hagiwara, Kazuaki Hanawa, Masato Mita. A Report on FCG GenChal 2022: Shared Task on Feedback Comment Generation for Language Learners. Proceedings of the INLG 2023. [Paper]

  3. Masato Mita, Soichiro Murakami, Akihiko Kato, Peinan Zhang. CAMERA: A Multimodal Dataset and Benchmark for Ad Text Generation. arXiv:2309.12030. [Paper] [Data]

国内会議・ワークショップ(査読なし)

  1. 小林 正宗, 三田 雅人, 小町 守. 文法誤り訂正におけるメタ評価の再考. 第258回自然言語処理研究会 (2023.12) 優秀研究賞 

  2. 栗原 健太郎, 佐々木 翔大, 張 培楠, 石上 亮介, 三田 雅人, 加藤 明彦. 日本語LLMベンチマーク構築に向けて. NLP若手の会第18回シンポジウム (2023.8) 奨励賞

  3. 三田 雅人, 本多 右京, 張 培楠. 英語広告文生成のためのペルソナ型評価基盤の構築に向けて. NLP若手の会第18回シンポジウム (2023.8)

  4. 上田 直生也, 三田 雅人, 小町 守. 文法性評価ベンチマークBLiMPにおけるバイアス除去 NLP若手の会第18回シンポジウム (2023.8)

  5. 三田 雅人, 村上 聡一朗, 張 培楠. 広告文生成タスクの規定とベンチマーク構築. 言語処理学会第29回年次大会 (2023.3) [Paper] [Data] [Slide] 委員特別賞 (論文; 表1の評価セットの件数を869→872に修正, slide)

  6. 加藤 明彦, 大田 和寛, 村上 聡一朗, 三田 雅人, 本多 右京, 張 培楠. 広告データセットに内在する幻覚の分析. 言語処理学会第29回年次大会 (2023.3)

  7. 張 培楠, 坂井 優介, 三田 雅人, 大内 啓樹, 渡辺 太郎. AdGLUE: 広告言語理解ベンチマーク. 言語処理学会第29回年次大会 (2023.3)

  8. 小山 碧海, 喜友名 朝視顕, 三田 雅人, 岡 照晃, 小町 守. 日本語文法誤り訂正評価コーパスへの誤用タグ付け. 第253回自然言語処理研究会 (2022.9)

  9. 五藤 巧, 永田 亮, 三田 雅人. 文法誤り訂正における訂正難易度の判別可能性. 第252回自然言語処理研究会 (2022.6) 若手奨励賞(筆頭著者のみ受賞)

  10. 松本 悠太, 林崎 由, 北山 晃太郎, 舟山 弘晃, 三田 雅人, 乾健太郎. 日本語学習者支援のための敬語変換タスクの提案. 第36回人工知能学会全国大会 (2022.6)

  11. 三田 雅人, 坂口 慶祐, 萩原 正人, 水本 智也, 鈴木 潤, 乾 健太郎. 論述リビジョンのためのメタ評価基盤. 言語処理学会第28回年次大会 (2022.3) 優秀賞

  12. 木山 朔, 上坂 奏人, 佐藤 郁子, 佐藤 京也, 米田 悠人, 小山 碧海, 三田 雅人, 岡 照晃, 小町 守. 日本語文法誤り訂正の流暢性評価に向けたデータ作成. 言語処理学会第28回年次大会 (2022.3) 若手奨励賞(筆頭著者のみ受賞)

  13. 小林 正宗, 高橋 悠進, 三田 雅人, 小町 守. ニューラル文法誤り訂正システムにおけるリランキングの改善に向けたオラクル分析. 言語処理学会第28回年次大会 (2022.3) 

  14. 北山 晃太郎, 松本 悠太, 舟山 弘晃, 松林 優一郎, 三田 雅人, 乾 健太郎. 日本語学習者支援のための敬語誤り訂正タスクの提案. NLP若手の会第16回シンポジウム (2021.8)

  15. 五藤 巧, 永田 亮, 三田 雅人. 文法誤りの訂正難易度の判別における人とシステムの一致調査. NLP若手の会第16回シンポジウム (2021.8)

  16. 三田 雅人, 萩原 正人, 坂口 慶祐, 水本 智也, 鈴木 潤, 乾 健太郎. 論述リライトタスクの提案と自動評価の実現に向けて.  言語処理学会第27回年次大会 ワークショップ「文章の評価と品質推定」 (2021.3)

  17. 三田 雅人, 谷中 瞳. 文法誤り訂正モデルは訂正に必要な文法を学習しているか. 言語処理学会第27回年次大会 (2021.3) 

  18. 三田 雅人, 谷中 瞳. 文法誤り訂正モデルは文法知識を汎化しているか. NLP若手の会第15回シンポジウム (2020.9)

  19. 松本 悠太, 藤井 諒, 阿部 香央莉, 舟山 弘晃, 三田 雅人. 漢字の意味構造を考慮した複数のニューラル漢字創作システムの比較検討. NLP若手の会第15回シンポジウム (2020.9)

  20. 藤井 諒, 三田 雅人, 阿部 香央莉, 塙 一晃, 森下 睦, 鈴木 潤, 乾 健太郎. ユーザ生成コンテンツの高品質な自動翻訳に向けた言語現象の体系的分析. 第34回人工知能学会全国大会 (2020.6)

  21. 舟山 弘晃, 佐々木 翔太, 水本 智也, 三田 雅人, 鈴木潤, 松林優一郎, 乾健太郎. 記述式答案自動採点のための確信度推定手法の検討. 言語処理学会第26回年次大会 (2020.3)

  22. 五藤 巧, 永田 亮, 三田 雅人, 塙 一晃. 訂正難易度を考慮した文法誤り訂正のための性能評価尺度.  言語処理学会第26回年次大会 (2020.3)

  23. 清野 舜, 鈴木 潤, 三田 雅人, 水本 智也, 乾 健太郎. 大規模疑似データを用いた高性能文法誤り訂正モデルの構築. 言語処理学会第26回年次大会 (2020.3) 優秀賞

  24. 三田 雅人, 清野 舜, 金子 正弘, 鈴木 潤, 乾 健太郎. 文法誤り訂正のための自己改良戦略に基づくノイズ除去. 言語処理学会第26回年次大会 (2020.3)  若手奨励賞(筆頭著者のみ受賞)

  25. Masato Mita, Masato Hagiwara, Keisuke Sakaguchi, Tomoya Mizumoto, Jun Suzuki, Kentaro Inui. Automated Essay Rewriting (AER): Grammatical Error Correction, Fluency Edits, and Beyond. 第241回自然言語処理研究会 (2019.8)

  26. 舟山弘晃, 佐々木翔太, 水本智也, 三田雅人,  鈴木潤, 乾健太郎. 自動採点における確信度推定手法. NLP若手の会 第14回シンポジウム (2019.8)

  27. 五藤 巧, 永田 亮, 三田 雅人, 塙 一晃, 水本 智也. 文法誤り訂正における問題の難しさを考慮した性能評価尺度の提案. NLP若手の会第14回シンポジウム (2019.8) 萌芽研究賞

  28. 藤井 諒, 舟山 弘晃,  北山 晃太郎, 阿部 香央莉, Ana brassard, 三田 雅人, 大内 啓樹. seq2seqによる部首を考慮したニューラル漢字生成システム. NLP若手の会 第14回シンポジウム (2019.8)

  29. 金子 正弘, 三田 雅人, 鈴木 潤, 乾 健太郎. コロケーション・イディオム誤りを考慮した文法誤り訂正のための擬似データ生成. NLP若手の会第14回シンポジウム (2019.8)

  30. 藤井 諒, 阿部 香央莉, 塙 一晃, 三田 雅人, 鈴木 潤, 乾 健太郎. 文法誤りに頑健な機械翻訳システムの実現に向けた敵対性ノイズの検討. NLP若手の会第14回シンポジウム (2019.8)

  31. 三田 雅人, 萩原 正人, 坂口 慶祐, 水本 智也, 鈴木 潤, 乾 健太郎. 文法誤り訂正を拡張した新タスクの提案. NLP若手の会 第14回シンポジウム (2019.8). 奨励賞

  32. 三田 雅人, 水本 智也, 金子 正弘, 永田 亮, 乾 健太郎. 文法誤り訂正のコーパス横断評価: 単一コーパス評価で十分か?. 言語処理学会第25回年次大会 (2019.3)

  33. 三田 雅人, 水本 智也, 大内 啓樹, 永田 亮, 乾健太郎. 文法誤り訂正のための教師なし解釈性機構. NLP若手の会第13回シンポジウム (2018.8)

  34. 三田 雅人, 水本 智也, 松本 裕治. 文脈を考慮した前置詞誤り訂正に向けた前置詞とその潜在意味関係の同時解析. 言語処理学会第22回年次大会 (2016.3) 

  35. 三田 雅人, 村上 浩司. 模倣学習を用いた階層的商品分類. 言語処理学会第22回年次大会 (2016.3)

  36. 水本 智也, 三田 雅人. Project Next 英文校正タスク: 前置詞誤りを対象とした誤り分析. 言語処理学会第21回年次大会 (2015.3)

  37. 三田 雅人, 水本 智也. Project Next 英文校正タスクの前置詞誤りエラー分析に向けて. NLP若手の会 第9回シンポジウム (2014.9)


トーク・記事

  • 文法誤り訂正の評価に対する問題提起. 第17回 NLP東京Dの会.(2019.6.)

  • ライティング学習支援のための文法誤り訂正技術の現状と今後の展望. 教育アセスメント×言語処理シンポジウム : 自動採点、英文添削、論述評価の可能性.(2020.12) [Slide]

  • 文法誤り訂正モデルの文法性評価と論述リライトタスクの提案. 第19回 NLP東京Dの会. (2021.3)

  • Do Grammatical Error Correction Models Realize Grammatical Generalization?. 自然言語処理 28巻4号. (2021.12) [URL]

  • トップカンファレンス採択論文数から紐解くGEC研究に強みを持つ組織. GEC Advent Calendar 2021. [URL]

  • GECのLow recall問題に迫る. GEC Advent Calendar 2021. [URL]

  • GECのタスク説明はなぜ難しいのか. GEC Advent Calendar 2021. [URL]

  • Grammarlyのベンチマーキング. GEC Advent Calendar 2021. [URL]

  • ライティング支援のための文法誤り訂正. 株式会社NTTドコモ 招待講演.(2022.2)[Slide]

  • 企業にいながらアカデミアのように働く. CyberAgent Blog.(2022.7)[URL]

  • 日本経済新聞「やっぱり変だよ、日本の教育4」(2022年11月4日)[URL]

  • NLP2023 テーマセッション「ことばの評価と品質推定」. 自然言語処理 30巻2号. (2023.6) [URL]


書籍・コンテンツ

  • 深層学習による自然言語処理の理論と実践. Coloso. [HP]

  • 大規模言語モデルとは何か. 現代化学2023年9月号. [HP]

受賞

  • 2023年12月 優秀研究賞, 情報処理学会第258回自然言語処理研究会 

  • 2023年8月 奨励賞, NLP若手の会 第18回シンポジウム 

  • 2023年3月 委員特別賞, 言語処理学会第29回年次大会

  • 2022年3月 優秀賞, 言語処理学会第28回年次大会

  • 2020年3月 若手奨励賞, 言語処理学会第26回年次大会

  • 2020年3月 優秀賞, 言語処理学会第26回年次大会

  • 2019年8月 奨励賞, NLP若手の会 第14回シンポジウム 

  • 2019年8月 萌芽研究賞, NLP若手の会 第14回シンポジウム 

  • 2014年9月 奨励賞,  NLP若手の会 第9回シンポジウム (ハッカソン オープン部門)

学会活動

  • GenChal 2022: Feedback Comment Generation, オーガナイザ

  • 情報処理学会 自然言語処理研究会(NL研), 運営委員

競争的資金

  • 科研費 基盤B「深層学習による言語生成の評価データセットの構築と品質推定」, 共同研究者(代表者: 小町守)

職歴

  • 2022年6月 - 現在 株式会社サイバーエージェント, リサーチサイエンティスト

  • 2021年10月 - 現在 東京都立大学 自然言語処理研究室 (小町研究室), 特任助教

  • 2019年10月 - 2020年12月 株式会社リクルートホールディングス (Megagon Labs), 契約研究員

  • 2018年2月 - 2022年5月 理化学研究所 革新知能統合研究センター 自然言語理解チーム テクニカルスタッフ

  • 2016年4月 - 2018年1月 日本マイクロソフト株式会社, エンジニア 

  • 2015年10月 - 2015年12月 楽天技術研究所ニューヨーク, リサーチインターン

  • 2014年8月 - 2014年8月 NTTコミュニケーション科学基礎研究所, リサーチインターン

学歴

  • 2021年9月 東北大学 情報科学研究科 システム情報科学専攻 博士後期課程 修了 (指導教員: 乾健太郎教授)

  • 2016年3月 奈良先端科学技術大学院大学 情報科学研究科 情報科学専攻 博士前期課程 修了 (指導教員: 松本裕治教授)

  • 2014年3月 県立広島大学 経営情報学部 経営情報学科 卒業

Contact

Email: mita_masato at cyberagent.co.jp

Google Sites
Report abuse
Page details
Page updated
Google Sites
Report abuse