三田雅人

研究発表

論文誌

小山碧海, 喜友名朝視顕, 小林賢治, 新井美桜, 三田雅人, 岡照晃, 小町守. 日本語文法誤り訂正のための誤用タグ付き評価コーパスの構築. 自然言語処理 30巻2号. (2023.6) [Paper]
Hongfei Wang, Michiki Kurosawa, Satoru Katsumata, Masato Mita, Mamoru Komachi. Chinese Grammatical Error Correction Using Pre-trained Models and Pseudo Data. Transactions on Asian and Low-Resource Language Information Processing (TALIP). [Paper]
山下郁海, 金子正弘, 三田雅人, 勝又智, Aizhan Imankulova, 小町守. 言語間での転移学習のための事前学習モデルと多言語の学習者データを用いた文法誤り訂正. 自然言語処理 29巻2号. (2022.6). [Paper]
藤井諒, 三田雅人, 阿部香央莉, 塙一晃, 森下睦, 鈴木潤, 乾健太郎. 機械翻訳モデルの頑健性評価に向けた言語現象毎データセットの構築と分析. 自然言語処理 28巻2号. (2021.6). [Paper]
三田雅人, 水本智也, 金子正弘, 永田亮, 乾健太郎. 文法誤り訂正モデルの横断評価. 自然言語処理 28巻1号. (2021.3). [Paper]

国際会議・ワークショップ（査読あり）

Zizheng Zhang, Masato Mita, Mamoru Komachi.ClozEx: A Task toward Generation of English Cloze Explanation. Findings of EMNLP 2023. [Paper]
Yusuke Ide, Masato Mita, Adam Nohejl, Hiroki Ouchi, and Taro Watanabe. Japanese Lexical Complexity for Non-Native Readers: a New Dataset. ACL Workshop, BEA 2023. [Paper]
Zizheng Zhang, Masato Mita, Mamoru Komachi. Cloze Quality Estimation for Language Assessment. Findings of EACL 2023. [Paper]
Yujin Takahashi, Masahiro Kaneko, Masato Mita, Mamoru Komachi. Proficiency Matters Quality Estimation in Grammatical Error Correction. Proceedings of the LREC 2022. [Paper]
Daisuke Suzuki, Yujin Takahashi, Ikumi Yamashita, Taichi Aida, Tosho Hirasawa, Michitaka Nakatsuji, Masato Mita, Mamoru Komachi. Construction of a Quality Estimation Dataset for Automatic Evaluation of Japanese Grammatical Error Correction. Proceedings of the LREC 2022. [Paper]
Ryo Nagata, Masato Hagiwara, Kazuaki Hanawa, Masato Mita, Artem Chernodub, Olena Nahorna. Shared Task on Feedback Comment Generation for Language Learners. Proceedings of the INLG 2021. [Paper]
Masato Mita, Hitomi Yanaka. Do Grammatical Error Correction Models Realize Grammatical Generalization?. Findings of the ACL-IJCNLP 2021. [Paper]
Takumi Gotou, Ryo Nagata, Masato Mita, Kazuaki Hanawa. Taking the Correction Difficulty into Account in Grammatical Error Correction Evaluation. Proceedings of the COLING 2020. [Paper]
Ryo Fujii, Masato Mita, Kaori Abe, Kazuaki Hanawa, Makoto Morishita, Jun Suzuki, Kentaro Inui. PheMT: A Phenomenon-wise Dataset for Machine Translation Robustness on User-Generated Contents. Proceedings of the COLING 2020. [Paper]
Masato Mita, Shun Kiyono, Masahiro Kaneko, Jun Suzuki, Kentaro Inui. A Self-Refinement Strategy for Noise Reduction in Grammatical Error Correction. Findings of the EMNLP 2020. [Paper]
Hiroaki Funayama, Shota Sasaki, Yuichiro Matsubayashi, Tomoya Mizumoto, Jun Suzuki, Masato Mita, Kentaro Inui. Preventing Critical Scoring Errors in Short Answer Scoring with Confidence Estimation. Proceedings of the ACL SRW 2020. [Paper]
Masahiro Kaneko, Masato Mita, Shun Kiyono, Jun Suzuki, Kentaro Inui. Can Encoder-decoder Models Benefit from Pre-trained Language Representation in Grammatical Error Correction?. Proceedings of the ACL 2020. [Paper] [Code]
Masato Hagiwara, Masato Mita. GitHub Typo Corpus: A Large-Scale Multilingual Dataset of Misspellings and Grammatical Errors. Proceedings of the LREC 2020. [Paper] [Project (code&data)]
Shun Kiyono, Jun Suzuki, Masato Mita, Tomoya Mizumoto, Kentaro Inui. An Empirical Study of Incorporating Pseudo Data to Grammatical Error Correction. Proceedings of EMNLP-IJCNLP 2019. [Paper] [Code]
Hiroki Asano, Masato Mita, Tomoya Mizumoto, Jun Suzuki. The AIP-Tohoku System at the BEA-2019 Shared Task. ACL Workshop BEA, 2019. 2nd place at the unrestricted track [Paper] [Results]
Masato Mita, Tomoya Mizumoto, Masahiro Kaneko, Ryo Nagata, Kentaro Inui. Cross-Corpora Evaluation and Analysis of Grammatical Error Correction Models — Is Single-Corpus Evaluation Enough?. Proceedings of the NAACL-HLT 2019. [Paper] [Code]
Tomoya Mizumoto, Masato Mita, Yuji Matsumoto. Grammatical Error Correction Considering Multi-word Expressions. ACL-IJCNLP Workshop TEA, 2015. [Paper]

国際会議・ワークショップ・プレプリント (査読なし)

Masato Mita, Keisuke Sakaguchi, Masato Hagiwara, Tomoya Mizumoto, Jun Suzuki, Kentaro Inui. Towards Automated Document Revision: Grammatical Error Correction, Fluency Edits, and Beyond. arXiv:2205.11484. [Paper] [Data]
Ryo Nagata, Masato Hagiwara, Kazuaki Hanawa, Masato Mita. A Report on FCG GenChal 2022: Shared Task on Feedback Comment Generation for Language Learners. Proceedings of the INLG 2023. [Paper]
Masato Mita, Soichiro Murakami, Akihiko Kato, Peinan Zhang. CAMERA: A Multimodal Dataset and Benchmark for Ad Text Generation. arXiv:2309.12030. [Paper] [Data]

国内会議・ワークショップ（査読なし）

小林正宗, 三田雅人, 小町守. 文法誤り訂正におけるメタ評価の再考. 第258回自然言語処理研究会 (2023.12) 優秀研究賞
栗原健太郎, 佐々木翔大, 張培楠, 石上亮介, 三田雅人, 加藤明彦. 日本語LLMベンチマーク構築に向けて. NLP若手の会第18回シンポジウム (2023.8) 奨励賞
三田雅人, 本多右京, 張培楠. 英語広告文生成のためのペルソナ型評価基盤の構築に向けて. NLP若手の会第18回シンポジウム (2023.8)
上田直生也, 三田雅人, 小町守. 文法性評価ベンチマークBLiMPにおけるバイアス除去 NLP若手の会第18回シンポジウム (2023.8)
三田雅人, 村上聡一朗, 張培楠. 広告文生成タスクの規定とベンチマーク構築. 言語処理学会第29回年次大会 (2023.3) [Paper] [Data] [Slide] 委員特別賞（論文; 表1の評価セットの件数を869→872に修正, slide）
加藤明彦, 大田和寛, 村上聡一朗, 三田雅人, 本多右京, 張培楠. 広告データセットに内在する幻覚の分析. 言語処理学会第29回年次大会 (2023.3)
張培楠, 坂井優介, 三田雅人, 大内啓樹, 渡辺太郎. AdGLUE: 広告言語理解ベンチマーク. 言語処理学会第29回年次大会 (2023.3)
小山碧海, 喜友名朝視顕, 三田雅人, 岡照晃, 小町守. 日本語文法誤り訂正評価コーパスへの誤用タグ付け. 第253回自然言語処理研究会 (2022.9)
五藤巧, 永田亮, 三田雅人. 文法誤り訂正における訂正難易度の判別可能性. 第252回自然言語処理研究会 (2022.6) 若手奨励賞（筆頭著者のみ受賞）
松本悠太, 林崎由, 北山晃太郎, 舟山弘晃, 三田雅人, 乾健太郎. 日本語学習者支援のための敬語変換タスクの提案. 第36回人工知能学会全国大会 (2022.6)
三田雅人, 坂口慶祐, 萩原正人, 水本智也, 鈴木潤, 乾健太郎. 論述リビジョンのためのメタ評価基盤. 言語処理学会第28回年次大会 (2022.3) 優秀賞
木山朔, 上坂奏人, 佐藤郁子, 佐藤京也, 米田悠人, 小山碧海, 三田雅人, 岡照晃, 小町守. 日本語文法誤り訂正の流暢性評価に向けたデータ作成. 言語処理学会第28回年次大会 (2022.3) 若手奨励賞（筆頭著者のみ受賞）
小林正宗, 高橋悠進, 三田雅人, 小町守. ニューラル文法誤り訂正システムにおけるリランキングの改善に向けたオラクル分析. 言語処理学会第28回年次大会 (2022.3)
北山晃太郎, 松本悠太, 舟山弘晃, 松林優一郎, 三田雅人, 乾健太郎. 日本語学習者支援のための敬語誤り訂正タスクの提案. NLP若手の会第16回シンポジウム (2021.8)
五藤巧, 永田亮, 三田雅人. 文法誤りの訂正難易度の判別における人とシステムの一致調査. NLP若手の会第16回シンポジウム (2021.8)
三田雅人, 萩原正人, 坂口慶祐, 水本智也, 鈴木潤, 乾健太郎. 論述リライトタスクの提案と自動評価の実現に向けて. 言語処理学会第27回年次大会ワークショップ「文章の評価と品質推定」 (2021.3)
三田雅人, 谷中瞳. 文法誤り訂正モデルは訂正に必要な文法を学習しているか. 言語処理学会第27回年次大会 (2021.3)
三田雅人, 谷中瞳. 文法誤り訂正モデルは文法知識を汎化しているか. NLP若手の会第15回シンポジウム (2020.9)
松本悠太, 藤井諒, 阿部香央莉, 舟山弘晃, 三田雅人. 漢字の意味構造を考慮した複数のニューラル漢字創作システムの比較検討. NLP若手の会第15回シンポジウム (2020.9)
藤井諒, 三田雅人, 阿部香央莉, 塙一晃, 森下睦, 鈴木潤, 乾健太郎. ユーザ生成コンテンツの高品質な自動翻訳に向けた言語現象の体系的分析. 第34回人工知能学会全国大会 (2020.6)
舟山弘晃, 佐々木翔太, 水本智也, 三田雅人, 鈴木潤, 松林優一郎, 乾健太郎. 記述式答案自動採点のための確信度推定手法の検討. 言語処理学会第26回年次大会 (2020.3)
五藤巧, 永田亮, 三田雅人, 塙一晃. 訂正難易度を考慮した文法誤り訂正のための性能評価尺度. 言語処理学会第26回年次大会 (2020.3)
清野舜, 鈴木潤, 三田雅人, 水本智也, 乾健太郎. 大規模疑似データを用いた高性能文法誤り訂正モデルの構築. 言語処理学会第26回年次大会 (2020.3) 優秀賞
三田雅人, 清野舜, 金子正弘, 鈴木潤, 乾健太郎. 文法誤り訂正のための自己改良戦略に基づくノイズ除去. 言語処理学会第26回年次大会 (2020.3) 若手奨励賞（筆頭著者のみ受賞）
Masato Mita, Masato Hagiwara, Keisuke Sakaguchi, Tomoya Mizumoto, Jun Suzuki, Kentaro Inui. Automated Essay Rewriting (AER): Grammatical Error Correction, Fluency Edits, and Beyond. 第241回自然言語処理研究会 (2019.8)
舟山弘晃, 佐々木翔太, 水本智也, 三田雅人, 鈴木潤, 乾健太郎. 自動採点における確信度推定手法. NLP若手の会第14回シンポジウム (2019.8)
五藤巧, 永田亮, 三田雅人, 塙一晃, 水本智也. 文法誤り訂正における問題の難しさを考慮した性能評価尺度の提案. NLP若手の会第14回シンポジウム (2019.8) 萌芽研究賞
藤井諒, 舟山弘晃, 北山晃太郎, 阿部香央莉, Ana brassard, 三田雅人, 大内啓樹. seq2seqによる部首を考慮したニューラル漢字生成システム. NLP若手の会第14回シンポジウム (2019.8)
金子正弘, 三田雅人, 鈴木潤, 乾健太郎. コロケーション・イディオム誤りを考慮した文法誤り訂正のための擬似データ生成. NLP若手の会第14回シンポジウム (2019.8)
藤井諒, 阿部香央莉, 塙一晃, 三田雅人, 鈴木潤, 乾健太郎. 文法誤りに頑健な機械翻訳システムの実現に向けた敵対性ノイズの検討. NLP若手の会第14回シンポジウム (2019.8)
三田雅人, 萩原正人, 坂口慶祐, 水本智也, 鈴木潤, 乾健太郎. 文法誤り訂正を拡張した新タスクの提案. NLP若手の会第14回シンポジウム (2019.8). 奨励賞
三田雅人, 水本智也, 金子正弘, 永田亮, 乾健太郎. 文法誤り訂正のコーパス横断評価: 単一コーパス評価で十分か?. 言語処理学会第25回年次大会 (2019.3)
三田雅人, 水本智也, 大内啓樹, 永田亮, 乾健太郎. 文法誤り訂正のための教師なし解釈性機構. NLP若手の会第13回シンポジウム (2018.8)
三田雅人, 水本智也, 松本裕治. 文脈を考慮した前置詞誤り訂正に向けた前置詞とその潜在意味関係の同時解析. 言語処理学会第22回年次大会 (2016.3)
三田雅人, 村上浩司. 模倣学習を用いた階層的商品分類. 言語処理学会第22回年次大会 (2016.3)
水本智也, 三田雅人. Project Next 英文校正タスク: 前置詞誤りを対象とした誤り分析. 言語処理学会第21回年次大会 (2015.3)
三田雅人, 水本智也. Project Next 英文校正タスクの前置詞誤りエラー分析に向けて. NLP若手の会第9回シンポジウム (2014.9)

トーク・記事

文法誤り訂正の評価に対する問題提起. 第17回 NLP東京Dの会.（2019.6.）
ライティング学習支援のための文法誤り訂正技術の現状と今後の展望. 教育アセスメント×言語処理シンポジウム : 自動採点、英文添削、論述評価の可能性.（2020.12） [Slide]
文法誤り訂正モデルの文法性評価と論述リライトタスクの提案. 第19回 NLP東京Dの会. （2021.3）
Do Grammatical Error Correction Models Realize Grammatical Generalization?. 自然言語処理 28巻4号. (2021.12) [URL]
トップカンファレンス採択論文数から紐解くGEC研究に強みを持つ組織. GEC Advent Calendar 2021. [URL]
GECのLow recall問題に迫る. GEC Advent Calendar 2021. [URL]
GECのタスク説明はなぜ難しいのか. GEC Advent Calendar 2021. [URL]
Grammarlyのベンチマーキング. GEC Advent Calendar 2021. [URL]
ライティング支援のための文法誤り訂正. 株式会社NTTドコモ招待講演.（2022.2）[Slide]
企業にいながらアカデミアのように働く. CyberAgent Blog.（2022.7）[URL]
日本経済新聞「やっぱり変だよ、日本の教育4」（2022年11月4日）[URL]
NLP2023 テーマセッション「ことばの評価と品質推定」. 自然言語処理 30巻2号. (2023.6) [URL]

書籍・コンテンツ

深層学習による自然言語処理の理論と実践. Coloso. [HP]
大規模言語モデルとは何か. 現代化学2023年9月号. [HP]

受賞

2023年12月優秀研究賞, 情報処理学会第258回自然言語処理研究会
2023年8月奨励賞, NLP若手の会第18回シンポジウム
2023年3月委員特別賞, 言語処理学会第29回年次大会
2022年3月優秀賞, 言語処理学会第28回年次大会
2020年3月若手奨励賞, 言語処理学会第26回年次大会
2020年3月優秀賞, 言語処理学会第26回年次大会
2019年8月奨励賞, NLP若手の会第14回シンポジウム
2019年8月萌芽研究賞, NLP若手の会第14回シンポジウム
2014年9月奨励賞, NLP若手の会第9回シンポジウム (ハッカソンオープン部門)

学会活動

GenChal 2022: Feedback Comment Generation, オーガナイザ
情報処理学会自然言語処理研究会（NL研）, 運営委員

競争的資金

科研費基盤B「深層学習による言語生成の評価データセットの構築と品質推定」, 共同研究者（代表者: 小町守）

職歴

2022年6月 - 現在株式会社サイバーエージェント, リサーチサイエンティスト
2021年10月 - 現在東京都立大学自然言語処理研究室 (小町研究室), 特任助教
2019年10月 - 2020年12月株式会社リクルートホールディングス (Megagon Labs), 契約研究員
2018年2月 - 2022年5月理化学研究所革新知能統合研究センター自然言語理解チームテクニカルスタッフ
2016年4月 - 2018年1月日本マイクロソフト株式会社, エンジニア
2015年10月 - 2015年12月楽天技術研究所ニューヨーク, リサーチインターン
2014年8月 - 2014年8月 NTTコミュニケーション科学基礎研究所, リサーチインターン

学歴

2021年9月東北大学情報科学研究科システム情報科学専攻博士後期課程修了 (指導教員: 乾健太郎教授)
2016年3月奈良先端科学技術大学院大学情報科学研究科情報科学専攻博士前期課程修了 (指導教員: 松本裕治教授)
2014年3月県立広島大学経営情報学部経営情報学科卒業

Page updated

Google Sites

Report abuse

三田雅人

研究発表

論文誌

国際会議・ワークショップ（査読あり）

国際会議・ワークショップ・プレプリント (査読なし)

国内会議・ワークショップ（査読なし）

トーク・記事

書籍・コンテンツ

受賞

学会活動

競争的資金

職歴

学歴

Contact