金子 正弘
MBZUAI🇦🇪でTimothy Baldwin教授のもとでポスドクをしてます。東京工業大学の岡崎研究室🇯🇵の特別研究員もしています。他にも、リヴァプール大学🇬🇧のDanushka教授、CMU🇺🇸のGraham准教授や東京大学の松尾研究室🇯🇵と一緒に研究をしています。
最近は主に、AIの安全性に関する研究に取り組んでいます。一緒に研究ができる学生、研究者や企業の方を募集しています!
ニュース
2024.09: EMNLP 2024に共著論文が採択されました @ マイアミ🇺🇸
2024.09: NLP若手の会 (YANS) 第19回シンポジウムにて共著発表4件を行いました。共著発表が奨励賞とサイバーエージェント賞を受賞しました@大阪
2024.05: ECAI 2024に共著論文が採択されました @ サンティアゴ・デ・コンポステーラ🇪🇸
2024.05: ACL 2024に共著論文が採択されました @ バンコク🇹🇭
2023.03: 自然言語処理年次大会にて5件の共著の発表を行いました。3件が若手奨励賞(対象427件中18件)を受賞しました@神戸
2024.02: LREC-COLING 2024に主著論文と共著論文が採択されました @ Torino🇮🇹
2024.01: EACL 2024 Findingsに主著論文と共著論文が採択されました @ マルタ🇲🇹
2023.12: AAAI 2024に共著論文が1件採択されました @バンクーバー🇨🇦
2023.11: 新聞記事デジタルに我々の言語モデルにおける性別的偏見の研究が取り上げられました
2023.10: 日本経済新聞に我々の言語モデル検出の研究が取り上げられました
2023.10: EMNLP 2023に主著論文が1件採択されました @シンガポール🇸🇬
2023.09: IJCNLP-AACL 2023に主著論文が1件採択されました @バリ🇮🇩
2023.08: NLP若手の会 (YANS) 第18回シンポジウムにて招待発表1件と共著発表1件を行いました。共著発表がPKSHA Technology賞と博報堂テクノロジーズ賞を受賞しました@浅草橋
2023.07: MBZUAIのTimothy Baldwin グループでポスドクとして働き始めました@アブダビ🇦🇪
2023.05: BEA 2023に共著論文が1件採択されました @トロント🇨🇦
2023.03: 自然言語処理年次大会にて1件の主著と2件の共著の発表を行いました。主著論文が委員特別賞を受賞しました@沖縄
2023.01: EACL 2023 に主著論文が採択されました@ドゥブロヴニク🇭🇷
2022.10: EMNLP 2022 のFindingsに主著論文が採択されました @アブダビ🇦🇪
2022.09:カーネギー・メロン大学 NeuLab(共同研究者:Graham Neubig准教授)で客員研究員として研究をします.@ピッツバーグ🇺🇸
2022.08: 自然言語処理のメジャー会議であるCOLING 2022に主著と共著論文が採択されました @慶州🇰🇷
2022.06: IEEE Accessに共著論文が採択されました
2022.05: NAACL SRW 2022 に共著論文が採択されました @シアトル🇺🇸
2022.04: 自然言語処理のトップ会議であるNAACL 2022に主著論文が採択されました @シアトル🇺🇸
2022.04: LREC 2022 に共著論文が採択されました@マルセイユ🇫🇷
2022.03: 共著論文が言語処理学会年次大会で優秀賞に選ばれました@オンライン
2022.02: 自然言語処理のトップ会議であるACL 2022 に2件の論文(主著と共著)が採択されました@ダブリン、アイルランド
過去のニュース
2021.12: 人工知能のトップ会議である AAAI-22 に1件の主著論文が採択されました!@オンライン
2021.11: 名古屋地区NLPセミナーで発表を行いました!@オンライン
2021.04: NAACL 2021 SRWに2件の共著論文が採択されました!@オンライン
2021.04: EACL2021で2件の主著論文が採択されました!@オンライン
2021.04: 東京工業大学 岡崎研究室 の博士研究員になりました!
2020.12: COLING2020 で口頭発表を行いました.@オンライン
2020.07: 東京工業大学 岡崎研究室 にて研究紹介を行いました.@オンライン
2020.07: ACL2020で発表を行いました.@オンライン
2020.03: ANLP2020に参加しました.@オンライン
2019.11 - 2019.12: 東北大学 乾・鈴木研究室に滞在し研究を行いました.@仙台
2019.11: EMNLP-IJCNLP2019 に参加しました.@ 香港,中国
2019.08 - 2019.09: 東北大学 乾・鈴木研究室に滞在し研究を行いました.@仙台
2019.08: NLP 若手の会第14回シンポジウムでポスター発表を行いました.@札幌
2019.08: BEA2019とGeBNLP2019にてポスター発表を行いました.@フィレンツェ,イタリア
2019.07: ACL2019にて口頭発表を行いました.@フィレンツェ,イタリア
2019.04: CICLing2019にてポスター発表を行いました.@ラ・ロシェル,フランス
2019.03: ANLP2019にてポスター発表を行いました.@名古屋
2018.10 - 2019.02: リヴァプール大学ボレガラ・ダヌシカ研究室で客員研究員として研究を行いました.@リヴァプール, イギリス
2018.08 - 現在: 理研AIPの自然言語理解チームでリサーチ・アシスタントとして研究を行っています.@日本橋
職歴・研究活動
2023.07 - 現在:ポスドク@Timothy Baldwin グループ,MBZUAI,アブダビ🇦🇪
2023.07 - 現在:特別研究員@岡崎研究室,東京工業大学,目黒🇯🇵
2022.12 - 現在:共同研究者 @ NeuLab (共同研究者:Graham Neubig准教授) ,カーネギー・メロン大学, ピッツバーグ🇺🇸
2019.03 - 現在:共同研究者@リヴァプールNLPグループ, リヴァプール大学, リヴァプール🇬🇧
2021.04 - 2023.05:博士研究員@岡崎研究室,東京工業大学,目黒🇯🇵
2021.04 - 2023.03:客員研究員@小町研究室,東京都立大学,日野🇯🇵
2022.09 - 2022.11:客員研究員 @ NeuLab (共同研究者:Graham Neubig准教授) ,カーネギー・メロン大学, ピッツバーグ🇺🇸
2019.11 - 2019.12:研究滞在@乾・鈴木研究室,東北大学,仙台🇯🇵
2019.08 - 2019.09:研究滞在@乾・鈴木研究室,東北大学,仙台🇯🇵
2018.10 - 2019.02:客員研究員@リヴァプールNLPグループ(指導者:ボレガラ・ダヌシカ教授), リヴァプール大学, リヴァプール🇬🇧
2018.08 - 2021.03:リサーチ・アシスタント@理研AIP, 自然言語理解チーム (チームリーダー:乾 健太郎教授), 日本橋🇯🇵
2018.07:Deep Learning Camp に選ばれ (24/562) 1ヶ月間研究を行いました。@チェジュ島🇰🇷
2017.06 - 2017.12:パートタイマー(自然言語処理エンジニア)@Best Teacher, Inc., 渋谷🇯🇵
2016.10 - 2018.03:トヨタ株式会社との共同研究、東京🇯🇵
2016.08 - 2016.09:リサーチ・インターンシップ@トヨタIT開発センター, 赤坂🇯🇵
業績
論文誌
2023
Mengsay Loem,高瀬翔,金子正弘,岡崎直観.ExtraPhrase:生成型要約のための効率的データ拡張.自然言語処理、30巻2号。 [論文]
2022
Tosho Hirasawa, Masahiro Kaneko, Aizhan Imankulova, Mamoru Komachi. Pre-trained Word Embedding and Language Model Improve Multimodal Machine Translation: A Case Study in Multi30K. IEEE Access, 2022. [論文]
山下郁海,金子正弘,三田雅人,勝又智,Imankulova Aizhan,小町守.言語間での転移学習のための事前学習モデルと多言語の学習者データを用いた文法誤り訂正.自然言語処理,29巻2号.2022年6月.[論文]
2021
甫立健悟,金子正弘,勝又智,小町守.文法誤り訂正における訂正度を考慮した多様な訂正文の生成.自然言語処理.28巻2号.2021年6月. [論文]
吉村綾馬,金子正弘,梶原智之,小町守.文法誤り訂正の参照文を用いない自動評価の人手評価への最適化.自然言語処理.28巻2号.2021年6月. [論文]
三田雅人,水本智也,金子正弘,永田亮,乾健太郎.文法誤り訂正モデルの横断評価.自然言語処理.28巻1号.pp.160-182.2021年3月. [論文]
2020
新井美桜,金子正弘,小町守.日本語学習者向けの文法誤り検出機能付き作文用例検索システム.人工知能学会論文誌, 35巻5号. 2020年9月. [論文]
2019
Masahiro Kaneko and Mamoru Komachi. Multi-Head Multi-Layer Attention to Deep Language Representations for Grammatical Error Detection. Computacion y Sistemas. Vol. 23, No. 3, pp. 883-891. 2019. [paper]
2018
金子正弘,堺澤勇也,小町守.正誤情報と文法誤りパターンを考慮した単語分散表現を用いた文法誤り検出. 自然言語処理,25巻4号, pp.421-439. 2018年9月. [論文]
国際会議、ワークショップ、arXiv
2024
Ryuto Koike, Masahiro Kaneko, Naoaki Okazaki. How You Prompt Matters! Even Task-Oriented Constraints in Instructions Affect LLM-Generated Text Detection. The 2024 Conference on Empirical Methods in Natural Language Processing (Findings: EMNLP). [arXiv]
Rem Hida, Masahiro Kaneko, Naoaki Okazaki. Social Bias Evaluation for Large Language Models Requires Prompt Variations. arXiv. [arXiv]
Mengsay Loem, Masahiro Kaneko, Naoaki Okazaki. SAIE Framework: Support Alone Isn't Enough - Advancing LLM Training with Adversarial Remarks. The 27th European Conference on Artificial Intelligence (ECAI). [arXiv] [paper]
Masanari Ohi, Masahiro Kaneko, Ryuto Koike, Mengsay Loem, Naoaki Okazaki. Likelihood-based Mitigation of Evaluation Bias in Large Language Models. The 62nd Annual Meeting of the Association for Computational Linguistics (Findings: ACL). [arXiv]
Masahiro Kaneko, Youmi Ma, Yuki Wata, Naoaki Okazaki. Sampling-based Pseudo-Likelihood for Membership Inference Attacks. arXiv. [arXiv] [Code]
Masahiro Kaneko, Timothy Baldwin. A Little Leak Will Sink a Great Ship: Survey of Transparency for Large Language Models from Start to Finish. arXiv. [arXiv]
Masahiro Kaneko, Danushka Bollegala, Timothy Baldwin. Eagle 🦅: Ethical Dataset Given from Real Interactions. arXiv. [arXiv] [data]
Masahiro Kaneko, Naoaki Okazaki. Controlled Generation with Prompt Insertion for Natural Language Explanations in Grammatical Error Correction. The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024). (Short paper). [arXiv] [paper] [data]
Panatchakorn Anantaprayoon, Masahiro Kaneko, Naoaki Okazaki. Evaluating Gender Bias of Pre-trained Language Models in Natural Language Inference by Considering All Labels. The 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024). (Long paper). [arXiv] [data]
Masahiro Kaneko, Danushka Bollegala, Naoaki Okazaki, Timothy Baldwin. Evaluating Gender Bias in Large Language Models via Chain-of-Thought Prompting. arXiv. [arXiv]
Masahiro Kaneko, Graham Neubig, Naoaki Okazaki. Solving NLP Problems through Human-System Collaboration: A Discussion-based Approach. The 18th Conference of the European Chapter of the Association for Computational Linguistics (Findings: EACL). (Long paper). [arXiv] [data]
Daisuke Oba, Masahiro Kaneko, Danushka Bollegala. In-Contextual Bias Suppression for Large Language Models. The 18th Conference of the European Chapter of the Association for Computational Linguistics (Findings: EACL). (Long paper). [arXiv]
Masahiro Kaneko, Danushka Bollegala, Timothy Baldwin. The Gaps between Pre-train and Downstream Settings in Bias Evaluation and Debiasing. arXiv. [arXiv]
Ryuto Koike, Masahiro Kaneko, Naoaki Okazaki. OUTFOX: LLM-generated Essay Detection through In-context Learning with Adversarially Generated Examples. Proceedings of the 38th AAAI Conference on Artificial Intelligence (AAAI). (Acceptance rate: 21.3%). [arXiv]
2023
Ryuto Koike, Masahiro Kaneko, Naoaki Okazaki. How You Prompt Matters! Even Task-Oriented Constraints in Instructions Affect LLM-Generated Text Detection. arXiv. [arXiv]
Masahiro Kaneko, Naoaki Okazaki. Reducing Sequence Length by Predicting Edit Operations with Large Language Models. The 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP). (Long paper、採択率:23.3%) [arXiv] [paper]
Masahiro Kaneko, Danushka Bollegala, Naoaki Okazaki. The Impact of Debiasing on the Performance of Language Models in Downstream Tasks is Underestimated. The 13th International Joint Conference on Natural Language Processing and the 3rd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics (IJCNLP-AACL). (Short paper、採択率:19.1%). [arXiv] [slide]
Mengsay Loem, Masahiro Kaneko, Sho Takase, Naoaki Okazaki. Exploring Effectiveness of GPT-3 in Grammatical Error Correction: A Study on Performance and Controllability in Prompt-Based Methods. In Proceedings of the 18th Workshop on Innovative Use of NLP for Building Educational Applications (BEA). (Long paper) [arXiv] [paper]
Masahiro Kaneko, Danushka Bollegala, Naoaki Okazaki. Comparing Intrinsic Gender Bias Evaluation Measures without using Human Annotated Examples. The 17th Conference of the European Chapter of the Association for Computational Linguistics (EACL). (Short paper). [arXiv] [論文]
2022
Masahiro Kaneko, Danushka Bollegala, Naoaki Okazaki. Gender Bias in Meta-Embeddings. Findings of the Association for Computational Linguistics: The 2022 Conference on Empirical Methods in Natural Language Processing (Findings: EMNLP ). [arXiv]
Hiroyuki Deguchi, Kenji Imamura, Masahiro Kaneko, Yuto Nishida, Yusuke Sakai, Justin Vasselli, Huy Hien Vu, Taro Watanabe. NAIST-NICT-TIT WMT22 General MT Task Submission. Proceedings of the Seventh Conference on Machine Translation (WMT). [Paper]
Masahiro Kaneko, Danushka Bollegala, Naoaki Okazaki. Debiasing isn't enough! - On the Effectiveness of Debiasing MLMs and their Social Biases in Downstream Tasks. The 29th International Conference on Computational Linguistics (COLING). (Long paper、採択率:33.4%) [arXiv] [論文]
Koki Maeda, Masahiro Kaneko, Naoaki Okazaki. IMPARA: Impact-based Metric for GEC using Parallel Data. The 29th International Conference on Computational Linguistics (COLING). (Long paper、採択率:33.4%) [論文]
Masahiro Kaneko, Aizhan Imankulova, Danushka Bollegala, Naoaki Okazaki. Gender Bias in Masked Language Models for Multiple Languages. In Proceedings of the 2022 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL). (Long paper,採択率:26%) [arXiv] [paper] [code]
Mengsay Loem, Sho Takase, Masahiro Kaneko, Naoaki Okazaki. ExtraPhrase: Efficient Data Augmentation for Abstractive Summarization. In Proceedings of the 2022 Annual Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop (NAACL SRW). [arXiv]
Yujin Takahashi, Masahiro Kaneko, Masato Mita, Mamoru Komachi. Proficiency Matters Quality Estimation in Grammatical Error Correction. Proceedings of the 13th Language Resources and Evaluation Conference (LREC). [arXiv]
Masahiro Kaneko, Sho Takase, Ayana Niwa, Naoaki Okazaki. Interpretability for Language Learners Using Example-Based Grammatical Error Correction. In Proceedings of the 60th Annual Conference of the Association for Computational Linguistics (ACL). (Long paper,採択率:20.75%) [arXiv] [paper] [code] [ブログ]
Yi Zhou, Masahiro Kaneko, Danushka Bollegala. Sense Embeddings are also Biased -- Evaluating Social Biases in Static and Contextualised Sense Embeddings. In Proceedings of the 60th Annual Conference of the Association for Computational Linguistics (ACL). (Long paper,採択率:20.75%) [arXiv] [paper] [code]
Masahiro Kaneko and Danushka Bollegala. Unmasking the Mask -- Evaluating Social Biases in Masked Language Models. Proceedings of the 36th AAAI Conference on Artificial Intelligence (AAAI). (採択率:15%) [arXiv] [論文] [code] [ブログ]
2021
Raj Dabre, Aizhan Imankulova, Masahiro Kaneko. Studying The Impact Of Document-level Context On Simultaneous Neural Machine Translation. Proceedings of the 18th Biennial Machine Translation Summit (MT Summit). [paper]
Aomi Koyama, Kengo Hotate, Masahiro Kaneko and Mamoru Komachi. Comparison of Grammatical Error Correction Using Back-Translation Models. 2021 Annual Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop (NAACL SRW) (採択率:44%) [arXiv] [paper]
Seiichiro Kondo, Kengo Hotate, Tosho Hirasawa, Masahiro Kaneko and Mamoru Komachi. Sentence Concatenation Approach to Data Augmentation for Neural Machine Translation. 2021 Annual Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop (NAACL SRW) (採択率:44%) [paper]
Masahiro Kaneko and Danushka Bollegala. Debiasing Pre-trained Contextualised Embeddings. The 16th Conference of the European Chapter of the Association for Computational Linguistics (EACL). (Long paper,採択率:27%) [arXiv] [paper] [code] [poster]
Masahiro Kaneko and Danushka Bollegala. Dictionary-based Debiasing of Pre-trained Word Embeddings. The 16th Conference of the European Chapter of the Association for Computational Linguistics (EACL). (Long paper,採択率:27%) [arXiv] [paper] [code] [poster]
2020
Masahiro Kaneko and Danushka Bollegala. Autoencoding Improves Pre-trained Word Embeddings. The 28th International Conference on Computational Linguistics (COLING). (Short paper, 採択率: 26.2%) [arXiv] [paper] [slide]
Ikumi Yamashita, Satoru Katsumata, Masahiro Kaneko, Aizhan Imankulova and Mamoru Komachi. Cross-lingual Transfer Learning for Grammatical Error Correction. The 28th International Conference on Computational Linguistics (COLING). (Long paper, 採択率: 35.3%) [paper]
Kengo Hotate, Masahiro Kaneko and Mamoru Komachi. Generating Diverse Corrections with Local Beam Search for Grammatical Error Correction. The 28th International Conference on Computational Linguistics (COLING). (Short paper, 採択率: 26.2%) [paper]
Ryoma Yoshimura, Masahiro Kaneko, Tomoyuki Kajiwara and Mamoru Komachi. SOME: Reference-less Sub-Metrics Optimized for Manual Evaluations of Grammatical Error Correction. The 28th International Conference on Computational Linguistics (COLING). (Short paper, 採択率: 26.2%) [paper] [code]
Aizhan Imankulova, Masahiro Kaneko, Tosho Hirasawa and Mamoru Komachi. Towards Multimodal Simultaneous Neural Machine Translation. The Fifth Conference in Machine Translation (WMT, 採択率: 32.7%). [arXiv] [paper] [code]
Masato Mita, Shun Kiyono, Masahiro Kaneko, Jun Suzuki and Kentaro Inui. A Self-Refinement Strategy for Noise Reduction in Grammatical Error Correction. Findings of the Association for Computational Linguistics: The 2020 Conference on Empirical Methods in Natural Language Processing (Findings: EMNLP). [paper]
Zizheng Zhang, Tosho Hirasawa, Wei Houjing, Masahiro Kaneko and Mamoru Komachi. Translation of New Named Entities from English to Chinese. In Proceedings of the 7th Workshop on Asian Translation (WAT). [paper]
Masahiro Kaneko, Masato Mita, Shun Kiyono, Jun Suzuki and Kentaro Inui. Encoder-Decoder Models Can Benefit from Pre-trained Masked Language Models in Grammatical Error Correction. In Proceedings of the 58th Annual Conference of the Association for Computational Linguistics (ACL). (Short paper, 採択率: 17.6%) [arXiv] [paper] [slide] [code]
2019
Masahiro Kaneko and Danushka Bollegala. Gender-preserving Debiasing for Pre-trained Word Embeddings. In Proceedings of the 57th Annual Conference of the Association for Computational Linguistics (ACL). (Long paper, 採択率: 25.7%) [arXiv] [paper] [bib] [code]
Kengo Hotate, Masahiro Kaneko, Satoru Katsumata and Mamoru Komachi. Controlling Grammatical Error Correction Using Word Edit Rate. In Proceedings of the 57th Annual Conference of the Association for Computational Linguistics: Student Research Workshop (ACL SRW). (採択率: 33.2%) [paper] [bib]
Mio Arai, Masahiro Kaneko and Mamoru Komachi. Grammatical-Error-Aware Incorrect Example Retrieval System for Learners of Japanese as a Second Language. In Proceedings of the 14th Workshop on Innovative Use of NLP for Building Educational Applications (BEA). [paper]
Masahiro Kaneko and Mamoru Komachi. Multi-Head Multi-Layer Attention to Deep Language Representations for Grammatical Error Detection. In 20th International Conference on Computational Linguistics and Intelligent Text Processing (CICLing). [arXiv] [poster]
Masato Mita, Tomoya Mizumoto, Masahiro Kaneko, Ryo Nagata and Kentaro Inui. Cross-Corpora Evaluation and Analysis of Grammatical Error Correction Models — Is Single-Corpus Evaluation Enough? In 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL). (Short paper, 採択率: 21.3%) [paper]
2017
国際会議、ワークショップ、その他(査読なし)
2022
Mengsay Loem, Sho Takase, Masahiro Kaneko, Naoaki Okazaki. Are Neighbors Enough? Multi-Head Neural n-gram can be Alternative to Self-attention. arXiv. [arXiv]
Masahiro Kaneko, Danushka Bollegala, Naoaki Okazaki. Gender Bias in Meta-Embeddings. arXiv. [arXiv]
2021
Raj Dabre, Aizhan Imankulova, Masahiro Kaneko and Abhisek Chakrabarty. Simultaneous Multi-Pivot Neural Machine Translation. arXiv. [arXiv]
2020
Hiroto Tamura, Tosho Hirasawa, Masahiro Kaneko and Mamoru Komachi. TMU Japanese-English Multimodal Machine Translation System for WAT 2020. In Proceedings of the 7th Workshop on Asian Translation (WAT): Japanese-English Multimodal Machine Translation track.
Masahiro Kaneko, Aizhan Imankulova, Tosho Hirasawa and Mamoru Komachi. English-to-Japanese Diverse Translation by Combining Forward and Backward Outputs. The 4th Workshop on Neural Generation and Translation (WNGT): Simultaneous Translation And Paraphrase for Language Education (STAPLE) English-to-Japanese track [paper] [bib]
2019
Aizhan Imankulova, Masahiro Kaneko and Mamoru Komachi. Japanese-Russian TMU Neural Machine Translation System using Multilingual Model for WAT 2019. The 6th Workshop on Asian Translation (WAT): News Commentary task.
Masahiro Kaneko, Kengo Hotate, Satoru Katsumata and Mamoru Komachi. TMU Transformer System Using BERT for Re-ranking at BEA 2019 Grammatical Error Correction on Restricted Track. In Proceedings of the 14th Workshop on Innovative Use of NLP for Building Educational Applications (BEA): Shared Task on Grammatical Error Correction. [paper] [poster] [bib]
2018
全国大会・研究会・シンポジウム等(査読なし)
2024
齋藤 幸史郎, 小池 隆斗, 金子 正弘, 岡崎 直観. 強化学習を用いた、言語理解能力を維持したLLM検出器の性能向上. 第19回YANSシンポジウム. 2024年9月. 奨励賞、サイバーエージェント賞🎉
塩谷 泰平, 金子 正弘, 岡崎 直観. 大規模言語モデルによる日本文化に沿った指示データ生成. 第19回YANSシンポジウム. 2024年9月.
大井 聖也, 金子 正弘, 岡崎 直観, 井上 中順. マルチモーダルモデル自動評価のための複数タスク・複数基準評価データセット. 第19回YANSシンポジウム. 2024年9月.
高橋 侑成, Ma Youmi, 金子 正弘, 岡崎 直観. 大規模言語モデルに対する漏洩検出への敵対的なデータ隠蔽. 第19回YANSシンポジウム. 2024年9月.
小池隆斗、金子正弘、岡崎直観.制約が異なる指示で生成された文章に対するLLM生成検出の頑健性.言語処理学会第30回年次大会.
Mengsay Loem、金子正弘、岡崎直観.敵対的発言を取り入れた議論による言語モデルの学習強化と推論力の向上.言語処理学会第30回年次大会.若手奨励賞🎉
大井聖也、金子正弘、小池隆斗、Mengsay Loem、岡崎直観.大規模言語モデルにおける評価バイアスの尤度に基づく緩和.言語処理学会第30回年次大会.若手奨励賞🎉
綿祐貴、金子正弘、Youmi Ma、岡崎直観.大規模言語モデルに対するサンプリングを活用したメンバーシップ推論攻撃.言語処理学会第30回年次大会.若手奨励賞🎉
大葉大輔、金子正弘、Danushka Bollegala.文脈内学習に基づく大規模言語モデルの性別バイアス抑制.言語処理学会第30回年次大会.
2023
小池隆斗、金子正弘、岡崎直観.敵対的事例を用いたIn-context learningによるLLM生成エッセイの検出.NLP 若手の会第18回シンポジウム.2023年8月30日.PKSHA Technology賞、博報堂テクノロジーズ賞🎉
金子正弘,Graham Neubig,岡崎直観.人間とシステムの議論に基づく NLP タスクの問題に対する予測.言語処理学会第29回年次大会.委員特別賞🎉
Mengsay Loem,高瀬翔,金子正弘,岡崎直観.マルチヘッドニューラル N-gram による自己注意機構の代替.言語処理学会第29回年次大会.
Panatchakorn Anantaprayoon,金子正弘,岡崎直観.下流タスクでの日本語事前学習モデルの性別バイアスの評価.言語処理学会第29回年次大会.
2022
Mengsay Loem,高瀬翔,金子正弘,岡崎直観.Are Neighbors Enough? Multi-Head Neural n-gram can be Alternative to Self-attention. NLP 若手の会第17回シンポジウム.2022年8月30日.
前田航希,金子正弘,岡崎直観.IMPARA: パラレルデータにおける修正の影響度に基づいた 文法誤り訂正の自動評価法.言語処理学会第28回年次大会.優秀賞🎉
Loem Mengsay,高瀬翔,金子正弘,岡崎直観.抽出型要約と言い換えによる生成型要約の訓練データ拡張.言語処理学会第28回年次大会.
2021
蘆田真奈,金子正弘,平澤寅庄,小町守.QAタスクにおけるGPTの性差別的バイアスの評価及びプロンプトを用いたバイアス除去手法の検討.NLP 若手の会第16回シンポジウム.2021年8月31日.
小山碧海,金子正弘,小町守.学習者データに対する擬似誤り生成を用いた文法誤り訂正モデルの分析.NLP 若手の会第16回シンポジウム.2021年8月30日.
高橋悠進,金子正弘,小町守.文法誤り訂正における品質推定モデルに対する習熟度の影響の分析.言語処理学会第27回年次大会ワークショップ:ワークショップ 文章の評価と品質推定.2021年3月19日
喜友名朝視顕,吉村綾馬,金子正弘,小町守.マルチタスク学習を用いた系列変換タスクの品質推定.言語処理学会第27回年次大会. 2021年3月18日
蘆田 真奈,平澤 寅庄,金子 正弘,小町 守.日本語BERTによる否定要素認識についての分析.言語処理学会第27回年次大会.2021年3月17日
小山碧海,甫立健悟,金子正弘,小町守.文法誤り訂正における複数の逆翻訳モデルを利用した訂正傾向の比較.言語処理学会第27回年次大会.2021年3月17日
今藤誠一郎,甫立健悟,平澤寅庄,金子正弘,小町守.2文の連結を用いた機械翻訳におけるデータ拡張.言語処理学会第27回年次大会.2021年3月16日
2020
喜友名朝視顕, 吉村綾馬, 金子正弘, 小町守.項目別マルチタスク学習による系列変換タスクの品質推定.NLP 若手の会第15回シンポジウム.2020年9月23日.
今藤誠一郎, 甫立健悟, 平澤寅庄, 金子正弘, 小町守.機械翻訳における非自己回帰モデルの複数言語の出力分析.NLP 若手の会第15回シンポジウム.2020年9月23日.
小山碧海, 甫立健悟, 金子正弘, 小町守.文法誤り訂正における複数の擬似誤り生成モデルの比較.NLP 若手の会第15回シンポジウム.2020年9月23日.
山下郁海, 勝又智, 金子正弘, Imankulova Aizhan, 小町守.言語間での転移学習を用いたロシア語文法誤り訂正.言語処理学会第26回年次大会, pp.1324-1327. March 19, 2020
三田雅人, 清野舜, 金子正弘, 鈴木潤, 乾健太郎.文法誤り訂正のための自己改良戦略に基づくノイズ除去.言語処理学会第26回年次大会, pp.993-996. March 19, 2020 若手奨励賞
2019
Imankulova Aizhan, 金子正弘, 平澤寅庄, 小町守.画像を使用したマルチモーダルニューラル同時翻訳.NLP 若手の会第13回シンポジウム. August 27, 2019.
金子正弘, 三田雅人, 鈴木潤 , 乾健太郎.コロケーション・イディオム誤りを考慮した文法誤り訂正のための擬似データ生成.NLP 若手の会第13回シンポジウム. August 27, 2019.
甫立健悟, 金子正弘, 小町守.Autoencoder を用いた頑健な文の分散表現生成の検討. NLP 若手の会第13回シンポジウム.August 27, 2019.
山下郁海, 勝又智, 金子正弘, Imankulova Aizhan, 小町守.英語からロシア語への転移学習を用いた文法誤り訂正.NLP 若手の会第13回シンポジウム. August 27, 2019.
三田雅人, 水本智也, 金子正弘, 永田亮, 乾健太郎.文法誤り訂正のコーパス横断評価: 単一コーパス評価で十分か?言語処理学会第25回年次大会, pp.978-981. March 15, 2019.
新井美桜, 金子正弘, 小町守.日本語学習者向けの文法誤り検出機能付き誤用例文検索システム.言語処理学会第25回年次大会, pp.1097-1100. March 15, 2019.
甫立健悟, 金子正弘, 勝又智, 小町守.文法誤り訂正における単語編集率を用いた訂正度の制御.言語処理学会第25回年次大会, pp.635-638. March 14, 2019.
金子正弘, 小町守.深層言語表現モデルに対するマルチヘッド・多層アテンションによる英語文法誤り検出.言語処理学会第25回年次大会, pp.446-449. March 14, 2019. [論文] [ポスター]
2018
2017
記事
新聞記事:ChatGPTのバイアスなぜ生まれる そもそも学習する環境に?朝日新聞デジタル記事。2023年11月9日 [記事]
新聞記事:AI製の偽情報。日本経済新聞記事。2023年10月23日 [記事]
学会記事:事前学習済みマスク言語モデルを組み合わせた符号化復号化文法誤り訂正モデル.自然言語処理.27巻3号.2020年9月.
トーク
言語モデルの公平性.NLP 若手の会第18回シンポジウム.2023年8月30日.
事前学習された分散表現における公平性.名古屋地区NLPセミナー@オンライン.2021年11月26日 [スライド]
文法誤り検出・訂正と差別的バイアスについて@東工大岡崎研. 7月14日, 2020.
Gender-preserving Debiasing for Pre-trained Word Embeddings. Academia Meets Amazon. 10月02日, 2019.
Gender-preserving Debiasing for Pre-trained Word Embeddings. GeBNLP2019. Aug 2, 2019.
リヴァプール大学での研究について . 第17回 NLP東京Dの会. June 29, 2019.
修士での研究とBEAでの取り組みについて. 第14回 NLP東京Dの会. June 24, 2018.
Document-level re-ranking for NMT.TFCON2018. Jeju, Korea. July 2018.
正誤情報と文法誤りパターンを考慮した単語分散表現を用いた英文法誤り検出. 第9回入力メソッドワークショップ (IM 2017). December 29, 2017.
学歴
2018.04 - 2021.03: 博士(情報科学)東京都立大学システムデザイン研究科情報科学域
2016.04 - 2018.03: 修士(情報科学)首都大学東京(現東京都立大学)システムデザイン研究科情報科学域
2012.04 - 2016.03: 学士(工学)北見工業大学工学部情報システム工学科
奨学金
2021.04 - 2024.03: 日本学術振興会特別研究員-PD (8/35, 面接免除採用, 辞退)
2019.04 - 2021.03: 日本学術振興会特別研究員-DC2 (107/624, 面接免除採用)
2018: 首都大学東京派遣留学生経済支援
受賞
2023.08: PKSHA Technology賞と博報堂テクノロジーズ賞、NLP若手の会 (YANS) 第18回シンポジウム@浅草橋
2023.03: 委員特別賞 (26/579)、言語処理学会第29回年次大会@那覇
2022.03: 優秀賞 (9/386)、言語処理学会第28回年次大会@オンライン
2021.08: 研究会推薦博士論文速報:Grammatical and Semantic Biases in Representation Learning from Raw Datasets. 情報処理学 会誌62巻9号.
2017.03: 若手奨励賞 (4/301), 言語処理学会第23回年次大会@つくば
2017.01: テクノロジー 賞&オーディエンス賞, 第1回 PwC ハッカソン@川崎
査読
Area Chair
2024: *SEM, EMNLP, COLING
2023: EMNLP
Peer
2024: ECAI, 自然言語処理, NAACL, ACL, AAAI, KDD
2023: ACL, BEA, 自然言語処理, AAAI
2022: AAAI, ARR, COLING, EMNLP
2021: NAACL, ACL, EMNLP, ARR
2020: ACL, EMNLP
2019: PACLIC
Secondary
2020: ACL, CIKM, EMNLP
2019: NAACL, *SEM, ACL, ACL demo, BEA
2018: NAACL, ACL demo, EMNLP demo
2017: NLPTEA
学会活動
2021.03 - 2023.03: 言語処理学会論文誌,編集委員
2018 - 2020: NLP若手の会 (YANS),実行委員
2018 - 2020: NLP東京Dの会,幹事