東京都立大学
自然言語処理研究室
東京都立大学システムデザイン学部情報科学科 (東京都立大学大学院システムデザイン研究科情報科学域)人工知能・自然言語処理分野、自然言語処理研究室(小町研)のウェブサイトです。小町研では、多言語コミュニケーションを支援するために、コンピュータを用いて人間のことばを理解・解析する手法の研究をしています。西東京に自然言語処理の研究開発拠点を作ることを目指しています。
小町は2023年4月に一橋大学に新設されるソーシャル・データサイエンス学部・研究科に転出しました。都立大では新規の学生の募集を停止しています。一橋大学で大学院(修士課程)の指導を希望する人は小町までお問い合わせください。※博士課程は2025年4月入学の学生から受け入れ予定です。一橋大学の研究室サイトは暫定的にこちら。
キーワード: 自然言語処理 (機械翻訳、言語学習支援、基盤技術)、機械学習(深層学習、単語分散表現)
ニュース
2024/06/21 自然言語処理のメジャー国際会議 NAACL の併設ワークショップ BEA 2024 で以下の論文を発表しました。MLSP (multilingual lexical simplification pipeline) という多言語テキスト平易化の共通タスクではほぼ全ての言語で1位の性能を達成しました。
Masamune Kobayashi, Masato Mita, Mamoru Komachi. Large Language Models Are State-of-the-Art Evaluator for Grammatical Error Correction. Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024). June, 2024. (short, accepted)
Taisei Enomoto, Hwichan Kim, Tosho Hirasawa, Yoshinari Nagai, Ayako Sato, Kyotaro Nakajima and Mamoru Komachi. TMU-HIT at MLSP 2024: How Well Can GPT-4 Tackle Multilingual Lexical Simplification? Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024): Shared task 2. June, 2024. (poster)
2024/05/24 自然言語処理のメジャー国際会議 LREC-COLING で以下の論文を発表しました。
Naoya Ueda, Masato Mita (CyberAgent), Teruaki Oka, Mamoru Komachi. Token-length Bias in Minimal-pair Paradigm Datasets. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pp.16224–16236. May, 2024. (PDF)
Yoshinari Nagai, Teruaki Oka, Mamoru Komachi. A Document-Level Text Simplification Dataset for Japanese. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pp.459–476. May, 2024. (PDF)
Hwichan Kim, Shota Sasaki (CyberAgent), Sho Hoshino (CyberAgent), and Ukyo Honda (CyberAgent). A Single Linear Layer Yields Task-Adapted Low-Rank Matrices. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pp.1602–1608. May, 2024.