大井 聖也(おおい まさなり)
東京工業大学 情報理工学院 情報工学系 知能情報コース 修士1年の大井聖也です。
大学では井上研究室でマルチモーダル自然言語処理に関する研究をしています。
TokyoTech-LLMプロジェクトのメンバーとしてLLMの開発をしています。
3秒敬語で自然言語生成に関するAI開発を行なっています。
CoeFontで音声生成に関する研究開発を行っています。
ニュース
2024.05: ACL 2024 findingsに"Likelihood-based Mitigation of Evaluation Bias in Large Language Models"が採択されました。
2024.03: 自然言語処理年次大会(NLP2024)にて、主著「大規模言語モデルにおける評価バイアスの尤度に基づく緩和」が若手奨励賞を受賞しました。
2024.03: 自然言語処理年次大会(NLP2024)にて、共著「Swallowコーパス: 日本語大規模ウェブコーパス」が優秀賞を受賞しました。
2024.03: 自然言語処理年次大会(NLP2024)にて、共著「継続事前学習による日本語に強い大規模言語モデルの構築」が優秀賞を受賞しました。
2024.03: 自然言語処理年次大会(NLP2024)にて、4本(主著1本, 共著3本)の発表を行います。
2024.02: arXivでプレプリントを公開しました: "Likelihood-based Mitigation of Evaluation Bias in Large Language Models"
2023.12: 開発に携わったLLMであるSwallowが公開されました。
研究分野・興味
自然言語処理(Natural Language Processing)
大規模言語モデル(LLM)
マルチモーダル処理
メタ評価
音声生成
職歴
2023.10 - 現在:
リサーチアシスタント
東京工業大学
業績
プレプリント
Masanari Ohi, Masahiro Kaneko, Ryuto Koike, Mengsay Loem, Naoaki Okazaki. Likelihood-based Mitigation of Evaluation Bias in Large Language Models. arXiv preprint, 2024.
国内学会(査読なし)
大井聖也, 金子正弘, 小池隆斗, Mengsay Loem, 岡崎直観. 大規模言語モデルにおける評価バイアスの尤度に基づく緩和. 言語処理学会第30回年次大会(NLP2024), 兵庫
岡崎直観, 服部翔, 平井翔太, 飯田大貴, 大井聖也, 藤井一喜, 中村泰士, Mengsay Loem, 横田理央, 水木栄. Swallowコーパス: 日本語大規模ウェブコーパス. 言語処理学会第30回年次大会(NLP2024), 兵庫
水木栄, 飯田大貴, 藤井一喜, 中村泰士, Mengsay Loem, 大井聖也, 服部翔, 平井翔太, 横田理央, 岡崎直観. 大規模言語モデルの日本語能力の効率的な強化: 継続事前学習における語彙拡張と対訳コーパスの活用. 言語処理学会第30回年次大会(NLP2024), 兵庫
藤井一喜, 中村泰士, Mengsay Loem, 飯田大貴, 大井聖也, 服部翔, 平井翔太, 水木栄, 横田理央, 岡崎直観. 継続事前学習による日本語に強い大規模言語モデルの構築. 言語処理学会第30回年次大会(NLP2024), 兵庫
学歴
2024.03 - 現在:
修士(工学)
東京工業大学
2020.04 - 2024.03:
学士(工学)
東京工業大学
その他
2023.08 - 2023.09: 超短期海外派遣プログラム @スウェーデン🇸🇪
2021.08 - 現在: 奨学生(竹中育英会)