大井聖也（おおいまさなり）

東京工業大学情報理工学院情報工学系知能情報コース修士1年の大井聖也です。

大学では井上研究室でマルチモーダル自然言語処理に関する研究をしています。

TokyoTech-LLMプロジェクトのメンバーとしてLLMの開発をしています。

３秒敬語で自然言語生成に関するAI開発を行なっています。

CoeFontで音声生成に関する研究開発を行っています。

ニュース

2024.05: ACL 2024 findingsに"Likelihood-based Mitigation of Evaluation Bias in Large Language Models"が採択されました。
2024.03: 自然言語処理年次大会(NLP2024)にて、主著「大規模言語モデルにおける評価バイアスの尤度に基づく緩和」が若手奨励賞を受賞しました。
2024.03: 自然言語処理年次大会(NLP2024)にて、共著「Swallowコーパス: 日本語大規模ウェブコーパス」が優秀賞を受賞しました。
2024.03: 自然言語処理年次大会(NLP2024)にて、共著「継続事前学習による日本語に強い大規模言語モデルの構築」が優秀賞を受賞しました。
2024.03: 自然言語処理年次大会(NLP2024)にて、4本（主著1本, 共著3本）の発表を行います。
2024.02: arXivでプレプリントを公開しました: "Likelihood-based Mitigation of Evaluation Bias in Large Language Models"
2023.12: 開発に携わったLLMであるSwallowが公開されました。

2023.10 - 現在:

リサーチアシスタント

東京工業大学

2022.04 - 現在:

AI開発

2021.10 - 現在:

リサーチエンジニア

Masanari Ohi, Masahiro Kaneko, Ryuto Koike, Mengsay Loem, Naoaki Okazaki. Likelihood-based Mitigation of Evaluation Bias in Large Language Models. arXiv preprint, 2024.

大井聖也, 金子正弘, 小池隆斗, Mengsay Loem, 岡崎直観. 大規模言語モデルにおける評価バイアスの尤度に基づく緩和. 言語処理学会第30回年次大会(NLP2024), 兵庫
岡崎直観, 服部翔, 平井翔太, 飯田大貴, 大井聖也, 藤井一喜, 中村泰士, Mengsay Loem, 横田理央, 水木栄. Swallowコーパス: 日本語大規模ウェブコーパス. 言語処理学会第30回年次大会(NLP2024), 兵庫
水木栄, 飯田大貴, 藤井一喜, 中村泰士, Mengsay Loem, 大井聖也, 服部翔, 平井翔太, 横田理央, 岡崎直観. 大規模言語モデルの日本語能力の効率的な強化: 継続事前学習における語彙拡張と対訳コーパスの活用. 言語処理学会第30回年次大会(NLP2024), 兵庫
藤井一喜, 中村泰士, Mengsay Loem, 飯田大貴, 大井聖也, 服部翔, 平井翔太, 水木栄, 横田理央, 岡崎直観. 継続事前学習による日本語に強い大規模言語モデルの構築. 言語処理学会第30回年次大会(NLP2024), 兵庫

2024.03 - 現在:

修士（工学）

東京工業大学

2020.04 - 2024.03:

学士（工学）

東京工業大学