About me: Koshiro Saito

齋藤幸史郎

東京科学大学情報理工学院修士１年 @ Okazaki Lab

Swallow プロジェクト．評価チーム．
（高い日本語理解能力を持ったLLMの開発．公式サイト．）
機械文検出．PUPPET：検出されやすいLLMの開発．

EN (PC) 💻

EN (Mobile) 📱

日本語 (PC) 💻

日本語 (スマホ)📱

✉️: koshiro.saito[a.][.t]nlp.comp.isct.ac.jp

海外へのインターンシップや訪問学生に憧れています！

全力でコミットするので，チャンスをください！

News 🗞️

Oct. 9, 2025:
🎉🏆 私の研究が COLM 2025と同時開催される
MELT Workshop でSpotlightに選ばれました

Sep. 17, 2025:
🎉🏆 YANS2025 ハッカソンにおいて
「審査員特別賞」を受賞いたしました
Sep. 2, 2025:
🎉🏆 NL研での発表が
「山下記念研究賞 2025」を獲得いたしました
Aug, 23. 2025:
High School Scientific Conference (HSSC)
by SMAN 10 BEKASI にて
Keynote Speaker として講演をしました
Aug. 8, 2025:
🎉 私の研究が COLM 2025 と
同時開催される MELT Workshop に採択されました

（過去のニュースはこちらから）

Activities ✒️

国外での学会発表など 🌏

第一著者の論文 / 個人での活動

Aug, 23. 2025:
High School Scientific Conference (HSSC) by SMAN 10 BEKASI にて Keynote Speaker として講演をしました

Oct. 10, 2025:
"Why We Build Local Large Language Models: An Observational Analysis from 35 Japanese and Multilingual LLMs"
Koshiro Saito, Sakae Mizuki, Masanari Ohi, Taishi Nakamura, Taihei Shiotani, Koki Maeda, Youmi Ma, Kakeru Hattori, Kazuki Fujii, Takumi Okamoto, Shigeki Ishida, Hiroya Takamura, Rio Yokota, Naoaki Okazaki. The 1st Workshop on Multilingual and Equitable Language Technologies (MELT) (The Second Conference On Language Modeling (COLM)と同時開催)
🎉🏆 YSpotlightに選ばれました (Ref: 採択論文の一覧: https://melt-workshop.github.io/papers/.)

共著の論文

Oct. 10, 2025:
"Building Instruction-Tuning Datasets from Human-Written Instructions with Open-Weight Large Language Models."
Youmi Ma, Sakae Mizuki, Kazuki Fujii, Taishi Nakamura, Masanari Ohi, Hinari Shimada, Taihei Shiotani, Koshiro Saito, Koki Maeda, Kakeru Hattori, Takumi Okamoto, Shigeki Ishida, Rio Yokota, Hiroya Takamura, Naoaki Okazaki. COLM2025.

国内での学会発表など 🇯🇵

第一著者の論文 / 個人での活動

Sep. 17, 2025:
🎉🏆 YANS2025 ハッカソンにおいて「審査員特別賞」を受賞いたしました

Sep. 6-7, 2024:
「文生成能力を維持した検出されやすいLLM ~検出器にゴマを擦るLLM~」[ポスター]
齋藤幸史郎 [1], 小池隆斗 [1], 金子正弘[2], 岡崎直観[1] (1: 東京工業大学, 2: MBZUAI)
🎉🏆 第19回YANSシンポジウムにおいて「奨励賞」「スポンサー賞 (CyberAgent様)」を獲得いたしました
Sep. 3, 2024:
「LLMに日本語テキストを学習させる意義」[予稿, スライド]
齋藤幸史郎 [1], 水木栄 [2,1], 大井聖也 [1], 中村泰士 [1], 塩谷泰平 [1], 前田航希 [1], Ma Youmi [1], 服部翔 [1], 藤井一喜 [1], 岡本拓己 [1], 石田茂樹 [1], 高村大也 [2], 横田理央 [1], 岡崎直観 [1] (1: 東京工業大学, 2: 産業技術総合研究所)
🎉🏆 第261回NL研究発表会において「優秀研究賞」を獲得いたしました
🎉🏆「山下記念研究賞 2025」を獲得いたしました

共著の論文

Mar. 2025:
「模倣学習による大規模言語モデルの指示チューニング.」
Youmi Ma, 水木栄, 藤井一喜, 中村泰士, 大井聖也, 島田比奈理, 塩谷泰平, 齋藤幸史郎, 前田航希, 服部翔, 岡本拓己, 石田茂樹, 横田理央, 高村大也, 岡崎直観. 言語処理学会第31回年次大会 (NLP2025), 長崎.
Mar. 2025:
「新聞記事からつくる時事と社会に強い日本語LLM」
服部翔, 水木栄, 藤井一喜, 中村泰士, 塩谷泰平, 植田快, 新妻巧朗, 川畑輝, 田森秀明, Youmi Ma, 前田航希, 大井聖也, 齋藤幸史郎, 岡本拓己, 石田茂樹, 横田理央, 高村大也, 岡崎直観. 言語処理学会第31回年次大会 (NLP2025), 長崎.
Mar. 2025:
「Swallowコーパスv2: 教育的な日本語ウェブコーパスの構築」
服部翔, 岡崎直観, 水木栄, 藤井一喜, 中村泰士, 大井聖也, 塩谷泰平, 齋藤幸史郎, Youmi Ma, 前田航希, 岡本拓己, 石田茂樹, 横田理央, 高村大也. 言語処理学会第31回年次大会 (NLP2025), 長崎.

Work Experience 🧑‍💻

Apr. 2025 - Present:
Research Assistant 岡崎研究室，東京科学大学
Apr. 2025 - Present:
Teaching Assistant DS・AI全学教育機構，東京科学大学

Jul. 2024 - Mar. 2025:
Research Assistant 岡崎研究室，東京工業大学
Feb. 2023 - Jun. 2025:
インターンシップ Canserscan Inc.

Research Interest 📚💡

私は「大規模言語モデル(LLM)こそがAIと人間の共生社会を実現する架け橋と学問分野である」と信じております。

Watermark [強化学習] (現在🏃)
- モデル本来の能力を維持したまま、
  その生成文を検出されやすくすることは可能か．
- 人間が書いた文章とAIが生成した文章を見分けることは可能か．
  またどのような場面で有用なのか．
モデル/データセットの評価 (現在🏃)
- 「良い」モデル開発のためには何をどのように測れば良いのか．
- 「良い」データセットとは何か．
LLMを活用したサービスやビジネス（本当は一番興味があったりします🔥）
- 世界中の人々がLLMを利用でき，
  またその恩恵に預かるようにするためにはどうしたら良いか．
- LLM は言語や生成という枠組みを超えて社会に資することができるか．

Education 🧑‍🎓

Apr. 2025 - Present:
情報理工学院情報工学系知能情報コース
東京科学大学
Apr. 2021 - Mar. 2025:
情報理工学院情報工学系
東京工業大学

Qualifications /
Test Scores 🪪

英語

TOEIC: 910
TOEFL-iBT: 97
(MyBest Scores)
英検: 準一級

技術系
- 基本情報技術者

Others 🕶️

Jul. 2024:

奨学金 (キーエンス財団)

Page updated

Google Sites

Report abuse

News 🗞️

Activities ✒️

国外での学会発表など 🌏

第一著者の論文 / 個人での活動

共著の論文

国内での学会発表など 🇯🇵

第一著者の論文 / 個人での活動

共著の論文

Work Experience 🧑‍💻

Research Interest 📚💡

Education 🧑‍🎓

Qualifications / Test Scores 🪪

Others 🕶️

Qualifications /
Test Scores 🪪