齋藤 幸史郎
齋藤 幸史郎
東京科学大学 情報理工学院 修士1年 @ Okazaki Lab
Swallow プロジェクト.評価チーム.
(高い日本語理解能力を持ったLLMの開発.公式サイト.)
機械文検出.PUPPET:検出されやすいLLMの開発.
Oct. 9, 2025:
🎉🏆 私の研究が COLM 2025と同時開催される
MELT Workshop でSpotlightに選ばれました
Sep. 17, 2025:
🎉🏆 YANS2025 ハッカソンにおいて
「審査員特別賞」を受賞いたしました
Sep. 2, 2025:
🎉🏆 NL研での発表が
「山下記念研究賞 2025」を獲得いたしました
Aug, 23. 2025:
High School Scientific Conference (HSSC)  
by SMAN 10 BEKASI  にて 
Keynote Speaker として講演をしました
Aug. 8, 2025:
🎉 私の研究が COLM 2025 と
同時開催される MELT Workshop に採択されました
(過去のニュースはこちらから)
Aug, 23. 2025:
High School Scientific Conference (HSSC)  by SMAN 10 BEKASI  にて Keynote Speaker として講演をしました
Oct. 10, 2025: 
"Why We Build Local Large Language Models: An Observational Analysis from 35 Japanese and Multilingual LLMs"
Koshiro Saito, Sakae Mizuki, Masanari Ohi, Taishi Nakamura, Taihei Shiotani, Koki Maeda, Youmi Ma, Kakeru Hattori, Kazuki Fujii, Takumi Okamoto, Shigeki Ishida, Hiroya Takamura, Rio Yokota, Naoaki Okazaki. The 1st Workshop on Multilingual and Equitable Language Technologies (MELT) (The Second Conference On Language Modeling (COLM)と同時開催)
🎉🏆 YSpotlightに選ばれました (Ref: 採択論文の一覧: https://melt-workshop.github.io/papers/.)
Oct. 10, 2025:
"Building Instruction-Tuning Datasets from Human-Written Instructions with Open-Weight Large Language Models."
Youmi Ma, Sakae Mizuki, Kazuki Fujii, Taishi Nakamura, Masanari Ohi, Hinari Shimada, Taihei Shiotani, Koshiro Saito, Koki Maeda, Kakeru Hattori, Takumi Okamoto, Shigeki Ishida, Rio Yokota, Hiroya Takamura, Naoaki Okazaki. COLM2025.
Sep. 17, 2025:
🎉🏆 YANS2025 ハッカソンにおいて「審査員特別賞」を受賞いたしました
Sep. 6-7, 2024:
「文生成能力を維持した検出されやすいLLM ~検出器にゴマを擦るLLM~」[ポスター]
齋藤 幸史郎 [1], 小池 隆斗 [1], 金子 正弘[2], 岡崎 直観[1] (1: 東京工業大学, 2: MBZUAI)
🎉🏆 第19回YANSシンポジウムにおいて「奨励賞」「スポンサー賞 (CyberAgent様)」を獲得いたしました
Sep. 3, 2024:
「LLMに日本語テキストを学習させる意義」[予稿, スライド]
齋藤 幸史郎 [1], 水木 栄 [2,1], 大井 聖也 [1], 中村 泰士 [1], 塩谷 泰平 [1], 前田 航希 [1], Ma Youmi [1], 服部 翔 [1], 藤井 一喜 [1], 岡本 拓己 [1], 石田 茂樹 [1], 高村 大也 [2], 横田 理央 [1], 岡崎 直観 [1] (1: 東京工業大学, 2: 産業技術総合研究所)
🎉🏆 第261回NL研究発表会において「優秀研究賞」を獲得いたしました
 🎉🏆「山下記念研究賞 2025」を獲得いたしました
Mar. 2025:
「模倣学習による大規模言語モデルの指示チューニング.」
Youmi Ma, 水木 栄, 藤井 一喜, 中村 泰士, 大井 聖也, 島田 比奈理, 塩谷 泰平, 齋藤 幸史郎, 前田 航希, 服部 翔, 岡本 拓己, 石田 茂樹, 横田 理央, 高村 大也, 岡崎 直観. 言語処理学会第31回年次大会 (NLP2025), 長崎.
Mar. 2025:
「新聞記事からつくる 時事と社会に強い日本語LLM」
服部 翔, 水木 栄, 藤井 一喜, 中村 泰士, 塩谷 泰平, 植田 快, 新妻 巧朗, 川畑 輝, 田森 秀明, Youmi Ma, 前田 航希, 大井 聖也, 齋藤 幸史郎, 岡本 拓己, 石田 茂樹, 横田 理央, 高村 大也, 岡崎 直観. 言語処理学会第31回年次大会 (NLP2025), 長崎.
Mar. 2025:
「Swallowコーパスv2: 教育的な日本語ウェブコーパスの構築」
服部 翔, 岡崎 直観, 水木 栄, 藤井 一喜, 中村 泰士, 大井 聖也, 塩谷 泰平, 齋藤 幸史郎, Youmi Ma, 前田 航希, 岡本 拓己, 石田 茂樹, 横田 理央, 高村 大也. 言語処理学会第31回年次大会 (NLP2025), 長崎.
Apr. 2025	- Present:
Teaching Assistant  DS・AI全学教育機構,東京科学大学
Feb. 2023	- Jun. 2025:	
インターンシップ Canserscan Inc.	
私は「大規模言語モデル(LLM)こそがAIと人間の共生社会を実現する架け橋と学問分野である」と信じております。
Watermark [強化学習] (現在🏃)
モデル本来の能力を維持したまま、
その生成文を検出されやすくすることは可能か.
人間が書いた文章とAIが生成した文章を見分けることは可能か.
またどのような場面で有用なのか.
モデル/データセットの評価 (現在🏃)
「良い」モデル開発のためには何をどのように測れば良いのか.
「良い」データセットとは何か.
LLMを活用したサービスやビジネス(本当は一番興味があったりします🔥)
世界中の人々がLLMを利用でき,
またその恩恵に預かるようにするためにはどうしたら良いか.
LLM は言語や生成という枠組みを超えて社会に資することができるか.
英語
TOEIC: 910
TOEFL-iBT:	97		
(MyBest Scores)
英検: 準一級
技術系
基本情報技術者
Jul. 2024:
奨学金 (キーエンス財団)