09:30-09:40 【オープニング】
09:40-11:00【一般発表】(座長:小町 守)
09:40-10:00 第二言語習得にとってのLLM Judgeの功罪 ーパフォーマンス向上と身体知の外部化ー 李 佳 (大阪大), 砂岡 和子 (早大), 徐 勤 (京大) [スライド]
10:00-10:20 金融ドメインにおける日本語文書要約の単語単位の品質推定 山内 洋輝 (愛媛大), 田村 光太郎 (ユーザベース), 梶原 智之 (愛媛大) [SpeakerDeck]
10:20-10:40 文書レベルの日本語平易化の評価基準の提案とデータセット構築 田中 日加吏, Zhousi Chen, Kexin Bian, 小町 守 (一橋大) [Google Slides]
10:40-11:00 大規模言語モデルを活用したパブリックコメントの反映可視化と課題分析 亀田 尭宙 (人間文化研究機構), 石井 康平(千葉大) [GitHub]
11:00-11:10【休憩】
11:10-11:40【Shared Task結果概要】
11:10-11:25 Shared Task 翻訳部門の結果報告 須藤 克仁 [スライド]
11:25-11:40 Shared Task 文法誤り訂正部門の結果報告 三田 雅人 [スライド]
11:40-13:00【休憩】
13:00-14:00【招待講演】(座長:小町 守)
13:00-14:00 大規模言語モデルの生成能力評価 今城 健太郎 (Preferred Networks)
本研究では、Q&A評価を例に大規模言語モデルの文章生成能力の評価方法について提案する。翻訳の評価は、評価精度の限界から機械学習モデルを使うようになったが、仕組みにブラックボックスな部分が入るという問題がある。本研究では、回答のスタイルなど精度に関係ない部分を例示によって固定し事前学習モデルを用いて事前にとりうる良い回答空間を十分に生成することで大規模言語モデルの生成能力を計測する方法を提案する。
14:00-14:10【休憩】
14:10-15:10【翻訳部門】(座長:須藤 克仁)
14:10-14:30 ehiMetrick 森岡 拓, 杉山 誠治, 高山 隼矢, 梶原 智之 (愛媛大) [予稿] [SpeakerDeck]
14:30-14:50 きょなら 出口 祥之 (NTT), 帖佐 克己 (NTT/NAIST), 坂井 優介 (NAIST)
14:50-15:10 てゆーか,char_f1 って何? 熊谷 雄介,藤井 遼 (博報堂DYホールディングス) [予稿]
15:10-15:20【休憩】
15:20-16:20【文法誤り訂正部門】(座長:三田 雅人)
15:20-15:40 ehiMetrick 杉山 誠治, 森岡 拓, 高山 隼矢, 梶原 智之 (愛媛大) [予稿] [SpeakerDeck]
15:40-16:00 Nice gliTchers 五藤 巧, 土肥 康輔, Adam Nohejl, Justin Vasselli, 郷原 聖士, 坂井 優介, 渡辺 太郎 (NAIST) [予稿] [GitHub]
16:00-16:20 Waseda Riko Qiao Wang (早大), Yuan Zheng, Adnan Labib (King's College London)
16:20-17:00【総合討論】
17:00-17:15【クロージング】