1998年3月 奈良県私立東大寺学園高等学校 卒業
1998年4月 東京大学教養学部理科一類 入学
2002年3月 東京大学工学部電子情報工学科 卒業
2002年4月 東京大学大学院情報理工学系研究科修士課程 入学
2007年3月 東京大学大学院情報理工学系研究科博士課程 修了, 博士 (情報理工学)
2007年4月 京都大学大学院情報学研究科 特任助教
2009年2月 京都大学大学院情報学研究科 助教
2014年4月から2019年3月 京都大学大学院情報学研究科 特定講師 (黒橋・河原研究室)
2014年10月から2015年3月 カーネギーメロン大学 LTI 客員研究員
2019年4月から2023年9月 Yahoo! JAPAN研究所 上席研究員
2023年10月から2025年3月 LINEヤフー研究所 上席研究員
共著の論文が情報処理学会 2025年度 山下記念研究賞を受賞しました。(2025.9)
情報処理学会自然言語処理研究会で優秀研究賞を受賞しました。(2025.3)
第66回プログラミング・シンポジウムで「日本語に強い大規模言語モデルの研究開発 -多分野の技術が結集する総力戦-」というタイトルで講演しました。 (2025.1)
生成AIの品質保証〜出力結果の信頼性を確保〜 Findy Online Conferenceで「事前学習モデルの評価とその難しさ」というタイトルで講演しました。 (2024.10)
FIT2024 生成AIイベントで「日本語に強い大規模言語モデルの研究開発」というタイトルで招待講演をしました。(2024.9)
言語処理学会2023年度最優秀論文賞を受賞しました。(2024.3)
論文誌「自然言語処理」に巻頭言「言語処理学会第 30 回年次大会 (NLP2024) にむけて」が掲載されました。(2023.12)
論文誌「自然言語処理」に論文「JGLUE: 日本語言語理解ベンチマーク」が掲載されました。 (2023.3)
NLP2023で委員特別賞を受賞しました。 (2023.3)
JGLUE (日本語言語理解ベンチマーク)を公開しました。 (2022.6)
NLP2022で言語資源賞を受賞しました。 (2022.3)
NLP2022で「ゼロから始める転移学習」というタイトルでチュートリアルをします。 (2022.1)
NLP若手の会 (YANS) 第16回シンポジウムでポスター発表をしました。 (2021.8)
第1回WI2セミナー (7/5, 月)で「深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで」というタイトルで話しました。 (2021.7)
対話システム勉強会(第2回) (12/16, 水)で「自然言語処理の最新技術動向紹介」というタイトルで話します。 (2020.11)
COLING2020の論文をarXivに投稿しました。 (2020.11)
第34回人工知能学会全国大会 優秀賞を受賞しました。 (2020.11)
COLING2020にlong paperが採択されました。 (2020.9)
情報処理学会 学会誌「情報処理」の連載「5分で分かる!? 有名論文ナナメ読み」にBERTの解説記事を書きました。 (2020.2)
情報処理学会 第131回音声言語情報処理研究会 (2.13-14)で「転移学習による自然言語処理の進展」というタイトルで招待講演をしました。 (2020.2)
SIGIR2019にshort paperが採択されました。 (2019.4)
Yahoo! JAPAN 研究所に移りました。 (2019.4)
名古屋地区NLPセミナーで「深層学習時代における日本語述語項構造解析」というタイトルで発表しました。 (2018.11)
栗原健太郎, 河原大輔, 柴田知秀. JGLUE: 日本語言語理解ベンチマーク. 自然言語処理, 30 巻 1 号, pp. 63-87, 言語処理学会2023年度最優秀論文賞受賞 (2023.3) [link]
Wataru Sakata, Tomohide Shibata, Ribeka Tanaka and Sadao Kurohashi: FAQ Retrieval using Query-Question Similarity and BERT-Based Query-Answer Relevance. In Proceedings of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR2019), Paris, France, (2019.7) [paper, arXiv]
Tomohide Shibata and Sadao Kurohashi: Entity-Centric Joint Modeling of Japanese Coreference Resolution and Predicate Argument Structure Analysis. In Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (ACL2018), Melbourne, Australia, (2018.7) [pdf]
Tomohide Shibata, Daisuke Kawahara and Sadao Kurohashi: Neural Network-Based Model for Japanese Predicate Argument Structure Analysis. In Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (ACL2016), Berlin, Germany, (2016.8) [pdf]
2025年9月 情報処理学会 2025年度 山下記念研究賞
李聖哲, 大萩雅也, 塚越駿, 福地成彦, 柴田知秀, 河原大輔. 実在しないエンティティや出来事に関する合成文書を用いたRAGベンチマークの構築. (受賞は第1著者のみ)
2025年3月 情報処理学会 自然言語処理研究会 優秀研究賞
李聖哲, 大萩雅也, 塚越駿, 福地成彦, 柴田知秀, 河原大輔. 実在しないエンティティや出来事に関する合成文書を用いたRAGベンチマークの構築.
2024年3月 言語処理学会第30回年次大会 若手奨励賞
植松拓也, 王昊, 河原大輔, 柴田知秀. 日本語Natural QuestionsとBoolQの構築. (受賞は第1著者のみ)
2024年3月 言語処理学会2023年度最優秀論文賞
栗原健太郎, 河原大輔, 柴田知秀. JGLUE: 日本語言語理解ベンチマーク.
2023年3月 言語処理学会第29回年次大会 委員特別賞
栗原健太郎, 河原大輔, 柴田知秀. JCommonsenseQA 2.0: 計算機と人の協働による常識推論データセットの改良.
2023年3月 言語処理学会第29回年次大会 若手奨励賞
平子潤, 柴田知秀. 転移学習における強化学習を用いた効率的なトークナイザとモデルの同時学習. (受賞は第1著者のみ)
2022年3月 言語処理学会第28回年次大会 言語資源賞
栗原健太郎, 河原大輔, 柴田知秀. JGLUE: 日本語言語理解ベンチマーク.
2020年6月 第34回人工知能学会全国大会 優秀賞
山田悠右, 藤田綜一郎, 柴田知秀, 小林隼人, 田口拓明, 奥村学. 人手評価を考慮した強化学習に基づくニュース見出し生成.
2018年3月 言語処理学会第24回年次大会 優秀賞
柴田知秀, 黒橋禎夫. Entity-Centricな述語項構造解析・共参照解析の同時学習.
2016年9月 情報処理学会関西支部 支部大会奨励賞
坂田亘, 柴田知秀, 黒橋禎夫. 語彙関係知識と単語間表現パターンを用いた単語分散表現の改良.
2015年3月 言語処理学会第21回年次大会 若手奨励賞
小浜翔太郎, 柴田知秀, 黒橋禎夫. 事態間知識における項の対応付け学習. (受賞は第1著者のみ)
2012年3月 言語処理学会第18回年次大会 若手奨励賞
江頭勇佑, 柴田知秀, 黒橋禎夫. 雑談対話システムにおける強化学習を用いた応答生成モジュールの選択. (受賞は第1著者のみ)
2008年9月 NLP若手の会 第3回シンポジウム 奨励賞
柴田知秀. 大規模コーパスに基づく同義語・多義語処理.
2008年5月 情報処理学会 自然言語処理研究会 学生奨励賞
萩行正嗣, 柴田知秀, 黒橋禎夫. 表層・語彙的特徴量に基づくブログの面白さ分析. (受賞は第1著者のみ)
2008年3月 言語処理学会第13回年次大会 最優秀発表賞
新里圭司, 柴田知秀, 河原大輔, 黒橋禎夫. 大規模日本語ウェブ文書を対象とした開放型検索エンジン基盤の構築.
第66回プログラミング・シンポジウム 「日本語に強い大規模言語モデルの研究開発 -多分野の技術が結集する総力戦-」 (2025.1)
FIT2024 生成AIイベント 「日本語に強い大規模言語モデルの研究開発」 (2024.9)
NLP2022 チュートリアル「ゼロから始める転移学習」 (2022.3)
第1回WI2セミナー 「深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで」 (2021.7)
対話システム勉強会(第2回) 「自然言語処理の最新技術動向紹介」 (2020.12)
情報処理学会 第131回音声言語情報処理研究会 「転移学習による自然言語処理の進展」 (2020.2)
名古屋地区NLPセミナー 「深層学習時代における日本語述語項構造解析」 (2018.11)
2025年 日本語言語資源の構築と利用性の向上 (JLR2025) 提案者
2024年 言語処理学会第30回年次大会 大会委員長
2024年 日本語言語資源の構築と利用性の向上 (JLR2024) 提案者
2023年 言語処理学会第29回年次大会 大会副委員長
2023年 日本語言語資源の構築と利用性の向上 (JLR2023) 提案者
2022年〜 言語処理学会 理事
2022年 日本語における評価用データセットの構築と利用性の向上 (JED2022) 提案者
2022年 言語処理技術セミナー2022 実行委員
2021年 言語処理技術セミナー2021 実行委員
2020年 言語処理技術セミナー2020 実行委員
2020年 言語処理学会第26回年次大会 プログラム委員
2019年 言語処理学会第25回年次大会 プログラム委員
2018年 電子情報通信学会 英文論文誌D 食メディア小特集 委員
2017年〜2021年 言語処理学会 代議員
2016年 The 4th Workshop on EVENTS: Definition, Detection, Coreference, and Representation Program Committee
2015年 The 3rd Workshop on EVENTS: Definition, Detection, Coreference, and Representation Program Committee
2015年〜2019年 言語処理学会 編集委員
2013〜14年 NTCIR11 RITE-VAL organizer
2013年 5th Workshop on Multimedia for Cooking and Eating Activities (CEA2013) Program Committee
2013年 Workshop on Cooking with Computers (CwC2013) Program Committee
2012年〜2014年 NLP若手の会 共同委員長
2012〜13年 NTCIR10 RITE2 organizer
2012年 4th Workshop on Multimedia for Cooking and Eating Activities (CEA2012) Program Committee
2012年 ECAI2012 workshop on Cooking with Computers (CwC2012) Program Committee
2011年〜2014年 情報処理学会論文誌ジャーナル 編集委員
2011年 3rd Workshop on Multimedia for Cooking and Eating Activities (CEA2011) Program Committee
2010年 2nd Workshop on Multimedia for Cooking and Eating Activities (CEA2010) Program Committee
2010年〜2013年 情報処理学会 情報基礎とアクセス技術研究会(IFAT) 委員
2010年 NLP若手の会 第5回シンポジウム プログラム委員
2009年 NLP若手の会 第4回シンポジウム プログラム委員
2009年 言語処理学会第15回年次大会 プログラム委員
情報処理学会 学会誌「情報処理」連載「5分で分かる!? 有名論文ナナメ読み」BERTの解説記事 (2020.2)
科学研究費補助金 基盤研究(B) 「多様なテキストへの高次アノテーションに基づく文脈理解モデルの明確化」(H24~H26,研究分担者,15,340千円)
科学研究費補助金 若手研究(B)「大規模テキストから自動獲得した知識に基づく言語解析の精度向上」(H21~H24,研究代表者,4,290千円)
科学研究費補助金 特定領域研究「情報爆発時代に向けた新しいIT基盤技術の研究」 計画研究「構造的言語処理による情報検索基盤技術の構築」(H19~H22,研究分担者,35,400千円)
情報処理装置、情報処理方法および情報処理プログラム,登録日: 2023年07月21日,登録番号: 特許7317887,発明者: 柴田 知秀, 小林 隼人, 田口 拓明,出願人: ヤフー株式会社.
情報処理装置、情報処理方法および情報処理プログラム,登録日: 2023年05月01日,登録番号: 特許7273107,発明者: 山本 貴之, 柴田 知秀, 清水 徹,出願人: ヤフー株式会社.
情報処理装置、情報処理方法及び情報処理プログラム,登録日: 2023年03月13日,登録番号: 特許7244449,発明者: 柴田 知秀, 小林 隼人, 清水 伸幸, 田口 拓明, 仲村 勇輝,出願人: ヤフー株式会社.
情報処理装置、情報処理方法及び情報処理プログラム,登録日: 2023年01月17日,登録番号: 特許7212642,発明者: 柴田 知秀, 小林 隼人, 田口 拓明,出願人: ヤフー株式会社.
情報処理装置、情報処理方法および情報処理プログラム,登録日: 2023年01月04日,登録番号: 特許7203892,発明者: 山本 貴之, 清水 徹, 柴田 知秀,出願人: ヤフー株式会社.
情報処理装置、情報処理方法および情報処理プログラム,登録日: 2022年08月05日,登録番号: 特許7119169,発明者: 山本 貴之, 柴田 知秀, 清水 徹,出願人: ヤフー株式会社.
情報処理装置、情報処理方法及び情報処理プログラム,登録日: 2022年02月15日,登録番号: 特許7043556,発明者: 柴田 知秀, 藤田 正悟,出願人: ヤフー株式会社.
情報処理装置、情報処理方法および情報処理プログラム,登録日: 2022年01月20日,登録番号: 特許7012892,発明者: 山本 貴之, 清水 徹, 柴田 知秀,出願人: LINEヤフー株式会社.
同義判定装置、同義学習装置、及びプログラム,登録日: 2016年04月15日,登録番号: 特許5916016,発明者: 泉 朋子, 齋藤 邦子, 松尾 義博, 黒橋 禎夫, 河原 大輔, 柴田 知秀,出願人: 日本電信電話株式会社, 国立大学法人京都大学.
特徴語自動学習システム、コンテンツ連動型広告配信コンピュータシステム、検索連動型広告配信コンピュータシステム、およびテキスト分類コンピュータシステム、並びにこれらのコンピュータプログラムおよび方法,登録日: 2013年07月12日,登録番号: 特許5311378,発明者: 黒橋 禎夫, 柴田 知秀,出願人: 国立大学法人京都大学.
評判分析装置、評判分析方法及び評判分析プログラム,登録日: 2013年06月07日,登録番号: 特許5286298,発明者: 平 博順, 永田 昌明, 吉田 仙, 笠原 要, 黒橋 禎夫, 柴田 知秀,出願人: 日本電信電話株式会社.
早稲田大学 基幹理工学部 自然言語処理 ゲスト講師 2025年
慶應義塾大学 総合政策・環境情報学部 データ・ドリブン社会の創発と戦略(応用)ゲスト講師 2023年〜
京都大学工学部 電気電子工学科 電気電子工学実習A (3年前期) マイクロコンピュータ 2010年〜2013年
ディープラーニングによる自然言語処理. 山田 育矢, 柴田 知秀, 進藤 裕之, 玉木 竜二. 共立出版. 2023/5/8.
自然言語処理概論. 黒橋 禎夫, 柴田 知秀. サイエンス社. 2016/10/10.
囲碁4段・将棋3段