2023年8月より米コーネル大学大学院にて情報科学(Computer Science; CS)専攻としてPh.D. 課程に在籍。情報検索や音楽配信など身近な意思決定に関わるシステムおよび方策を、人々の行動データなどを利用して最適化・評価する研究を行う。より広い研究興味としては、「意思決定」x「最適化」x「機械学習」の融合領域に関心を持つ。ウェブ・データマイニング分野の主要国際会議WSDMにて論文がBest Paper Award Runner-Upに選出(2022)。東京工業大学優秀学生賞(経営工学系首席卒業)(2023)。船井情報科学振興財団奨学生(2023-2025)。Quad fellowship 採択生 (Japan fellow, 2025-2026)。
2023-現在: コーネル大学博士課程(情報科学科)(2025年 修士号取得)
2018-2023: 東京工業大学学士課程(工学院経営工学系)(現・東京科学大学)
2019-2021: 一橋大学科目等特別履修生(商学部)(四大学連合複合領域コースにて)
2015-2018: 福岡県立修猷館高等学校(普通科)
元々「文化祭でどんな順番で展示を置いたらお客さんを喜ばせられるか?」「山奥に新たにコンビニを開店するとしたら、どこに開店した場合最も集客が見込めるか?」といった身近な意思決定の最適化に興味があり、大学では経営工学を専攻しました。
今は、こうした意思決定に関わるシステムを、人々の嗜好が自然と反映された行動データなどを利用して最適化したり、意思決定システム(方策)の良し悪しを評価したりすることに興味があり、意思決定と最適化と機械学習との融合領域で研究しています。
中でも、(現時点で)特に興味のあるテーマは以下の4つです:
① 反実仮想と因果推論
データドリブンな意思決定では過去の意思決定とその結果を元に新たな意思決定方策を評価したり学習したりしますが、過去の意思決定は今とりたい意思決定と同じとは限りません。そこで、「もし仮にこの時点で過去の方策と別の意思決定を選んだ場合にどのような結果になるか?」といった質問に答える必要があり、因果推論やオフ方策評価と呼ばれる研究をしています。
代表論文:Doubly Robust Off-Policy Evaluation for Ranking Policies under the Cascade Behavior Model, An Off-Policy Learning Approach for Steering Sentence Generation towards Personalization.
② 長期的な影響を考慮した意思決定最適化
実世界の意思決定においては、短期的に良さそうに見える意思決定が長期的に良いとは限りません。例えば、Eコマースや音楽配信でのアイテム推薦は、顧客がまだ認知しておらず購買確率が比較的低いアイテムを商品推薦に含めることで、アイテムの目新しさや多様性を確保でき、長期的な満足度増大や売り上げ増加につながると言われています。こうした長期的な効果を考慮した意思決定を行う強化学習の研究をしています。
代表論文:Policy Design for Two-sided Platforms with Participation Dynamics.
③ 意思決定の思わぬ副作用の発見と目的関数の設計
多くの意思決定システムでは、売上などの何かしらの指標(目的関数)を最大化するよう意思決定システムを学習・最適化します。しかし、目的関数の設計の仕方によっては、利用者間での不平等を生んでしまうなど、意図せず望ましくない結果を生じることがあります。こうした意思決定の潜在的な問題に焦点を当て新たに解くべき問題を定式化する研究や、広く社会全体の利益を考える AI for social goods の研究にも取り組んでいます。
代表論文:Towards Assessing and Benchmarking Risk-Return Tradeoff of Off-Policy Evaluation.
④ モデルの推論速度と性能・表現力のトレードオフ
Eコマースでの商品推薦や検索、SNSでのフィード最適化などでは、数百以上にものぼる多くのアイテムを候補として、その中からユーザーに表示するアイテムを迅速に決める必要があります。ここでは、短時間で多くのアイテムを処理し順位づけるためのアルゴリズムが必要不可欠になりますが、こうした高速な推薦を実現するために、"two-tower model" と呼ばれる、ユーザーとアイテムの情報を別々に処理することで高速な推論を可能にするモデルがよく使われます。しかし、このシンプルなモデルにはそのシンプルさ故の表現力の欠如や問題点もあり、こうした欠点をいかに推論速度を落とすことなく解消するための研究をしています。
代表論文:Off-Policy Learning for Diversity-aware Candidate Retrieval in Two-stage Decisions.
自身の研究について紹介する記事など
・(記事)効果的なA/Bテストのためのオフライン評価性能検証指標の新規提案(東工大ニュース)
・(記事)Webデータマイニングのトップカンファレンス「WSDM」にて共著論文採択 by 山本さん
・(記事)SCOPE-RL: 強化学習のオープンソースソフトウェアを公開しました!(1. 内容紹介編)(近日公開)
・(記事)SCOPE-RL: 強化学習のオープンソースソフトウェアを公開しました!(2. 開発裏話編)(近日公開)
自身の執筆したサーベイ記事や解説など
・(記事)ゼロから始めてオフライン強化学習とConservative Q-Learningを理解する
・(記事)強化学習 - 2020論文までの道のり(Q学習中心~R2D3, Agent57)
・(スライド)オフライン強化学習チュートリアル @ 強化学習若手の会
関連するサーベイ記事など
・(特集)人工知能学会誌 - 意思決定のための機械学習 by 梶野さん他
・(記事)私のブックマーク:反実仮想機械学習 by 齋藤さん
その他の研究紹介スライドは Speaker Deck に載せています。
Links: [CV] [Research Statement] [Google Scholar] [Twitter] [GitHub] [SpeakerDeck] [Qiita]
登壇・出演情報
ポッドキャスト、アメリカンナイトGOLDに出演しました。
・(ゲスト出演)#65 - 東工大「奇跡の世代」と巡る!経営工学から広がる世界【コーネル大学 清原さん 前編】
・(ゲスト出演)#66 - アメリカ大学院生ライフ at イサカ【コーネル大学 清原さん 後編】
・(ゲストMC)#67 - 社会人からの大学院留学(ブラック)のサバイバル【Uber 佐藤さん 前編】
・(ゲストMC)#68 - 「シャバ」に戻ってきたエンジニア:SFでの現在と未来【Uber 佐藤さん 後編】
海外大学院留学説明会@東工大2023夏の司会及び会場責任者を務めました。
・(動画)海外大学院留学説明会@東工大の録画配信
・(記事)経営工学の学生が研究のきっかけとPh.D.出願を振り返る
・(スライド)米国大学院出願準備(海外大学院留学説明会@東工大 事前共有資料)
その他の登壇
・東京科学大学の講義、オンライングローバルキャリアセミナー2026冬に登壇予定です。
・東京科学大学の講義、グローバル理工人国内研修2025冬(オンライン)にて登壇しました。
・海外大学院留学説明会@CS・情報系2024冬(オンライン)に登壇しました。
・海外大学院留学説明会@東工大2024夏に登壇しました。
船井奨学金留学レポート
・2025年12月 第六回報告書:PhD candidateになった報告と盛りだくさんの近況(公開予定)
・2025年06月 第五回報告書:研究への取り組みの変化について
・2024年12月 第四回報告書:近況報告とイサカでの生活
・2024年06月 第三回報告書:研究紹介と国際学会参加レポート
・2023年12月 第二回報告書:最初の学期の振り返りと長期的な研究目標
・2023年06月 第一回報告書:留学に至るまでの経緯と学部での研究
研究計画書
PhD出願時のものではありませんが、Research Statement/Statement of Purpose (英文) を公開しています。
[at] を @ に置換してください: hk844 [at] cornell.edu