中野 優(なかの ゆう)
Software Engineer (Search)
Email: yu.nakano6 [at] gmail.com
Researchmap: researchmap.jp/yu_nakano
Email: yu.nakano6 [at] gmail.com
Researchmap: researchmap.jp/yu_nakano
検索システムに関わるソフトウェアエンジニア/データエンジニアをしています.過去には情報検索の研究をおこなっており,主に表形式データをキーワードやテキストをクエリとして検索するアルゴリズムの研究を行っていました.その他にもデータマイニング技術の応用研究も行っており,学術論文や移動データを対象として研究を行っていました.
2025/07/01: SIGIR 2025 に参加予定です.
2025/05/24: IR Reading 2025 春において,生成検索エンジン最適化に関して 2 本の論文を紹介しました.スライド
2024/12/30: DEIM 2025 に参加予定です.
2024/12/09: 所属先企業で実施している論文読み会の取り組みについて紹介したブログが公開されました.リンク
2024/12/09: SIGIR-AP 2024 に参加します.
2024/11/09: IR Reading 2024 秋において,SIGMOD 2024 の論文を紹介しました.スライド
2024/06/15: IR Reading 2024 春において,WSDM 2024 の論文を紹介しました.スライド
2024/02/28: DEIM 2024 に参加します.
2023/04/01: ソフトウェアエンジニアとして就職しました.
2023/11/18: IR Reading 2023 秋において,SIGIR 2023 の確率的な埋め込み表現を用いた密ベクトル検索に関する論文を紹介しました.
2023/06/10: IR Reading 2023 春において,EMNLP 2022 の学習済み疎検索 (Learned Sparse Retrieval) に関する論文を紹介しました.スライド
2023/04/01: ソフトウェアエンジニアとして就職しました.
2023/03/10: DEIM 2023 での主著論文の発表に対して,学生プレゼンテーションが授与されました. リンク
2023/02/04: DEIM 2023 で 2 件の論文を発表します.
中野優,加藤誠.被引用統計データのセル特定手法の検討.
仲地優登,中野優,加藤誠.事前学習言語モデルに基づく質問応答のプログラミング言語リファレンスへの適用.
2023/01/27: 日本データベース学会データドリブンスタディーズに採択された論文が公開されました. リンク
2022/12/14: ACM CHIIR 2023 に E-sports の視聴者コメントデータセットのデータセット作成の論文が採択されました. リンク
2022/11/12: IR Reading 2022 秋において,NeurIPS 2022 の生成的検索 (Generative Retrieval) に関する論文を紹介しました.スライド
2022/09/05: 統計データのセル特定データセットの作成に関する論文が日本データベース学会の論文誌(データドリブンスタディーズ)に採択されました.
2022/08/01: TheWebConf 2022 参加報告を DBSJ Newsletter に寄稿しました.リンク
2022/06/25: 第 42 回先端的データベースと Web 技術動向講演会(ACM SIGMOD 日本支部第 79 回支部大会)において,TheWebConf 2022 の参加報告を行いました.スライド
2022/05/21: IR Reading 2022 春において,CIKM 2021/WSDM 2022 で発表された密ベクトル検索 (Dense Retrieval) の軽量化に関する 2 本の論文を紹介しました.
2022/03/02: DEIM2022 において学生プレゼンテーション賞とスポンサー賞 (日本電気株式会社賞) を受賞しました.リンク
2022/02/28: DEIM2022 において統計データのセル特定に関する論文を発表しました.
2021/11/02: JST の「次世代研究者挑戦的研究プログラム」に採択されました (期間: 1 年半,総額: 4,350,000 円).
2021/10/31: IR Reading 2021秋において,SIGIR 2021 で発表された Bias に関する 2 本の論文を紹介しました.スライド
2021/10/23: RecSys2021論文読み会において,Bot を使って検索結果や推薦結果のフィルターバブルを検証した論文を紹介しました.スライド
2021/10/14: 論文誌(情報処理学会論文誌データベース)に採択された統計データ検索に関する論文が公開されました.リンク
2021/07/03: 検索用ライブラリの Anserini とその Python 版である Pyserini において,日本語の解析器として kuromoji を使用できるようになりました(Anserini v0.13.1, Pyserini 0.13.0)
2021/07/01: 統計データ検索に関する論文が論文誌(情報処理学会論文誌データベース)に採録されました.
2021/04/24: IR Reading 2021春 において,GPT-2 のテキスト生成を利用して教師なしに Web ページの質を推定するモデルを作成する WSDM 2021 の論文を紹介しました.スライド
2021/03/03: DEIM2021 において学生プレゼンテーション賞を受賞し,DEIM2021 の活性化に貢献したことに対する感謝状が授与されました. リンク
2021/03/02: DEIM2021 において統計データ検索に関する論文を発表しました.
2021/01/15: 情報処理学会の学会誌「情報処理」の 2 月号に SIGIR 2020 の参加報告が掲載されました.リンク
2020/11/29: 日本計算機統計学会 第34回シンポジウムにおいて,昨年度のデータ解析コンペティションで取り組んだタクシーの移動データの分析に関する論文を発表しました.論文は J-STAGE にて公開される予定です.
2020/10/30: IR Reading 2020秋 において,SIGIR 2020 の表検索に関する 2 本の論文を紹介しました.スライド
2020/06/21: IR Reading 2020春 において,The WebConf 2020 (WWW 2020) の表検索の論文を紹介しました.スライド
2020/04/01: 筑波大学の博士後期課程に進学しました.
検索システムに関わるソフトウェア開発とデータエンジニアリング
オープンデータ利活用のためのデータ検索エンジンの構築
数量データに基づくWeb情報の信頼性検証と高信頼情報の生成
検索結果のランキングの改善に関する調査と実装多様化の手法・評価指標の調査検討と実装
図書館学及び情報学と新型コロナウィルスに関する研究
データ分析プラットフォーム Alkano における基盤機能 MSIP の開発
データ分析
状態空間モデルを用いた時系列予測,深層強化学習を用いた最適化
スケジューリング問題に関する研究開発
筑波大学大学院人間総合科学学術院人間総合科学研究群情報学学位プログラム知識獲得システム研究室(加藤研究室)
研究テーマ: 統計データへの引用を用いたファクトチェック
京都大学情報学研究科
修士論文: Tagging Scholarly Papers Using Taxonomy of Survey Articles
指導教員: 吉川正俊教授
京都大学工学部情報学科
卒業論文: 共引用情報を利用した論文関係グラフの提示
指導教員: 吉川正俊教授
誤引用検証のための被引用統計データの検索とセル特定(DEIM 2021,IPSJ-TOD 2021,DEIM 2022,DBSJ DDS 2023,DEIM 2023)
Web ページなど長い文章をクエリとして e-Stat や data.gov などの政府統計データを検索し,表のセルを特定する研究です.
関連するキーワード: データ検索,アドホック表検索(短いキーワードクエリを入力として表形式データを検索する研究),表質問応答(与えられた表と質問から,表の内容を元に質問に答える研究)
学術論文に対するデータマイニング
共引用関係を用いた論文関係の可視化(DEIM 2016,ICADL 2016)
サーベイ論文を用いた統制の取れた専門用語のタグ付け(WebDB Forum 2017)
外れ値検出を用いた新分類論文の発見
勾配ブースティング木を用いたタクシープローブデータからの退職者予測(日本計算機統計学会 第 34 回シンポジウム)
中野優,加藤誠.被引用統計データのセル特定データセットの構築.日本データベース学会 データドリブンスタディーズ,Vol.1(1), 2023. リンク
中野優,加藤誠.クエリと文書のフィールドを考慮した被引用統計データの検索.情報処理学会論文誌 データベース,Vol.14(4), pp.49-60, 2021. リンク
Junjie H. Xu, Yu Nakano, Lingrong Kong, Kojiro Iizuka. CS-lol: a Dataset of Viewer Comment with Scene in E-sports Live-streaming. In Proceedings of the 2023 ACM SIGIR Conference on Human Information Interaction and Retrieval (CHIIR 2023), Austin, Texas, March 19-23. (to appear) preprint
Yu Nakano, Toshiyuki Shimizu, Masatoshi Yoshikawa. A Visualization of Relationships Among Papers Using Citation and Co-citation Information. In Proceedings of the 18th International Conference on Asia-Pacific Digital Libraries (ICADL 2016), Tsukuba, Japan, December 7-9, 2016. Link
中野優,加藤誠.被引用統計データのセル特定手法の検討.第 15 回データ工学と情報マネジメントに関するフォーラム (DEIM 2023),オンライン,2023 年 3 月 (口頭発表・ポスター) 学生プレゼンテーション賞受賞
仲地優登,中野優,加藤誠.事前学習言語モデルに基づく質問応答のプログラミング言語リファレンスへの適用.第 15 回データ工学と情報マネジメントに関するフォーラム (DEIM 2023),オンライン,2023 年 3 月 (口頭発表・ポスター)
Makoto P. Kato, Hiroaki Ohshima, Ying-Hsang Liu, Hsin-Liang Chen, Yu Nakano. Overview of the NTCIR-16 Data Search 2 Task. In Proceedings of the 16th NTCIR Conference Evaluation of Information Access Technologies (NTCIR-16), Tokyo, Japan, June 14-17, 2022.
中野優,加藤誠.被引用統計データのセル特定データセットの構築.第 14 回データ工学と情報マネジメントに関するフォーラム (DEIM 2022),オンライン,2022 年 3 月 (口頭発表・ポスター) 学生プレゼンテーション賞/スポンサー賞 (日本電気株式会社賞)/優秀インタラクティブ賞受賞
中野優,加藤誠.誤引用検証ための被引用統計データの検索.第 13 回データ工学と情報マネジメントに関するフォーラム (DEIM 2021),オンライン,2021 年 3 月 (口頭発表) 学生プレゼンテーション賞受賞
中野優,藤本勇希,高橋海斗.タクシープローブデータを用いた退職者予測.日本計算機統計学会第 34 回シンポジウム,オンライン,2020 年 11 月 (口頭発表)
藤本勇希,中野優,高橋海斗.タクシープローブデータを用いた退職者予測.令和元年度データ解析コンペティション 日本計算機統計学会データ解析スタディグループ部会 (CS-DAS),東京.2020 年 2 月 (口頭発表) 優秀賞(一般部門)受賞
中野優.サーベイ論文の節構造を用いた論文に対するタグ付けの検討.関西データベースワークショップ 2017,兵庫,2017 年 9 月 (ポスター)
中野優,清水敏之,吉川正俊.サーベイ論文の節構造を用いた論文に対するタグ付けの検討.第 10 回 Web とデータベースに関するフォーラム (WebDB Forum 2017),東京,2017 年 9 月 (口頭発表・ポスター)
中野優,清水敏之,吉川正俊.共引用情報を利用した論文関係グラフの提示.第 8 回データ工学と情報マネジメントに関するフォーラム (DEIM 2016),福岡,2016 年 3 月 (口頭発表・ポスター)
中野優.会議レポート ACM SIGIR 2020 会議報告.情報処理 Vol.62(2), pp.104-205, 2021. リンク
中野優.TheWebConf 2022 参加報告.DBSJ Newsletter Vol. 15 (4), 2022. リンク
中野優.論文紹介: Accelerating Learned Sparse Indexes Via Term Impact Decomposition (Findings of EMNLP 2022).IR Reading 2023 春,オンライン,2023 年 6 月 10 日.スライド
中野優.論文紹介: Transformer Memory as a Differentiable Search Index (NeurIPS 2022).IR Reading 2022 秋,オンライン,2022 年 11 月 12 日.スライド ブログ
中野優,笹治拓矢,丸田敦貴,柳田雄輝,薄羽皐太,新田洸平.The ACM Web Conference 2022 国際会議報告.第 42 回先端的データベースと Web 技術動向講演会(ACM SIGMOD 日本支部第 79 回支部大会),東京,2022 年 6 月 25 日.スライド(中野担当分)
中野優.論文紹介: Jointly Optimizing Query Encoder and Product Quantization to Improve Retrieval Performance (CIKM 2021) & Learning Discrete Representations via Constrained Clustering for Effective and Efficient Dense Retrieval (WSDM 2022).IR Reading 2022 春,オンライン,2022 年 5 月 21 日.
中野優.論文紹介: Societal Biases in Retrieved Contents: Measurement Framework and Adversarial Mitigation of BERT Rankers (SIGIR 2021) & Leveraging Lead Bias for Zero-shot Abstractive News Summarization (SIGIR 2021).IR Reading 2021秋,オンライン,2021 年 10 月 30 日.スライド
中野優.論文紹介: An Audit of Misinformation Filter Bubbles on YouTube: Bubble Bursting and Recent Behavior Changes (RecSys 2021 Best Paper Award).RecSys2021論文読み会.スライド
中野優.論文紹介: Generative Models are Unsupervised Predictors of Page Quality: A Colossal-Scale Study (WSDM 2021 Best Paper Runner-up Award).IR Reading 2021春,オンライン,2020 年 10 月 30 日.スライド
中野優.論文紹介: Web Table Retrieval using Multimodal Deep Learning (SIGIR 2020) & Table Search Using a Deep Contextualized Language Model (SIGIR 2020).IR Reading 2020秋,オンライン,2020 年 10 月 30 日.スライド
中野優.論文紹介: Ad Hoc Table Retrieval using Intrinsic and Extrinsic Similarities (TheWebConf 2020).IR Reading 2020春,オンライン,2020 年 6 月 21 日.スライド
2023 年 3 月: DEIM 2023 学生プレゼンテーション賞
2022 年 5 月: DEIM 2022 優秀インタラクティブ賞 (11/127=8.7%)
2022 年 3 月: DEIM 2022 スポンサー賞(日本電気株式会社賞)
2022 年 3 月: DEIM 2022 学生プレゼンテーション賞
2021 年 3 月: DEIM 2021 感謝状(積極的に DEIM の活性化に貢献したことに対して)
2021 年 3 月: DEIM 2021 学生プレゼンテーション賞
2020 年 2 月: 令和元年度 データ解析コンペティション 日本計算機統計学会スタディーグループ 優秀賞
2017 年 6 月: 統計検定 2 級 成績優秀者(評価 A)
2011 年: 平成 23 年度 京都数学コンテスト 奨励賞
JST 次世代研究者挑戦的研究プログラム
研究課題: 数量情報を含む文書の検証のための被引用統計データの特定
採択区分1: 特に優秀な学生 (研究費総額: 750,000 円,生活費相当額: 200,000 円/月)
期間: 2021/10〜2023/03 (1 年半)
グラント番号: JPMJSP2124
2017 年度後期: 計算機科学実験及演習4 (TA),京都大学工学部情報学科計算機科学コース
2017 年度前期: データベース (TA),京都大学工学部情報学科計算機科学コース
2016 年度後期: 計算機科学実験及演習4 (TA),京都大学工学部情報学科計算機科学コース
2021 年〜2022 年: NTCIR-16 Data Search 2 Task Organizer
2017 年 8 月: SIGIR 2017 Student Volunteer
ACM
日本データベース学会
情報処理学会
言語処理学会
ACM SIGIR 東京支部
Programming languages: Python, C, C++, Java, JavaScript
Search Engine: Elasticsearch, Opensearch, Apache Lucene, Anserini
Cloud: AWS, Google Cloud
OS: MacOS, Linux (esp. Ubuntu, CentOS7/8)
日本語(native),英語(TOEIC score: 845 (2015 年)).
AtCoder などの競技プログラミングのコンテストに参加しています.いくつかの国内大会の本戦に出場したことがあります(CODE RUNNER 2015,Code Festival 2015-2016,DISCO presents ディスカバリーチャンネル コードコンテスト 2016,Code Thanks Festival 2017,(第一回)全国統一プログラミング王,第 4 回 RECRUIT 日本橋ハーフマラソン,HACK TO THE FUTURE 2022).かつては京都大学プログラミングコンテスト 2016/2017 の運営として作問・テスターをしていました.