グラフは点と線で構成されるデータであり,点は実体(人やモノ,事象)を,線は実体間の関係性を表現できる.また,データ表現力の高さから,左図のようにあらゆる情報システムのデータ管理に扱うことができる.さらに,関係性に着目した分析は簡単に知り得ない知識を発見することに期待されている.しかし,グラフは容易に膨大で複雑化するため,グラフ専門のデータベースシステムの開発が盛んに行われている.グラフ検索・分析の効率化には,索引構造やグラフの並列・分散処理方法の提案が必要になる.
【近年の業績】
Kazuma Kusu, Takahiro Komamizu, and Kenji Hatano: ``Towards Efficient Data Access Through Multiple Relationship in Graph-Structured Digital Archives," From Born-Physical to Born-Virtual: Augmenting Intelligence in Digital Libraries. ICADL 2022. Lecture Notes in Computer Science, Vol.13636, pp.377--391, 2022. DOI:10.1007/978-3-031-21756-2_29
Kazuma Kusu, Takahiro Komamizu, Kenji Hatano: ``Towards Constructing Destination Node Index for Repetition Paths," IPSJ SIG Technical Report, Vol.2022-DBS-175, No.15, September 2022.
日本語や英語などの人間が利用する言語を計算機で扱う分野である.最近では,OpenAI社のChatGPT や Meta AI のLLaMA などの大規模言語モデル(LLM)が登場したことでも非常に有名になった.一般的に,言語モデルに文書を入力する前には,あらかじめ文書を単語や文字などの単位に分割する必要がある.しかし,カテゴリ分類や機械翻訳などの実タスクにおいて,事前に文書を分割する方法が実タスクに悪影響を及ぼす可能性がある.そこで,既存のLLM を利用して実タスクの性能を向上させる方法論の一つとして,そのタスクに適した分割方法になるように事前に分割した単位を結合・認識する方法が必要となる.
【近年の業績】
Yusuke Kimura, Takahiro Komamizu, and Kenji Hatano: ``An Automatic Labeling Method for Subword-Phrase Recognition in Effective Text Classification,'' Informatica, SDI, 2023. (in press)
木村 優介,駒水 孝裕,波多野 賢治: ``文書分類における効果的なマルチタスク学習のための汎用的サブタスクの要件分析," 電子情報通信学会技術研究報告, Vol.122, No.449, pp.38-43, March 2023.
Yusuke Kimura, Takahiro Komamizu and Kenji Hatano: ``Multi-task Learning-based Text Classification with Subword-Phrase Extraction," Proceedings of the 11th International Symposium on Information and Communication Technology, pp.23--30, December 2022. DOI:10.1145/3568562.3568635
【近年の業績】
寺本 優香, 駒水 孝裕, 波多野 賢治: ``固有表現タグおよびPOSタグによる交換制約付きデータ拡張手法," 第15回データ工学と情報マネジメントに関するフォーラム予稿集, No.1b-6-4, March 2023.
食は人間にとって必須活動であるが,近年のレシピサイトの普及から盛んにAI技術を用いて健康支援やレシピ推薦などの技術を開発する食メディア研究が着目されている.食に関わるまつわる情報は多種多様なマルチメディアであり,単一のモデルで扱うことは困難である.そこで,有機的に影響を及ぼし合うレシピー食材ー化合物の関係性を加味したグラフモデルを構築し,それぞれの要素の特徴を反映した低次元ベクトル(分散表現)を構築する.これにより各エンティティを計算機で扱うことが可能になるため,多くの応用に対応できる汎用的な技術になる.
【近年の業績】
Naoki Yoshimaru, Kazuma Kusu, Yusuke Kimura, and Kenji Hatano, ``Ingredient Embeddings Constructed by Biased Random Walk on Ingredient-Compound Graph'', Procedia Computer Science, Elsevier, September 2023. (to appear)
吉丸 直希, 楠 和馬, 波多野 賢治: ``化合物情報に基づく食材の表現学習," 第15回データ工学と情報マネジメントに関するフォーラム予稿集, No.5b-8-4, March 2023.
【近年の業績】
神田 悠斗, 波多野 賢治: ``画像特徴量のロバスト性に着目した教師なし敵対的サンプル検知," 情報処理学会第 85 回全国大会講演論文集, Vol.第2分冊, pp.955--956, March 2023.
推薦システムは,多くの情報から必要な情報を推薦することで,情報を閲覧する時間を短縮できる.推薦システムでは,各ユーザに特化した推薦を行うために,個人化された推薦を行う必要がある.そのため,ユーザの行動順序を表す系列データを使用し,ユーザの行動や特徴を推薦に反映する.近年の推薦システム分野では,新しい行動データが生じた際に,そのデータのみをリアルタイムで反映し,学習可能な強化学習が注目されている.