2021/6/9(08:40 - 10:40

OS-6 移動系列のデータマイニングと機械学習

(JSAI2021)https://www.ai-gakkai.or.jp/jsai2021/os#os-6

(参加者のみ)https://confit.atlas.jp/guide/event/jsai2021/session/2D01-05/category

招待講演(08:40 〜 09:20)

公共交通オープンデータの現状と可能性 

社会がデータを使いこなすために何をなすべきか

伊藤 昌毅 (東京大学)

キーワード:GTFS、公共交通オープンデータ、デジタルトランスフォーメーション

コロナ禍の中で国や自治体のIT活用の未熟さが明らかになり、データに基づいた政策立案(EBPM)も困難な中、公共交通、特にバスにおいては都バスをはじめとして全国でデータ整備やオープンデータ化が活発に行われ、その活用が待ったなしである。現在はGoogle Mapsなどのアプリへの採用を第一の目的としてデータ公開が進んでいるが、公開されているダイヤやバスロケ(GPS)データを分析し、データに基づいた公共交通政策を実現することが次の課題として重要である。

この講演では、バス業界においてデータ整備に注目が集まり、オープンデータが進んだ経緯を紹介しながら、ITと縁遠い領域でのデジタルトランスフォーメーション(DX)について議論する。また、データの詳細や扱い方を具体的に紹介しながら、公共交通政策の立案にどのようにデータを活用できるかを検討する。コロナ禍によって公共交通の利用者が大きく減少する中、コロナ後の公共交通の在り方を見据えつつ、データを活用してより効率的で効果的な公共交通の運用を実現することは急務である。本講演を通して、様々な分野で当たり前にデータを活用する社会を実現する方法を考えたい。

研究発表(09:20 〜 10:40)

グラフニューラルネットワークとデータ同化を統合したデータ駆動型避難者分布予測モデルの構築 (09:20 〜 09:40)

〇高崎 弾1、小川 芳樹1、今泉 允聡1、沖 拓弥2、大山 雄己3

(1. 東京大学、2. 東京工業大学、3. 芝浦工業大学)

キーワード:避難行動、物的被害、グラフニューラルネットワーク、データ同化、シミュレーション

大地震発生直後,人々の滞留状況や避難状況をリアルタイムに把握することは重要だが,計算時間短縮や予測精度向上が課題である.前稿[沖・小川 2020]では,エージェントベースシミュレーションで得た避難行動軌跡をクラスタリングした上で,LSTMで個々人の軌跡予測を試みたが,精度は不十分であった.本稿では,道路リンク・時間単位の避難者数分布を効率的かつ精度良く予測するために,グラフニューラルネットワーク(GNN)とデータ同化を統合した,データ駆動型の新たな避難者分布予測モデルの構築を目的とする.具体的には,まず,Gretel [Cordonnier et al. 2019]と呼ばれるGNNモデルに,前稿と同様の避難行動軌跡データを学習させ,ノードから接続道路リンクへの移動確率に相当する尤度分布を得る.次に,この尤度分布と初期避難者分布から得られる確率的な予測避難者分布に,データ同化手法の一つであるパーティクルフィルタを適用し,擬似的な観測避難者分布(エージェントベースシミュレーション結果)との誤差を減少させる.さらに,これを逐次計算することで,避難者分布予測の高速化・高精度化が期待できることを示す.


緯度経度情報追加による行動履歴分散表現の高精度化 (09:40 〜 10:00)

〇佐賀 健志1,2、田中 宏季1,2、中村 哲1,2 (1. 理化学研究所 革新知能統合研究センター 観光情報解析チーム、2. 奈良先端科学技術大学院大学)

キーワード:行動解析、時系列データ、分散表現、双方向LSTM、階層的クラスタリング

近年、スマートフォンなどのウェアラブル端末普及に伴い、ユーザーの行動履歴をビッグデータとして利用することが可能になってきた。これに伴い、人流解析の観点から似た行動をとるユーザをニューラルネットワークやクラスタリングを利用して分析する試みが行われてきた。先行研究では、時系列のメッシュIDを双方向LSTMの入力情報として学習させることで、ユーザー埋め込みの生成を行っていた。しかし、メッシュIDは人為的に割り振っているためID間の位置的関係や距離などを考慮しておらず、メッシュIDのみからだけではユーザー埋め込みの学習がうまくいかない可能性があった。この問題を解決するため、本研究では入力情報として緯度経度の情報を加えることでモデル性能の向上を試みた。その結果、時系列メッシュID予測の精度向上やユーザ埋め込みを利用したクラスタリング結果に違いが確認された。

追跡行動における内部表象を介したターゲット運動の柔軟な予測 (10:00 〜 10:20)

〇筒井 和詩1、藤井 慶輔1,2、工藤 和俊3、武田 一哉1 (1. 名古屋大学、2. 理化学研究所、3. 東京大学)

キーワード:予測、外挿、追跡

われわれの感覚運動系には遅延があるため、熟練した捕捉行動を実現するためには、外部物体の動きを正確に予測する必要がある。感覚運動遅延に対処するために、脳は現在の状態に基づいて将来の状態を予測するが、過去の経験から得られた内部表象を利用するかどうかについては未だ議論されている。本研究では、ターゲットの急激な方向転換に対する追跡者の反応行動を分析することでその予測方法を推定し、追跡者によるターゲットの動きの予測が現在のターゲットの状態のみに基づく線形外挿では説明できないことを示した。さらに、ニューラルネットワークモデルを用いて、推定されたような非線形外挿が計算上実現可能であり、未知の相手に対しても有用であることを示した。これらの結果は、ターゲットの動きを予測する際の内部表象の利用を支持するものであり、内部表象を用いて外部物体の動きを予測することの有用性と汎用性を示唆している。


予測に基づく集団行動系列の評価:サッカーのチーム守備への適用 (10:20 〜 10:40)

戸田 康介2、寺西 真聖1、久代 恵介2、〇藤井 慶輔1,3,4 (1. 名古屋大学、2. 京都大学、3. 理化学研究所、4. JSTさきがけ)

キーワード:スポーツ、移動系列、マルチエージェント

計測技術の発展を背景に、様々なスポーツの実際の試合の動きに関するデータが利用可能になり、戦略や評価への活用が期待されている。その中でも集団スポーツの守備は、複数人で行われ個人としての記録が困難なため、一般的に評価が難しい。従来の得点予測に基づく評価手法は、試合全体では希少な事象を予測するため評価が安定しない点や、得失点に至るまでの多様なプレーの評価が困難である。一方、得点に至る特定のプレーや支配領域などの評価手法は、選手やチームを総合的な成績(得失点など)と関連付けて評価することが難しい。そこで本研究では、選手の行動と全選手・ボールの位置情報を利用した、希少な得失点より発生頻度の多いボール奪取や被有効攻撃の予測に基づく、チーム成績と関連する総合的な観点から、チームの守備評価を行う手法を提案する。実験ではサッカー45試合のデータを用いて、実際の試合の得失点との関係や、シーズンを通したチームの成績との関係について検証した。

オーガナイザ

藤井 慶輔(名古屋大学大学院情報学研究科)

竹内 孝(京都大学大学院情報学研究科)

竹内 一郎(名古屋工業大学大学院工学研究科)

田部井 靖生(理化学研究所革新知能統合研究センター)

依田 憲(名古屋大学大学院環境学研究科)

前川 卓也(大阪大学大学院情報科学研究科)

本OS: 移動系列のデータマイニングと機械学習について

計測技術の発展によって、様々な生物や人工物の移動の記録が可能になりました。これを背景に、多岐にわたる社会や科学分野への貢献、例えば、小型GPSを装着した野生の動物の行動データから動物の生態の理解、車両の移動データから様々なリソース配分の効率化、カメラから得られたスポーツ選手の行動データからスキルの評価などが期待されています。このように移動系列を解析する手法の重要性が高まっていますが、対象を越えて移動系列が持つ普遍的性質を扱う方法や、その性質を用いて高度な予測を行う人工知能技術は存在せず、従来の研究は対象毎に個別の領域で研究が行われるに留まっています。そこで、本OSでは、解析手法の1つであるデータマイニングや機械学習技術を軸足とし、対象間に共通する問題やその上で更に個別の議論を行うことで、各領域や共通の問題の解決を行っていきます。

本OSは、工学、コンピュータ科学、生物学、神経科学、スポーツ科学などを専門にする研究者が、記録されたヒト、動物、自動車などの軌跡・活動・行動データの解析方法について機械学習など人工知能分野の技術を用いた議論する場となることを期待しています。本OSのオーガナイザには、科研費新学術領域「生物ナビゲーションのシステム科学(生物移動情報学)」への参画者が多く含まれており、ヒトや車両などの公開データだけでなく、様々な生物行動の貴重な計測データの研究も発表される予定です。関心のあるテーマとして、生物・人工物の軌跡・活動・行動データに関する以下の例がありますが、これらを超えた領域からの参加など分野の創出と発展を期待しています。


テーマの例:

  • データマイニング、機械学習、時系列分析

  • 認識、予測、可視化、知識抽出

  • モデリング、強化学習

  • 位置推定、データ前処理、ラベリング

  • モニタリングおよび認識システムなどへの応用


キーワード

  • 時空間データ

  • データマイニング

  • 機械学習

  • 生物モデル

  • 軌跡・活動・行動データの情報処理