このページではランダムオブジェクト解析に関するこれまでの研究をまとめています.
ランダムオブジェクト解析 (random object analysis,他にも metric statistics や object-oriented data analysis とも呼ばれます)とは,距離空間に値をとるデータを統一的に扱う統計科学の分野です.
距離空間データの例:関数データ,確率分布データ,ネットワークデータ,行列データ,組成データ,方向データ,形状データ,系統樹データ etc.
統計解析
非定常関数値時系列データの主成分分析
・Kurisu (2021) arXiv
・カーネル平滑化による非定常関数データの時変共分散オペレータの推定
・共分散オペレータ推定量とそれに対応する固有値,固有ベクトルの収束レートの導出
・カーネル平滑化による局所平均のガウス過程への収束の証明,収束先のガウス過程の共分散カーネルの推定量の提案
・主結果の拡張として,(a) 非定常関数データの局所トレンド推定,(b) 2つの独立な非定常関数値時系列データのトレンドが局所的に等しいかどうかの検定(局所二標本検定)を提案
非定常関数値時系列データの回帰分析
・Kurisu (2022) EJS, publication (open access)
・アウトカム(スカラー値)が非定常関数データと時間に依存するトレンド+観測誤差で得られるノンパラメトリックな回帰モデルの提案
・カーネル平滑化による回帰関数の推定量の構成
・推定量の中心極限定理と一様収束レートの導出
大域的フレシェ回帰のモデル平均
・Kurisu and Otsu (2025) JMVA, publication (open access)
・モデル平均推定量の提案
・Leave-one-out cross validation (LOOCV)を利用した最適なモデル重みの選択法の提案
・LOOCVで選んだ重みをもつモデル平均推定量が final prediction error の下で最適であることの証明
経験尤度を用いた多様体データの一般化フレシェ平均の推定・検定
・Kurisu and Otsu (2025+) JRSSB publication, working paper
・一般化フレシェの経験尤度(empirical likelihood, EL)推定量の構成
・EL推定量の漸近的性質(主結果)
・EL推定量の smeariness に対する頑健性
・主結果の拡張:二標本検定,ベイジアンEL,フレシェ平均周りのモーメント(例:フレシェ分散)の推定・検定,局所EL推定(ノンパラメトリック回帰),一般化フレシェ平均集合の推定
・応用例:
(i) カメの移動方向データ(円周データ)のフレシェ平均・メディアンの推定と信頼領域の計算
(ii) 仮想地磁気極の方向データ(球面データ)のフレシェ平均・メディアンの推定と信頼領域の計算
(iii) 体重の重い/軽いマウスのグループの胸椎形状データ(形状空間 or ランドマークデータ)の二標本検定
因果推論 (*: 共同第一著者)
関数データを共変量として利用した因果推論
・Kurisu, Otsu, and Xu (2025+) JBES, publication (open access)
・関数データを共変量として利用した平均処置効果の推定法の提案
・逆確率重み付け法を用いた推定量の提案
・推定量の漸近正規性とブートストラップ法による信頼区間の構成法の提案
・応用例:金融政策がインフレ率,失業率などに与える影響の分析
測地平均処置効果 (Geodesic Average Treatment Effect, GATE)
・Kurisu*, Zhou*, Otsu, and Müller (2024) publication, arXiv
・測地距離空間に値をとるアウトカムに対する因果推論の枠組みを導入
・GATEの導入とその推定方法として(a) アウトカム回帰, (b) 逆確率重み付け, (c) 二重頑健法, (d) クロスフィッティングの4種類を提案
・全ての推定量の収束レートを導出,有限標本で妥当な被覆確率をもつ信頼区間の計算方法を提案
・応用例:
(i) 石炭生産がアメリカの各州の電力データ(組成データ)に与える影響の分析
(ii) 新型コロナ新規感染者数がニューヨークタクシーネットワークデータ(グラフデータ)に与える影響の分析
(iii) アルツハイマー病が脳機能ネットワークデータ(正定値行列データ)に与える影響の分析
測地差の差法 (Geodesic Difference-In-Differences, GDID)
・Zhou*, Kurisu*, Otsu, and Müller (2025) publication, arXiv
・処置群におけるGATE (Geodesic Average Treatment effect on the Treated, GATT) の導入
・測地線輸送マップを用いたGATTの識別,推定量の漸近的性質を導出
・GDIDの拡張として,グループごとに処置のタイミングが異なる場合のGDID (Geodesic staggered DID) も提案
・応用例:
(i) 電力自由化がアメリカの各州の電力源データ(組成データ)に与える影響の分析
(ii) ソ連崩壊が欧州国の年齢別死亡率データ(分布データ)に与える影響の分析
測地合成コントロール法 (Geodesic Synthetic Control Method, GSCM)
・Kurisu*, Zhou*, Otsu, and Müller (2025a) publication, arXiv
・処置ユニットにおける因果効果の導入と識別
・応用例:
(i) 東日本大震災が宮城県の産業別労働人口比率データ(組成データ)に与える影響の分析
(ii) 東ドイツの中絶認可が年齢別出生率データ(関数データ)に与える影響の分析
・GSCMの拡張:
・回帰モデルを用いた拡張測地合成コントロール法 (augmented GSCM, AGSCM) を提案
・GSCとGDIDを組み合わせた測地合成差の差法 (Geodesic Synthetic Difference-In-Differences, GSDID) を提案
・GSDIDの応用例:ソ連崩壊がロシアの年齢別死亡率データ(分布データ)に与える影響の分析
測地回帰非連続デザイン (Geodesic Regression Discontinuity Design, GRDD)
・Kurisu*, Zhou*, Otsu, and Müller (2025b) publication, arXiv
・測地シャープ/ファジー回帰非連続デザインの枠組みを提案 (GSRDD/GFRDD)
・GSRDD:カットオフでの LATE (Geodesic Local Average Treatment Effect, GLATE) の導入と識別,推定量の漸近的性質を導出
・GFRDD:カットオフでの遵守者に対する LATE (compliers' (Geodesic) Local Average Treatment Effect, compliers' (G)LATE) の導入と識別,推定量の漸近的性質を導出
・応用例 (GSRDD):
(i) 台湾における台北地下鉄開通が高速道路周辺の大気中の一酸化炭素濃度(関数データ)に与える影響の分析
(ii) イギリスの選挙において前回の保守党の勝敗が今回の3大政党の得票率(組成データ)に与える影響(現職効果)の分析