ベイズ統計サマーシンポジウム
@北海道大学
『2024年度 ベイズ統計サマーシンポジウム』
日時:2024年9月12日(木)-13日(金)
場所:北海道大学札幌キャンパス (人文・社会総合教育研究棟W棟1F W102教室) キャンパスマップ
懇談会:9月12日(木) 18:30- @カフェ de ごはん (北海道大学構内)
オーガナイザー:菅澤 翔之助 (慶應義塾大学)、伊藤翼 (北海道大学)、入江 薫 (東京大学)、橋本 真太郎 (広島大学)、小林弦矢 (明治大学)、中川智之 (明星大学)
プログラム
* 講演時間:20分 (質疑応答込み)
9月12日 (木)
10:00-12:10 セッション1 (座長: 入江 薫)
「2次不偏なベイズ推定量の導出とその性質」
酒井真菜 (東京大学)
一般に、ベイズ推論において、事後平均はパラメータの不偏推定量になるとは限らない。本研究では、2次不偏な事後平均を生成する事前分布が存在するのはどのようなときか、そして存在する場合、その事前分布をどのようにして構成できるかを考察する。
「共分散行列に対する一般化ベイズ推定量」
湯浅良太 (統計数理研究所)
正規分布の共分散行列の推定に関して、積分を含まないシンプルな形で一般化ベイズ推定量を得る事が出来る. 標本共分散行列に対しての優越性を示すには、リスクの不偏推定量を用いる議論とリスクを直接的に評価する議論の2つがある. この2つの方法で優越性について検討する.
「日本の投資家にとっての代替資産への最適投資比率の考察」
大西裕子
日本において投資の裾野が広がりつつあるが、いまだに株式や債券といった伝統的資産への投資が中心となっている。一方で代替資産の種類とその流動性、知名度も上がりつつある。日本の投資家が、ポートフォリオとして資産運用を行う場合には代替資産への最適な投資比率や上限というのは存在するのだろうか。ベイズ推定の枠組みを用いた頑健なポートフォリオ推定から、その比率についての考察を深める。
「Stochastic Volatility in Mean: Efficient Analysis by a Generalized Mixture Sampler」
平木大智 (東京大学)
The simulation-based Bayesian analysis of stochastic volatility is considered in mean (SVM) models. Extending the highly efficient Markov chain Monte Carlo mixture sampler for the SV model proposed in prior studies, an accurate approximation of the non-central chi-squared distribution is developed as a mixture of thirty normal distributions. Under this mixture representation, the parameters and latent volatilities are sampled in one block. A correction of the small approximation error is also detailed by using additional Metropolis-Hastings steps. The proposed method is extended to the SVM model with leverage. The methodology and models are applied to excess holding yields in empirical studies, and the SVM model with leverage is shown to outperform competing volatility models based on marginal likelihoods.
「Conjugate analysis in binary probit regression with Gaussian process prior」
桃﨑智隆 (東京理科大学)
ガウス過程を伴うbinary regression は時空間データ解析などの様々な場面で活用され、ベイズの枠組みでも広く研究されている。しかし、多くの推定法はMCMCなどの高コストな計算アルゴリズムが用いるため膨大な計算資源を要する。本発表では、ガウス過程を伴うbinary probit regressionにおける共役性に着目し各パラメータの事後分布や事後予測分布を導出する。また、それらの計算アルゴリズムについても言及する。
「General Bayesian Quantile Regression of Count via Generative Modeling」
山内雄太 (名古屋大学)
離散確率変数の条件付き累積分布に関する推論に基づいて,離散応答変数に対する分位点回帰モデルの係数を推定するための新しいベイズの枠組みを提示する。以下のようなアプローチを提案する:まずノンパラメトリックベイズモデルを用いて,共変量と離散応答変数の事後同時分布を得る。誘導された応答変数の条件付事後分布から,条件付き分位点のサンプルを発生させる。最後に,加法モデルを用いた分位点回帰関数と条件付き分位点との間の距離を最小化することで分位点回帰係数の事後分布を得る。
12:10-13:30 昼休憩
13:30-15:40 セッション2 (座長: 中川 智之)
「逆ガウス分布に基づくMFMを用いた有限混合モデルの混合数のベイズ推測」
岩重文也 (広島大学)
Argiento and Iorio (2022) によって有限混合の混合事前分布(mixture of finite mixtures, MFM)を有限点過程を用いることで一般的な枠組みで表現することが可能となった。この方法の利点はノンパラメトリックベイズの方法とは異なり、混合数のベイズ推測を直接的かつ効率的に行うことができる点にある。本発表では、Argiento and Iorio (2022) で与えられた事前分布のクラスにおいて通常よく用いられるディリクレ分布ではなく,逆ガウス分布に従う独立な確率変数の正規化による単体上の分布を用いた MFM を導入し、数値実験を通して性能を比較する。
「マルコフ連鎖モンテカルロ法の対称性と非対称性」
鎌谷研吾 (統計数理研究所)
非対称な手法の紹介を行う.非対称性を許容すると,手法の自由度が広がるが,逆説的だが,その自由度が手法の設計の足かせになる.手法の設計の方法の一つを提案する.本発表では,非対称な手法の紹介の導入として,マルコフ連鎖における対称性の理論的な意味も詳しく述べる.
「Two-stage Bayesian propensity score analysisに基づく層別推定量の検討」
折原隼一郎 (東京医科大学)
傾向スコアを利用した層別推定量は, 治療効果を歪めうる交絡因子を調整するための方法の一つである. 同じ目的で利用されるIPW推定量よりも精度よく治療効果を推定できる可能性があるものの, 議論されることは少ない. 本発表では, two-stage Bayesian propensity score analysis (Liao and Zigler, 2020; StatMed.) の考え方と一般化ベイズ法を利用し, 層別推定量をベイズ統計の枠組みで捉えることを検討する. その際, RJMCMCを利用した層数選択の可能性を合わせて検討したい. なお, 本研究は理科大・桃﨑先生との共同研究である.
「異質因果効果のためのノンパラメトリックベイズに基づく各層の共変量分布の推定」
大東智洋 (東京理科大学)
ある共変量が特定の値を取る層において,条件付き因果効果が他の層と異なるような異質因果効果の推定問題を考える.近年のベイズ因果推論の枠組みでは,注目する層の共変量分布をBayesian bootstrapにより推定し,条件付き因果効果の推定に用いることがある.ところが,層を定義する変数の水準数が多い場合や,複数の変数を組み合わせて層を定義する場合に,一つの層に含まれる対象者数が小さくなると,Bayesian bootstrapによる共変量分布の推定精度が低下し,条件付き因果効果の推定に影響する.本研究では,層同士の共変量分布の類似性に応じて情報借用することで共変量分布の推定精度を向上し,条件付き因果効果を精度よく推定できるようなノンパラメトリックベイズに基づく手法を提案する.
「冪密度ダイバージェンスの最小化およびそのパッケージ化の近況」
奥野彰文 (統計数理研究所)
冪密度ダイバージェンス(冪密度Div.)は,カルバックライブラーDiv.の拡張として定義され,外れ値に頑健となるよう2つの確率モデルの乖離度を測ることができるとされている.理論上は精密な議論が展開できる一方で,冪密度Div.は指定した確率モデルの冪密度の積分項を含むので,正規分布やガンマ分布などごく一部の確率モデルでしか冪密度Div.を最適化できない問題がある.本講演では冪密度Div.を一般の確率モデルで最適化する方法 (Okuno, AISM2024, https://doi.org/10.1007/s10463-024-00906-9) について紹介し,対応する sgdpdパッケージ (https://github.com/oknakfm/sgdpd) 開発の近況,および課題について講演する.
「Density power divergenceを用いた一般化事後分布からのサンプリング方法の検討」
薗部成輝 (東京理科大学)
Lyddon et al. (2019, Biometrika)において,loss-likelihood bootstrapと呼ばれる重み付き最適化によって近似的な一般化事後分布からのサンプルを得るアルゴリズムが提案されている.本研究では,その最適化部分を確率的な方法にすることで,積分項が明示的に書けないモデルを含んだ一般の確率モデルについても,density power divergenceを用いた一般化事後分布からのサンプリングを可能にする.シミュレーション実験では,データの次元やパラメータの次元が高い場合について,従来手法と提案手法の比較を行う.
15:40-16:00 休憩
16:00-17:50 セッション3 (座長: 橋本 真太郎)
「特性関数に基づいた円周上のカーネル密度推定量のバイアス修正」
鶴田靖人 (長野県立大学)
カーネル密度推定量は、柔軟な推定を可能とするため、角度データとも呼ばれる円周上のデータの分析にもよく用いられている。カーネル密度推定量は、一般にパラメトリックなモデルと比べて収束スピードが遅いことが知られている。そのため、円周上のカーネル密度推定量に関するバイアス修正法としてWrapped flat-topカーネル関数を用いる方法を提案する 。提案手法における漸近バイアスの収束スピードは、よく知られているいくつかの円周上の分布において、従来のバイアス修正法と比較して速いことを示す。
「Regularized score matching of torus graph model applied to EEG phase-based connectivity analyses」
助田一晟 (東京大学)
Identifying phase coupling among electroencephalography(EEG) signals recorded from multiple electrodes helps us understand the underlying dependence structure in the brain. From a statistical perspective, these signals represent multi-dimensional angular measurements that are correlated with each other, and can be effectively modeled using the torus graph model designed for circular random variables. Regularization is typically employed to achieve a sparse network structure; however, some degree of arbitrariness remains. To enhance the validity of this approach, we propose using regularized score matching estimation for the torus graph based on information criteria. In numerical simulations, our method successfully recovers the true dependence structure from data. Additionally, we present analyses of real EEG data.
「Doubly Robust Uniform Confidence Bands for Group-Time Conditional Average Treatment Effects in Difference-in-Differences」
今井竣祐 (京都大学)
2020年前後から, 期間数が複数のパネルデータにおいて, 各ユニットに処置が別々のタイミングで与えられた場合のDifference-in-Differencesが盛んに考察されている. この研究では, まず, そのような状況において, Staggered Adoption (処置を1度受けた人は最後まで処置を受け続ける), 条件付きパラレルトレンドの仮定を課し, 識別の結果を与える. 具体的には, 処置が初めて与えられたタイミングでユニットをグループ化し, グループ-時点ごとに, 共変量で条件づけた平均的処置効果(group-time CATT)をdoubly robustな形で識別する. 次に, そのestimandに対して, グループ, 時点, 共変量上一様信頼区間をノンパラメトリックな方法で構築するための方法を紹介し, その理論的妥当性を与える.
「Wishart行列による楕円型分布の位置尺度混合の諸性質と回帰分析における応用」
米永航志朗 (北海道教育大学)
多変量t分布や多変量Laplace分布などの、いくつかの多変量分布は多変量正規分布の正のスカラー確率変数による位置尺度混合によって得ることができる。本講演ではWishart行列による楕円型分布の位置尺度混合の確率表現を与える。この表現によれば、Wishart行列による楕円型分布の位置尺度混合はカイ二乗変数による、ある確率ベクトルの混合分布として表せる。この結果により、特性関数やモーメントの計算において、正定値対称行列全体にわたる積分を避けることができる。またWishart行列の自由度と共分散行列の固有値の大きさによっては、この混合分布の多変量正規分布による近似が利用可能である。この性質に基づき、誤差ベクトルが楕円分布の場合の、最小二乗推定量の確率分布に対する正規近似を提案する。提案された手法に対して、正規性の検証が数値的に行われる。
「オブジェクトデータの因果推論」
栗栖大輔 (東京大学)
アウトカムが距離空間に値をとる場合の因果推論の枠組みについて紹介する.具体的には距離空間における平均処置効果 (GATE) を定義し,GATEの二重頑健推定量を提案する.講演では推定量の理論的性質といくつかの実データへの応用について紹介する.
9月13日 (金)
10:00-12:10 セッション4 (座長: 小林 弦矢)
「長期時系列データの効率的な分析と構造変化の推定」
粟屋直 (早稲田大学)
長期時系列データをベイジアンモデルを用いて推定する場合、パラメータと潜在変数の相関のためにMCMCが非効率になるという問題が存在する。また経済データ分析固有の論点として、パラメータの値が全期間を通じて固定という、時系列分析で通常導入される仮定が自明に妥当でないという問題もあげられる。そこで本発表では経済構造の変化の可能性を考慮した時系列モデルを提案し、そのモデル構造の下では並列化を用いた効率的な事後分布の探索が可能になることを示す。
「追加的なMCMCが不要なprior sensitivity analysis」
菅澤翔之助 (慶應義塾大学)
事後分布が事前分布によってどの程度sensitiveに変化するかを確認することはベイズ分析において重要な手順の1つである。通常は異なる事前分布を用いて再度MCMCを実行するアプローチが一般的だが、(特に階層構造をもつ複雑なモデルの場合) 追加的に様々な事前分布でMCMCを実行するのに大幅な計算コストと時間がかかってしまう可能性がある。本研究では、事前分布を取り替えた場合の事後分布の変化量をFisher-Rao計量によって測る方法を採用し、その量が追加的なMCMCを必要とせずに簡単なモンテカルロ近似によって計算可能であることを示す。また、いくつかの例を通して提案手法の有用性を紹介する。
「ポアソン-ガンマ型状態空間モデルによる救急救命データの予測分析」
入江薫 (東京大学)
救急救命室(Emergency department, ED)への来訪患者数の時系列データの分析に関する進行中の研究について報告する。ED需要の予測は医療分野における重要課題のひとつであり、待ち行列理論やARMAモデルに基づき点予測を与える先行研究が多く存在する一方で、予測の不確実性を考慮したベイズ分析はなされていない。本研究ではEDデータに対して基本的な状態空間モデルを適用し、予測の不確実性を評価する。データは一時間あたりの来訪患者数の総数であり、計数値時系列データを構成することから、ポアソン-ガンマ型の状態空間モデルを適用する。このデータは同一時点に複数の観測値を持つことから、日中予測分布の計算には回顧的事後分布を必要とする点が特徴的である。救急医療の観点から患者数の過少予測は望ましくないため、分位点とチェック損失による予測性能の評価を行う。また、潜在的な過少分散の問題についても触れる。
「事前分布の一般化平均による多重縮小推定」
松田孟留 (東京大学)
一般化平均(Kolmogorov--Nagumo平均)とは、算術平均や幾何平均を一般化した概念である。ベイズ推論において複数の事前分布が想定されるとき、それらを一般化平均によって統合することを考える。正規分布の平均推定において、この手法は多重縮小推定として解釈できる。一般化平均が優調和性を保存することから、色々なパラメータ領域で小さなリスクを達成するミニマックス推定量を得ることができる。
「ダイバージェンスを用いた方向データに対するロバストなベイズ推定」
中川智之 (明星大学)
方向データにおいても, 通常の最尤推定量やベイズ推定量は外れ値・異常値に影響されやすい. 本研究はダイバージェンスを用いたvon Mises-Fisher分布に対するロバストなベイズ推定について検討する.
「ガンマ・ダイバージェンスに基づく共分散行列の逆行列のロバストなベイズ推定」
橋本真太郎 (広島大学)
多変量正規分布の共分散行列の逆行列の推定は変数間の従属性を捉えるのに重要である。本研究では,Hirose et al. (2017, JMVA) により提案されたガンマ・ダイバージェンスに基づくロバストな方法をベイズ統計学の枠組みで考える。本発表は鬼塚貴広氏(広島大・D3)との共同研究に基づく。