物理モデルからデータを説明する際、全物理情報をデータから拘束することは一般に困難で、フィッティングから求められた物理的解釈にはしばしば大きな任意性が残ります。データから実現象の素過程を明らかにしようとする時、逆解析の理論が助けになります。
データと同等数の物理量(モデルパラメター)を推定する大自由度モデリングでは、データとモデルパラメターをつなぐ理論(観測方程式)だけでは物理量を制約できません。ベイズ推定はさらに物理量に関する事前情報を用いることでこの問題を解決しています。事前情報と理論に対する信頼度の比重(超パラメター)はしばしば未知量となり、チューニングパラメターになりがちですが、フルベイズ推定では超パラメターも確率変数としてデータから統計的に評価できます。
他方、フルベイズ推定では分布の扱い(縮約)によって結果が大きく変わるという問題が実はあります。今回、線形逆問題(データがモデルパラメターと線形関係にある観測方程式を用いたガウスモデル; 尤度と事前分布の分散が超パラメター)を扱い、縮約の問題の数理的背景と適切な縮約を明らかにしました(Sato, Fukahata & Nozue, 2022)。
発見のポイントは、時に中心極限定理に従わない事後分布のデルタ関数的収斂です。データとデータとモデルパラメターが多数個ある場合に、モデルパラメターの周辺分布と超パラメターの周辺分布がそれぞれ1)モデルパラメターと超パラメターの同時事後分布の確率最大(MAP)と2)赤池ベイズ情報量規準(ABIC)の解をピークとするデルタ関数に漸近することがわかりました。これはつまり、フルベイズ推定の代表解はMAPとABICのみに絞られるということでもあります。左図は、GNSSデータ(N=572要素)から得られた関東周辺の体積歪み速度のMAP・ABIC推定値です。基底関数長Δξを小さくした高解像度推定でABICのみが尤もらしい結果を与えています。一般にモデルパラメター数 Mが大きい場合に類似の結果が生じることが理論的に説明されました。非線形性のために数値的に解かれることの多かったフルベイズ推定の隠れた手法的課題を、解析的手法によって発見・解決する結果です。
上の結果から、フルベイズ推定で標準的なモデルパラメターの直接推定よりも超パラメター推定を経由したABIC型の多段推定が適切な縮約であることが示されましたが、ABICで得られた推定量がどういう統計的特性を持つのかはよくわかりません。大自由度モデリングは、データ数がパラメター数に比べて十分大きいという仮定を満たさず、通常の大標本統計理論の外側にありました。
Sato & Fukahata (submitted; and now on arXiv)は、大自由度モデリングにおいてABICによるモデルパラメター推定が漸近不偏であることを報告しました。ベイズモデルと統計力学モデルの数理的な類似性に着想を得て、線形逆問題に限らず、さまざまな分布を用いた統計モデルでABICの超パラメター推定が漸近的に確率1で真値を復元できる(一致性がある)ことを示しています。真の超パラメターがない場合でも、ABICがデータ分布を一番よく説明する超パラメターを与えることを言えました。
ABICは、不偏であるものの大自由度モデリングで不安定化してしまう最尤法に代わる、優れた推定法と示唆されました。ABICのような、超パラメターの周辺尤度最大化とモデルパラメターの条件付き事後分布を組み合わせる多段推定法は、広く経験ベイズ法と呼ばれます。今回の結果は経験ベイズ法の漸近不偏性と一致性を示す結果と言えそうです。