サロゲート法は、サロゲートデータ法とも言われ、時系列データに潜む特徴を統計的に検証するための仮説検定の手法です。データには、その振る舞いや様子を見ただけでは分からない特徴があります。例えば、ある振る舞いが不規則な変化だったとき、その振る舞いを見ただけでは、その変化には何らかの法則(規則)性があるのか、それとも無いのかは分かりません。私たちはサロゲート法を用いることで、こうした隠れた特徴が本当に存在するのかを統計的に調べることができます。まず、調べたい特徴が「存在しない」と仮定する仮説を設定します。この仮説を帰無仮説(きむかせつ)と言います。帰無仮説とは、文字通り「無に帰する仮説」、すなわち「その特徴が存在しない」とみなして立てられる基準的な仮説であり、データがこの仮説と矛盾するかどうかを調べるために用いられます。例えば、分布やパワースペクトルなど、帰無仮説のもとで保持されるべき性質を保ったまま、その他の構造を破壊したデータを多数生成します。これらがサロゲートデータです。サロゲートとは「代理」という意味で、ここでは「帰無仮説が正しい世界で得られるはずのデータ」を指します。
次に、解析対象の元データと、多数のサロゲートデータに同じ統計量(検定統計量)を適用し、その値を比較します。もし元データの統計量がサロゲートデータの統計量と十分に異なる場合は、帰無仮説を棄却し(帰無仮説と矛盾すると判断し)、調べたい特徴がデータに存在すると判断します。一方で、両者に明確な違いが見られなければ、帰無仮説を棄却できないため、その特徴があるとは言えません。これは「特徴がない」と断言するものではなく、あくまで「その特徴を統計的に検出できなかった」という意味です。サロゲート法では「どの統計特性を保持し、どの構造を破壊するか」を選ぶことで、さまざまな種類の特徴を検証することができます。このようにして、観測データの性質をより深く理解し、現象の特徴を統計的に明らかにします。
サロゲート法の基本的な考え方と使い方の一例
自分が調べたいデータが不規則な振る舞いを示している場合、その背後に非線形性などの複雑な構造が存在する可能性があります。そこで、このデータに非線形性が存在しているかどうかを調べることにします。ここで設定する帰無仮説を、「このデータは、あるパワースペクトル(自己相関構造)をもつ線形ガウス過程である」とします。この仮説を検定するために、元データのパワースペクトルだけを保持し、それ以外の構造(非線形性、非ガウス性、ある種の非定常性など)を破壊した人工データを多数生成します。こうして得られたデータをサロゲートデータと呼びます。もし観測データが線形ガウス過程に従っているのであれば、観測データから計算される統計量の値は、多数のサロゲートデータから得られる統計量の分布の中に収まるはずです。一方、観測データに線形だけでは説明できない構造が存在する場合、観測データとサロゲートデータから推定される統計量の値の間には、大きな違いがあるはずです。