モデル化
特徴の深堀り(自己相関が、残存するか、一時的なものか)
将来予測
時系列解析の一般用語
[グレンジャー因果性検定]
ある時系列が別の時系列の予測に役立つかどうかを判断するための統計的仮説検定で、1969年に初めて提案された。
[自己相関]
統計学において、確率過程の自己相関関数とは、時系列上の異なる点の間の相関のことである。
[定常性]
時間によらず期待値、自己共分散が一定であるような時系列データの性質を定常性と言う。
古典的時系列モデル
特徴量をあまり使えない。
[ARCHモデル(アーチモデル)]
金融経済学、統計学、計量経済学などにおいて分散不均一性を示す時系列データに適用されるモデル。日本語では、「分散自己回帰モデル」「分散不均一モデル」等と称される。
突発的に値が上がり、その直後下がって、だんだん振れ幅が小さくなって収束する。
[Box-Jenkins(ボックス=ジェンキンス)法]
Box-Jenkinsとは、時系列解析におけるARIMAモデルの体系的な構築法として知られるアプローチ。1970年代にGeorge BoxとGwilym Jenkinsが提唱したことからその名がついている。
まず分散のスプレッドを対数変換でつぶす。
[単位根検定]
自己回帰モデルを用いて時系列変数が定常かどうかを判別するための仮説検定。大標本において妥当となる良く知られた検定として拡張ディッキー–フラー検定(ADF検定)がある。他の検定としてフィリップス–ペロン検定がある。これらの検定は単位根の存在を帰無仮説として用いている。
[ユール・ウォーカー方程式]
期待値0のAR(p)において自己相関係数とモデルの係数の関係を表した式。p=2の場合がよく文献では紹介されている。
[ARIMAモデル]
ARMAモデルは定常過程にしか対応してなかったが、自己回帰分移動平均モデル(ARIMAモデル)はARMAモデルを非定常過程に対応させたものである。
Harvey(ハーヴィー)の構造時系列モデル
y_t = μ_t + γ_t + ε_t
μ_t:トレンド成分(例:ローカルレベルモデル)
γ_t:季節性成分
ε_t:ホワイトノイズ(観測誤差)
これらを状態空間モデル(state space model)で表し、カルマンフィルタなどを用いて推定する。1989年のHarveyの本に登場。
トレンドの変化点がある場合は、ARIMAモデルではどうにもならないので、rupturesを使って変化点を見つけて時系列を分割してしまう。
ベイズ構造時系列モデル(Bayesian Structural Time Series Model、BSTS)
時系列データの予測と分解にベイズ統計学の原理を適用したモデルである。BSTSは、特に非定常な時系列データを扱うために有用であり、トレンド、季節性、バンディッド成分(Holiday or Event Component)、および外部の要因などを考慮することができる。
[Prophet]
ベイズ推定及び一般化加法モデル(GAM: generalized additive model)を基礎としている。
FbProphetは
!pip install fbprophet
from fbprophet import Prophet
と書いて使用するが、インストールの時点で「あれが足りない、これが足りない」というエラーが出ることが多い。
prophet の場合、同様に
!pip install prophet
from prophet import Prophet
と書けばよく、エラーも出ない。
論文タイトル: "Forecasting at Scale"(規模での予測)
著者: Sean J. Taylor, Benjamin Letham
?Prophetで詳細を見れる。
時系列モデルは将来の値を予測することに主に用いられるが、過去の時系列データのトレンド変化点を見て、試作の効果の検討なども可能である。
cmdstanpy - INFO - Chain [1] start processing
は「Stan による MCMC のチェーン1本目がいまから処理を開始する」という意味。
[ARIMA Prophet]
差分を使ってトレンドを消す。
CausalImpactは、日次の売上データなどの時系列データに対し、ウェブ広告配信などの施策(介入と呼びます)の効果がどの程度あるかを推定するための手法の一つです。
機密金融時系列予測モデル。
状態空間モデルは、観測モデル(観測方程式)と、システムモデル(状態方程式または遷移方程式)から成る。
状態空間モデルは逐次推移の構造をもつベイズ型統計モデルであり、状態空間モデルのフレームワークの下で、種々の時系列モデルを統一的に扱うことができる。
線形Gauss状態空間モデルが基本的なモデルとなる。
Time Series Analysis by State Space Methods
深層学習モデル
[NeuralProphet]
入力データのスキーマでは、ds列には時系列データの日付が、y列には予測対象の数値データが格納される。
出力データのスキーマでは、ds列には予測結果の日付が、y列には実測値が、yhat1列には予測値が、各コンポーネント列にはトレンドや周期性などの要素が格納される。
[DeepAR]
Amazonが2017年に発表した時系列予測モデル。
[TFT (Temporal Fusion Transformer)]
Google が 2020年にリリース。
LSTMとTransformerをハイブリッドに統合したような構造。
Foundation Modelの時系列版
[TimesFM (Google, 2024年発表)]
VisionやLLMの流れを汲んだ「時系列の汎用基盤モデル」。時系列モデルの分野ではLLMベースのモデルを汎用基盤モデルと呼んでいる。