Research Activity
研究概要
本研究室では、主に確率過程の統計解析とその金融データへの応用を研究しています。確率過程は、時間の経過とともにランダムに変化する現象を数学的にモデル化したもので、主に以下の確率過程を扱っています。
ブラウン運動 :粒子の不規則な動きをモデル化したもので、連続時間の確率過程で最も基礎的で重要なものの一つです。
確率微分方程式:ブラウン運動を含む複雑な確率過程を解析するための方程式で、連続パスをもつ確率過程で、株価モデルとして用いられます。
ジャンプ付き拡散過程:確率微分方程式に不連続な変動を追加して得られる確率過程で、金融市場の急激な価格変動などを理解するのに役立ちます。
点過程(整数値確率過程):時間内の特定のイベント数をモデル化した確率過程です。株式市場における売買注文のモデルとして用いられたり、地震の発生のモデルとしても用いられます。
確率過程に対する統計解析として、パラメトリック・ノンパラメトリックな推定手法を研究しています。日内の株式市場における「高頻度データ」と呼ばれるような株式の全取引を記録したようなデータの解析では、複雑な観測構造が現れ、それを考慮した統計手法についても研究しています。最尤型・ベイズ型の推定手法を構築したり、これらの推定量が推定誤差の漸近分散が任意の推定手法の中で最小になるといった理論的性質を導くといった研究をしています。
金融データへの応用として、確率微分方程式やジャンプ付き拡散過程を高頻度データの株価モデルとして当てはめて東京証券取引所のデータを解析したり、ニューラル・ネットワークを用いて高頻度データから株価モデルを学習することをしています。また、株式市場における売買注文の情報(板情報)を自己励起型点過程でモデル化して、将来の売買注文の到着の予測の研究を行っています。
確率過程を用いた高頻度データのモデル化とニューラル・ネットワークを用いた分析
高頻度データのモデル化と統計解析
日内の株式の全取引を記録したような高頻度データは日次以下の頻度のデータに比べて多くの情報を含むため、より精度の高い分散・共分散予測が可能になると期待されるが、高頻度データはデータ量の多さからの分析の困難さに加えて以下の特有の観測構造から統計解析が困難となる。
非同期観測 株価が観測されるのは新しい取引が成立した時であるので、複数証券の観測時刻は一致しないという問題が生じるため、株価変動の共分散の推定が困難になる。これを「非同期観測」と言う。
マーケット・マイクロストラクチャー・ノイズ 高頻度データを確率微分方程式でモデリングした際に、確率微分方程式を直接観測するモデルでは実証結果に合わず、仮想的なノイズを伴って観測されるとするモデルが有力である。このノイズのことをマーケット・マイクロストラクチャー・ノイズと呼ぶ。ノイズ付き観測に対して、潜在過程の分散・共分散等を推定する手法を開発する必要がある。
ニューラル・ネットワークによるモデル化
高頻度データは、観測構造の複雑さに加え、背後の株価モデルにも様々な特性が存在する(i.e. 日内季節性、ボラティリティ・クラスタリング、分布の裾での相関の高まり)。高頻度データの膨大なデータ量からニューラル・ネットワークで構造を学習するアプローチが有効である。確率微分方程式の係数のパラメトリック・モデルをニューラル・ネットワークで記述し、最尤型推定により株価変動モデルを学習する。
株式板情報の点過程によるモデリングと統計解析
株式取引の成立する前の売買注文(板情報, limit order book)を点過程でモデリングし、株価形成メカニズムを解明することを研究している。
板情報のモデル化にはHawkes過程と呼ばれる自己励起型の点過程が用いられ、自身のジャンプにより一時的なジャンプの発生頻度が上昇し、連鎖的にジャンプが起こる点過程となっているため、株式市場におけるクラスター構造をうまく表現することができます。
板情報をHawkes過程でモデル化して、実際の市場のデータからモデルのパラメータを推定することで将来の売買注文の到着頻度などを予測することができ、株式の大量執行を行う際の最適な分割執行戦略を求めることが可能になります。
Example of limit order book
学生の研究テーマ例
自己励起型点過程を用いた株式板情報のモデリングとモデル選択
Hawkes過程で株式板情報をモデリングベイズ情報量規準を用いたモデル選択とその妥当性に関する理論解析・数値シミュレーション
確率微分方程式モデルの非同期観測に対する共変動の検定手法
高頻度データで現れる「非同期観測」の問題を考慮して、二つの株式間の共変動をデータから推定・検定する