福島県浪江町の風向と風速データのヒストグラム(データは気象庁のもので期間は2013年9月16日から2015年9月16日まで)

風向データは二峰性を示すことが多いため、混合分布か二峰性を示す角度分布をあらかじめ用意した方がデータに対する当てはまりも良くなる。

このデータについては、西方向をモードに持つ角度分布と東方向にモードを持つ角度分布の混合分布に見えるため、単峰分布を二つ用意するか、対蹠対称性を示す分布を用意してからパラメータ推定を行うほうが良いことがわかる。

風向と風力の組や樹冠の向きと長さの組のように、角度と長さを観測値とするデータはしばしばシリンダーデータと呼んでいます。

このようなデータの例として Blue periwinkle(タマキビ)data (移動方向と移動距離の組のデータ) (Johnson & Wehrly, 1978)があり, Johnson & Wehrly (1978)では シリンダー上のデータのための分布をいくつか提案しています。

一方で、タマキビの移動方向のデータを良く見ると、 移動距離が増えるにつれて、ある一定の方向にデータが集まっている傾向が見られます。

風向と風力の組のデータでもこのような性質を示すことがしばしばあります。 また、Zucchini & Macdonald (2009) のDrosophila data(ショウジョウバエ)の移動の角度と速さの変化の組のデータ にもこのような傾向が見られます。

これらの性質を持つようなデータに対するモデルとして、 Abe & Ley (2017, Econom. Statist.)では、 Weibull分布と正弦摂動von Mises分布(Abe & Pewsey, 2011, Stat. Pap.)を用いることにより, 距離が短い部分ではある方向への集中の度合いが弱く(一様分布)、 距離が長い部分ではある方向への集中の度合いが強い(sine-skewed von Mises分布) ような(Lagona et al. (2015)等では、しばしばAbe-Ley分布と呼んでいる)WeiSSVM分布を提案しています。

Abe & Ley (2017, Econom. Statist.)のWeiSSVM分布の長所は、

・正規化定数が単純である

・周辺分布が単純であり、それ故に条件付き分布も単純な形を取る

・その性質を用いれば、乱数生成が容易である

・モーメントも単純な形で与えることができる

・多変量分布への拡張も容易である

ということがあげられます。

しかしながら、この分布はsine-skewed von Mises分布を使っていることから、

パラメータの選び方によっては必ずしも単峰とはなりません(Abe & Pewsey, 2011, Stat. Pap.)。

一方で、上で述べたモデルは非対称分布ですが、 Imoto, Shimizu & Abe (JJSD, 2019) では、対称なシリンダー上の分布でも線形部分をうまくコントロールすることにより、ロバストになっています。

このような問題点を解決するために、 WeiSSVMモデルを数学的に一般化したモデルを現在考案中です。

特に、そのモデルの特別な場合として、 条件付分布(長さを与えた下での角度分布)の単純さを犠牲にして、

・正規化定数が単純である

・乱数生成が容易である

・分布は常に単峰である

・三角モーメントが単純である

・モードが単純な形で与えられる

という利点を持つ分布が構成できることがわかりました。

現在はこの新しいモデルについて、理論的にどこまで詳しく議論できるか、 また、データ解析を行うために、できるだけ単純で性質の良いモデルはどのようなものが生成可能か調べています。