コピュラ(接合関数)は累積分布関数として定義されるが,既存のコピュラモデルの多くは,その確率密度関数が扱いやすい形にはならない.そのため,コピュラモデルの最尤推定は,しばしば計算が複雑となる問題が知られている.本研究では,コピュラに基づくダイバージェンスを提案し,それを応用したパラメータ推定法を議論する.確率密度関数を計算することなくパラメータ推定を行えることから,提案したパラメータ推定法は最尤推定よりも一般に計算が容易となっている.提案するダイバージェンスは,ベータダイバージェンスを修正することにより導かれ,いくつかの既存のダイバージェンスを特別な場合として含んでいる.また,ダイバージェンスの重み関数の取り方により,裾部分などの特定の領域に重みを付けた推定が可能となる.提案した推定量の一致性や漸近正規性などの漸近的性質を示す.最後に,シミュレーションで有限個の標本数に対するパフォーマンスを評価する.
なお,本研究は,江口真透氏(統計数理研究所)と吉羽要直氏(東京都立大学)との共同研究である.
金融分野での「配偶者の年収」や「ボーナスでのローン返済予定額」、医療分野での「ある成分の摂取量」や「先月の医療費」などといったデータは連続値でありながら多数のゼロ値データを含む。これらゼロ過剰連続変数の同時分布は、密度関数の発散や、指数関数的に増加する部分空間構造などを有するため統計的な推定が難しい。本発表ではまずこれら難点の整理を行い、次に解決策としてコピュラをベースとした同時密度モデルを、ゼロ値発生のメカニズムに応じて2種類紹介する。特に、ゼロ値を多数含むことによるタイデータの間題に対処可能なrectified Gaussian distributionを用いたコピュラについて紹介する。人工データとカードローンのオープンデータの密度推定を行い、提案手法がゼロ過剰連続値データのモデリングに適していることを示す。
近年,1つの豪雨事例で広範囲にわたって被害が発生する事例が発生している.田中・北野(2022)は,大量のアンサンブルをもつ気候再現・予測データd4PDFから降雨流出解析を通して得た数千年分の河川流量データを用いて,複数の2水系間に2変量極値分布を適用して計画規模洪水流量の従属性および同時超過確率を検討した.本発表では,同検討を日本全国のすべての2水系の組に展開し、洪水生起に関する全国的な裾従属性を議論した.その結果、基本的に隣接する水系間で裾従属性が高いものの、台風の通り道と思われる水系の組を中心に距離の離れた水系にも従属性が見られた.また、使用した気候データから発生要因を分析すると過去の水害と整合的であることを確認した.
3変量以上の多変量極値の相関構造をモデリングし,多変量極値の同時生起確率を評価することは,さまざまな分野での応用に重要である.例えば,複数の地点での高波の波高の極値や近接する流域における河川流量の極値による集積リスク,さらに,波高,河川流量,高潮潮位などの極大外力の重畳リスクを検討することは,気候変動により風水害外力が広範囲化することや,広範囲に被災した場合の復旧の難しさも考慮に入れると,治水計画の上での急務な重要課題である.2変量極値モデルとは異なり,3変量以上の極値モデルは,相互の組合せの相関も大きく異なることが一般的であり,したがって,複雑な相関構造をどのように扱えば良いのか,現実データへの適用のツールなどの手立てのみならず,極値統計分野でも,その道筋そのものが十分に示されているとは言えない状況にある.そこで,本研究では,Huesler-Reiss モデル(Huesler & Reiss, 1989)と t-EV モデル(Demarta & McNeil, 2004; Nikoloulopoulos et al., 2009)を用いて,2変量の相関から多変量の相関構造を組立てることのできる条件とその条件のもとで構築できる簡略的な方法を示すものである.
本報告では,2023年7月にSymmetry誌で公表した同表題の論文(Yoshiba, Koike and Kato, 2023)について,主要な以下の4点を説明する.
2変量接合関数に対して閾値をuとした非対称性指標(Kato, Yoshiba and Eguchi, 2022)は一般に,上下の裾次数が異なる場合,u→0で裾次数の差とlog uの積に収束する.
2変量非対称正規接合関数の裾次数は,非対称性パラメータが同符号であるときは,変量間の相関あるいは偏相関を用いて,正規接合関数と同様に単純化できる.
2変量非対称正規接合関数の裾従属関数は,3変量正規分布関数に対するTVPACKアルゴリズムで精度良く計算できる.
2変量非対称正規接合関数の裾従属関数について,提案されている2つの漸近式は,パラメータ領域の境界付近での近似精度が悪く,近似式として利用するのは不適切である.
コピュラは従属性をモデリングする際の有用なツールであり, アルキメディアンコピュラというクラスが代表的である. アルキメディアンコピュラはgenerator と呼ばれる1つの関数から規定されるものであり, その簡便さと柔軟さから多くの研究で用いられている. 本発表では代表的なアルキメディアンコピュラの一つである Frank コピュラが, 所与の条件下でKullback-Leibler ダイバージェンスの意味で最も独立に近いコピュラ(最小情報コピュラ)を求める枠組みから導出されることを説明する. これによりFrank コピュラを用いる選択は, 順位相関係数のみに注目した情報抽出に基づく分布の決定であるという解釈が可能となる.