これまで書いた論文 (selected) の回顧録を記載しています。
Sugasawa, S., Hui, F. K. C. and Welsh, A. H. (2025+). Robust linear mixed models using hierarchical gamma-divergence. Journal of Computational and Graphical Statistics, accepted.
統数研特任研究員時代の2017年に、Alanが統数研で講演していたのがキッカケで出会い (元々mixed model関連で有名な人なので名前は知っていた)、その年の11月にANU (オーストラリア国立大学) に3週間ほど滞在させてもらって、そのあたりから始まった研究。Alanの元ポスドクでANUの教員だったFrancisも加わって始めたんだけど、方針が二転三転したりして、論文として完成したのは2024年だった。gamma-divergenceを使う方針は最初から決まってたけど、tuning parameterの選択がうまくできなくて途中でやる気が下火になってたんだけど、Sugasawa and Yonekura (2021, Entropy)で作った規準がなかなか使いやすく、この研究にも適用してみたらとても良い性能になったのでやる気が出た。
この論文が完成するまでに、2018年と2023年にも1週間ずつANUに滞在したので、1 vist 1 paperのルールを守るためには少なくともあと2本は論文を書かないといけない。初稿に時間をかけたこともあって、かなりスムーズにアクセプトしてもらえた。(とはいえmajor revisionはかなり大変だった。)
Wakayama, T., Sugasawa, S. and Kobayashi, G. (2025+). Similarity-based random partition distribution for clustering functional data. Journal of the Royal Statistical Society: Series C, accepted.
TBA
Hamura, Y., Irie, K. and Sugasawa, S. (2025+). Robust Bayesian modeling of counts with zero inflation and outliers: theoretical robustness and efficient computation. Journal of the American Statistical Association, accepted.
羽村さんと入江さんとロバストベイズのテーマでいろいろと研究をしてきた中で、1つのマイルストーンとなった論文。これまで正規分布ベースのモデルではいろいろあったけど、カウントデータまで理論・アルゴリズムが綺麗にできている方法はこれまでなかった。数値実験やデータ解析の結果が綺麗に出て感動したのを覚えている。ただ、査読対応がハードだったり、雑誌側のコードのreproducibility checkに半年以上かかったりと、投稿してからアクセプトまで2年半くらいかかった。アクセプトのお祝いで3人でフレンチに行った。これでロバストベイズに関して本質的に研究することは終わったかなと思ってたけど、多次元のロバストベイズについて考え出したら意外と奥が深くて今だにこのテーマで研究している。(2025年8月現在)
Kurisu, D., Ishihara, T. and Sugasawa, S. (2025). Adaptively robust small area estimation: balancing robustness and efficiency of empirical Bayes confidence intervals. Scandinavian Journal of Statistics 52, 999-1017.
TBA
Mosaferi, S., Ghosh, M. and Sugasawa, S. (2025). An unbiased predictor for skewed response variable with measurement error in covariate. Statistica Sinica 35, 1583-1604.
急にMalayから「今こんな問題を考えているから一緒にやらないか」とメールが来て参画した研究。自分は主に数値計算のアルゴリズム周りを担当した。Malayとは直接会ったことがあるが、主著者のSepidehとはオンラインでしか会ったことがない。ただ、Sepidehとは今も共同研究をしている。
Imai, S., Koriyama, T., Yonekura, S., Sugasawa, S. and Nishiyama, Y. (2025). Fully data-driven normalized and exponentiated kernel density estimator with Hyvarinen score. Journal of Business and Economic Statistics 43, 110-121.
今井さん (京大) の理論解析が素晴らしかった論文。初めは米倉さん・郡山さんとヒバリネンスコアを使った密度推定の研究をしていたときに、米倉さんが関西計量で今井さんをスカウトしてきてこのチームが爆誕した。
Kobayashi, G., Sugasawa, S., Kawakubo, Y., Han, D. and Choi, T. (2024). Predicting COVID-19 hospitalisation using a mixture of Bayesian predictive syntheses. Annals of Applied Statistics 18, 3383-3404.
TBA
Onizuka, T., Hashimoto, S. and Sugasawa, S. (2024). Fast and locally adaptive Bayesian quantile regression using calibrated variational approximations. Statistics and Computing 34, article number: 15.
Onizuka, T., Hashimoto, S. and Sugasawa, S. (2024). Locally adaptive spatial quantile smoothing: application to monitoring crime density in Tokyo. Spatial Statistics 59, 100793.
橋本さん (広島大) の学生だった鬼塚さん (当時広島大の博士課程) の外部アドバイザーのような形で関わるようになり、そこでの共同研究2本。1本目については、研究開始当初想定したよりも分位点推定の問題は難しく色々と苦戦したが、研究途中で鬼塚さんが思い付いたbootstrapによるカリブレーションの方法が最終的にはキーになって良い手法になった。
Okano, R., Hamura, Y., Irie, K. and Sugasawa, S. (2024). Locally adaptive Bayesian isotonic regression with half shrinkage priors. Scandinavian Journal of Statistics 51, 109-141.
羽村さん、入江さんとの研究アイデアが溜まりすぎていたので、RAを雇って進めたいと思い、当時東大統計コースの院生だった岡野さんに声をかけて始めた研究。関数値の差分に正値制約を与えた縮小事前分布を与えるというシンプルなアイデアながら、岡野さんの頑張りにより綺麗な実験結果・データ解析結果が得られた。
Hamura, Y., Onizuka, T, Hashimoto, S. and Sugasawa, S. (2024). Sparse Bayesian inference on gamma-distributed observations using shape-scale inverse-gamma mixtures. Bayesian Analysis 19, 77-97.
Hamura et al. (2021, BA) に関連したテーマとして、ガンマ分布の平均パラメータに対するglobal-local shrinkage priorは何か、という問いに答えるような研究。当初は逆ガンマ分布のスケール混合を考えれば作れるだろうという算段だったが、それでは理論的にうまくいかず、shape-scaleの同時混合を考えないといけなかったのが意外だった。BAには比較的スムーズにアクセプトしてもらえた。
Muto, S., Sugasawa, S. and Suzuki, M. (2023). Hedonic real estate price estimation with the spatiotemporal geostatistical model. Journal of Spatial Econometrics 4, article number: 10.
TBA
Wakayama, T. and Sugasawa, S. (2023). Trend filtering for functional data. Stat 12, e590.
Wakayama, T. and Sugasawa, S. (2024). Functional horseshoe smoothing for functional trend estimation. Statistica Sinica 34.
初の指導学生である若山さんの修士論文 (2部作)。どちらも (時系列) 関数データからどうやってトレンドを抽出かの話で、前者は最適化ベース、後者はMCMCベースで行う方法になっている。1本目の研究は統計学会春季集会で優秀報告賞を受賞していて、自分のことのように嬉しかった。当時 (2020年-2021年あたり) はコロナ禍であり研究打ち合わせは全てオンラインで行った。
Yonekura, S. and Sugasawa, S. (2023). Adaptation of the tuning parameter in general Bayesian inference with robust divergence. Statistics and Computing 33, article number: 39.
イギリスから帰国した米倉さんとオンラインで知り合い、そこからの流れで始まった研究。この論文は「どうやってベイズ的にロバストダイバージェンスのチューニングパラメータを選ぶか」というテーマで、最初はいろいろと試行錯誤していたのだが、勉強会で米倉さんがヒバリネンスコアを用いたベイズ的モデル選択の論文を紹介していて、これが我々の問題でも使えるとなって研究が進んだ。初めて研究で逐次モンテカルロを使って自分の引き出しの1つになったし、ヒバリネンスコアがいろいろば場面で使えることがわかって、これ以降の研究にかなり活きた。このあたりから、非正規化モデルの話題や関連する機械学習手法 (ノイズ対照推定とか) に興味をもっていろいろ勉強した。
Hamura, Y., Irie, K. and Sugasawa, S. (2024). Gibbs sampler for matrix generalized inverse Gaussian distributions. Journal of Computational and Graphical Statistics 33, 331-340.
羽村さんのマジック的な公式の導出 (2回目) により、行列GIG (generalized inverse Gaussian) 分布からの乱数をギブスサンプラーを使って生成できるようにした内容。この公式自体は、多次元のロバストベイズの研究に取り組んでいるときに副産物として出てきたもので、調べてみると行列GIGからの乱数生成は当時小さなopen problem的なものだったので、これを単体で論文にすることになった。partial Gaussian graphical modelという行列GIGを避けて通れない完璧な例があり、数値実験で提案手法の良さを頑張って実証したところ、非常にクリアな結果が出た。Hamura et al. (2023, JCGS)の経験で味を占めた我々は、JCGSはこういう論文が好きだろうと考え投稿してみたところ、今回も高評価 & ほぼアクセプトのような返答が返ってきて非常にスムーズに掲載された。レフェリーレポートで提案手法が褒めちぎられていて、後にも先にもこういうレビューをもらうことはないなと思った。
Hamura, Y., Irie, K. and Sugasawa, S. (2023). On data augmentation for models involving reciprocal gamma functions. Journal of Computational and Graphical Statistics 32, 908-916.
羽村さんのマジック的な公式の導出により、ガンマ関数が含まれるモデルのMCMCをデータ拡大法で効率化できるという内容。伝わる人だけには伝わるような渋い内容で、当初は投稿しても評価されないかなと考えていたのが、JCGSに投稿してみたらビックリするくらいの高評価かつほぼアクセプトくらいの返答が返ってきて嬉しかった。
Ito, T. and Sugasawa, S. (2023). Grouped generalized estimating equations for longitudinal data analysis. Biometrics 79, 1868-1879.
Sugasawa (2021, JASA)を研究している同時期くらいに、グルーピングの推定方法が刺さるような面白いケースがないかなと思っていたときに、伊藤さんが勉強会でGEEの論文を紹介していて、この文脈でグルーピングの方法を考えると面白いかなと思って始めた研究。伊藤さんが理論解析を頑張ってくれて、自分は数値実験・データ解析を頑張って綺麗な分業によって完成した論文。グルーピングを考えるときに共分散行列じゃなくて相関行列によるマハラノビス距離を考えないといけない点が面白ポイントで、実験結果も良かったので最初は統計のトップジャーナルに投げてみたが、あんまり評価してもらえず、途中で生物統計系のデータ解析にすり替えたら幸運にもBiometricsに拾ってもらえた。
Sugasawa, S., Nakagawa, T., Solvang, H. K., Subby, S. and Alrabeei, S. (2023). Dynamic spatio-temporal zero-inflated Poisson models for predicting Capelin distribution in the Barents sea. Japanese Journal of Statistics and Data Science 6, 1-20.
2019年12月@ロンドンでのCMStatisticsに参加し、中川さん (現明星大) の紹介でIMR (ノルウェー王立海洋研究所) のSolvang先生と会う機会があった。当時自分が空間データの階層モデリングなどを研究していたり、IMR側では少々複雑な空間データを分析したいモチベがあったため、共同研究をすることになった。直後コロナ禍となり、打ち合わせは全てオンラインで行い、他の共著者であるSamとSalahとは一度も対面で会うことなく論文が掲載された。その後もIMRとは共同研究を進めていたが、IMRを訪問する機会はなく、2025年1月に初めてIMRを訪問した。
Sugasawa, S. and Kobayashi, G. (2022). Robust fitting of mixture models using weighted complete estimating equations. Computational Statistics & Data Analysis 174, 107526.
小林さん(現明治大)が勉強会で有限混合モデルのロバスト推定の論文を紹介していて、その手法が個人的にはad-hocすぎて微妙だなと感じて考え始めた研究。当時ロバストダイバージェンスの研究を色々やっていたので、(例えばdensity power divergenceが与える) 重み付き推定方程式のアイデアを借用して、有限混合モデルの潜在変数 (どのクラスターに属するかの変数) を所与として完全重み付き推定方程式を経由したら自然な方法が作れるかなと考えた。多次元のskew normal mixtureなどについても綺麗なEEE (expectation estimating equation) アルゴリズムが導出できたし、実験結果も悪くなくて満足だった。モチベとなった既存文献が某計算機統計ジャーナル (≠CSDA) に掲載されていたので、この論文も同じところに出したのだが、major revisionからのrejectを食らい、CSDAに流れついた。
Hamura, H., Irie, K. and Sugasawa, S. (2022). Log-regularly varying scale mixture of normals for robust regression. Computational Statistics & Data Analysis 173, 107517.
Hamura et al. (2021, BA)の研究の後に正規分布の縮小事前分布の研究 (未刊行) を行い、それがロバストベイズに応用可能であることがわかり、この研究がスタートした。既存研究として、t分布 (コーシー分布) よりも裾が厚い分布を誤差分布に使わないと、事後分布全体のロバスト性が達成できないという面白い結果があったのだが、その論文で提案されている分布はMCMCとして組み込むにはやや使いづらいものだったので、何とかできないかなと思っていた。この論文で提案した誤差分布は、t分布 (コーシー分布) よりも裾が厚いが、t分布のように正規分布のスケール混合で書けるような使いやすい誤差分布で、単なる線形回帰モデルだけではなく、階層型の線形回帰 (混合効果モデルなど) にも自然に拡張して使えるものだったため、良い分布ができたなと思っていた。既存文献が某ベイズ統計のジャーナルに掲載されていたので、この論文も同じジャーナルに載って然るべきと考えて投稿したが、major revisionからのrejectを食らい、今でも強く根に持っている とても良い経験になった。その後も流れが悪く、いろんな統計ジャーナルでrejectを食らい続けたが、最終的にはCSDAに拾ってもらった。
Nakagawa, M. and Sugasawa, S. (2022). Linguistic distance and economic prosperity: a cross-country analysis. Review of Development Economics 26, 793-834.
当時東大CSISの同僚だった中川さんとの共同研究。東大柏キャンパスでは毎年キャンパス公開というイベントをやっていて、自分と中川さんで「統計・経済なんでも相談」というブースを出したが、全然人が来ず2人で研究の雑談をしていたら始まった研究。実証研究なので自分は解析担当として参画した。
Kobayashi, G., Yamauchi, Y., Kakamu, K., Kawakubo, Y. and Sugasawa, S. (2022). Bayesian approach to Lorenz curve using time series grouped data. Journal of Business and Economic Statistics 40, 897-912.
小林さん (現明治大)、川久保さんが千葉大の学内資金による研究プロジェクトを立ち上げて、山内さん (当時東大院生・現名古屋大) と自分が研究員として出入りしていたときに取り組んだ研究。データからローレンツ曲線を推定する方法自体は研究の蓄積があったものの、状態空間モデルのアイデアを使ってローレンツ曲線の時間変化をモデル化するのが新しかった。所得分布推定に詳しい各務先生 (現名古屋市立大) にも共著者として入ってもらい、大変なrevisionを経て無事に掲載された。この研究に取り組んでいた2020年前後の5年後に、各務先生を筆頭にしてISBA (国際ベイズ分析学会) のworld meeting (2026年名古屋開催) の企画に携わることになるとは思いもよらなかった。
Hamura, H., Irie, K. and Sugasawa, S. (2022). On global-local shrinkage priors for count data. Bayesian Analysis 17, 545-564.
2019年に羽村さんが修論でポアソン分布の縮小推定について研究をしていて、その内容を入江さんと聞いたときに、当時2人とも興味を持っていたglobal-local shrinkage priorの切り口で何か議論ができないかという話になり、羽村さんも交えて3人でディスカッションすることになった。その際に大まかな方向性と示したい理論について固めたのだが、わりとすぐに羽村さんが面白い理論結果を作ってくれて、それを元に実装&数値計算をやった。面白い問題設定 + 新しい理論 + 効率的な計算アルゴリズムの開発 (実際に簡単なMCMCが導出できる) ということで、最初はトップジャーナル間違いなしと思っていたのだが意外と上手くいかず、最終的にはBAに落ち着いた。
Sugasawa, S., Morikawa, K. and Takahata, K. (2022). Bayesian semiparametric modeling of response mechanism for nonignorable missing data. TEST 31, 101-107.
2018年から森川さん (現アイオワ州立大) らと一緒にオンラインでBiased sampling (特に欠測データ・因果推論など) に関する勉強会を定期的に開催しているのがキッカケで、高畑さん (当時慶應経済の博士課程学生) も含めた共同研究として進めたもの。初めて欠測データ×ベイズの研究を扱い、このあたりから因果推論への関心も出てきた。
Saegusa, T., Sugasawa, S. and Lahiri, P. (2022). Parametric bootstrap confidence intervals for the multivariate Fay-Herriot model. Journal of Survey Statistics and Methodology 10, 115-130.
2020年2月 (コロナの直前) にメリーランド大学 (米国) に1週間研究滞在をした際に取り組んだ研究。
Sugasawa, S. and Kim, J. K. (2022). An approximate Bayesian approach to model-assisted survey estimation with many auxiliary variables. Statistica Sinica 32, 1-22.
2018年6月に小地域推定の学会@上海でKim先生と出会ったことがキッカケで、2018年9月にKAIST@韓国を1週間訪問 (Kim先生はアイオワ州立大学の所属だが当時は一定期間KAUSTにいた) したときのディスカッションに基づく研究。研究のアイデア自体はKim先生が持っていたので、1週間の滞在中に実装・数値実験・執筆を集中的にやってある程度形にしてから帰国した。
Sugasawa, S. and Murakami, D. (2021). Spatially clustered regression. Spatial Statistics 44, 100525.
2018年から東大CSISに異動して空間データ分析の方法論について研究したいなと思っていたときに、Sugasawa (2021, JASA) で使ったグルーピングの方法が空間データにうまく使えるかもと思い村上さん (統数研) に相談したのがキッカケで始まった研究。次男が生まれる1ヶ月前に6週間締切のrevisionが返ってきて、帝王切開の手術を待っている間に病院の待機室でrevision用のレターを必死に書いていたことを思い出す。
Sugasawa, S. (2021). Grouped heterogeneous mixture modeling for clustered data. Journal of the American Statistical Association 116, 999-1010.
2018年3月に環境統計シンポジウム@統数研で発表することになり、クラスターデータの研究 (Sugasawa et al. 2019, STCO) を話そうと思って準備していたら、結構計算が重いので何か代替的な方法がないかなと思って考え始めた研究。2018年2月に長男が産まれて、2018年4月から東大への異動も決まっていて、謎のエネルギーが湧いて (若気の至りで) 単著で書くことを決意した。
査読自体はrevisonに1年近くかかったけど、比較的順調に進んで無事にアクセプトされた。アクセプトされたときは嬉しすぎて高級なウイスキーを買った。この論文で統計学会の小川賞も受賞できたので、とても思い出深い研究。また、この研究を機にグループ構造を用いた分析手法をいくつか考えるキッカケになった。2015年くらいにパネルデータに対するグループ型固定効果推定の方法がEconometrticaに載っていて、ひょんなことからその論文を読んだのがこの研究のアイデアの根幹になっているので、たまには近い分野の論文やアイデアを知っておくことも重要だなと感じた。
Sugasawa, S. and Noma, H. (2021). Efficient screening of predictive biomarkers for individual treatment selection. Biometrics 77, 249-257.
統数研特任研究員時代に、経験ベイズ的なスクリーニング手法と異質因果効果に関する研究を別々に進めていて、2つを組み合わせたら面白い方法が作れるかなと思って始めた研究。予想以上にスムーズにBiometricsからアクセプトしてもらって、この論文がキッカケで計量生物学会から若手の奨励賞ももらえた。
Optimal discovery procedureと呼ばれる経験ベイズ的なスクリーニング法は変量効果の考えが根底にあるので、修士・博士研究で培った知見が活きた形になっている。知っていることを元に少しずつ違うことをやっていると気付いたら新しい分野に参入できている感じだった。
Ito, T. and Sugasawa, S. (2021). Improved confidence regions in meta-analysis of diagnostic test accuracy. Computational Statistics & Data Analysis 153, 107068.
伊藤さん (現北海道大) が博論で多次元変量効果モデルにおいて精度の高い信頼/予測区間を構成する研究をやっていて、メタアナリシスに応用できないかということで始めた研究。個人的にはブートストラップなどの重い繰り返し計算に依らず被覆精度の高い信頼領域を構成できて良いなと思ったが、Biostat系のジャーナルには全然ウケずにCSDAに流れ着いた。
Sugasawa, S. and Noma, H. (2021). A unified method for improved inference in random-effects meta-analysis. Biostatistics 22, 114-130.
統数研特任研究員時代に取り組んだ研究で、どうやって精度の良い信用区間を得るかというテーマの研究。(一次元の)メタアナリシス自体は小地域推定で使われている混合効果モデルとほぼ一緒なので取り組みやすかった。一次元のメタアナリスについての結果が得られた後に、多次元のメタアナリシスまで議論を広げて、その際にメタアナリシス周りをいろいろと勉強することができた。やはり新しいことを学びたかったら実際に研究してみるのが一番良い。
Kobayashi, G., Sugasawa, S., Tamae, H. and Ozu, T. (2020). Predicting intervention effect for COVID-19 in Japan: state space modeling approach. BioScience Trends 14, 174-181.
緊急事態宣言に入ってすぐの頃、何かデータ分析でエビデンスが出せないかと思い、データをかき集めて1週間くらいで論文を書いた。リアルタイムなデータを扱っていたので、revision (2週間くらいで返ってきた) でデータを更新して再解析しないといけないのがちょっと大変だった。内容も内容だけに結果を一瞬テレビに取り上げてもらって新鮮だった。
Sugasawa, S. and Kubokawa, T. (2020). Small area estimation with mixed models: a review. Japanese Journal of Statistics and Data Science 3, 693-720.
久保川先生から突如「小地域推定のレビュー論文を一緒に書かないか」と誘われて書いたもの。mixed modelを使った小地域推定の方法のレビューとしては直近のものまで含めてかなり包括的に扱って最終的にとても良い内容になった。Springerから本を出したのはこの原稿がキッカケの1つでもある。
Hashimoto, S. and Sugasawa, S. (2020). Robust Bayesian regression with synthetic posterior distributions. Entropy 22, 661.
2018年7月のISBA@エディンバラで橋本さん (広島大) とディスカッションしたことがキッカケで始まった研究。当時自分も橋本さんもダイバージェンスを使ったロバスト統計の研究に取り組んでいたため共同研究は自然な流れだった。2018年12月にCMStatistics@ロンドンに参加したときに、一般化ベイズの話を聞いたのがキッカケでこの研究に取り入れることになった。
Sugasawa, S., Kobayashi, G. and Kawakubo, Y. (2020). Estimation and inference for area-wise spatial income distributions from grouped data. Computational Statistics & Data Analysis 145, 106904.
東大CSISに異動したタイミングで小林さん・川久保さんが柏の葉キャンパスを訪問してくれて、そのときのディスカッションから始まった研究。初めて空間過程を使った階層モデルを扱ったので、いろいろと勉強しながら進めた。
Sugasawa, S. (2020). Robust empirical Bayes small area estimation with density power divergence. Biometrika 107, 467-480.
2017年前後にダイバージェンスを使ったロバスト統計をいろいろと勉強していて、2017年の年始に急に降ってきたアイデアを爆速で論文にした記憶がある。研究開始したときは任期付研究員だったので、何か良い論文を単著で書かなきゃという思いがあり、(大変なことを承知の上で) 単著で進めることを決意した。reject and resubmission -> minor revision×2 (実質major revisionくらいの量) を経てアクセプトまで最終的に2年半くらいかった。2019年にISI@クアラルンプールに参加していたときにホテルのベッドでゴロゴロしてたらアクセプトのメールを受け取ったことを今でも覚えている。
Sugasawa, S. and Kubokawa, T. (2019). Adaptively transformed mixed model prediction of general finite population parameters. Scandinavian Journal of Statistics 46, 1025-1046.
M2のときから取り組んでいる研究で修士論文の一部であり、初めて国際会議で発表した研究。途中で論文の枠組みなど大幅な改訂をしたのもあり、最終的に掲載されるまで時間がかかってしまった。博論に含めた研究として最後にアクセプトされた研究でもある。
Sugasawa, S., Kubokawa, T. and Rao, J. N. K. (2019). Hierarchical Bayes small area estimation with an unknown link function. Scandinavian Journal of Statistics 46, 885-897.
2015年にRao先生を訪問して以降メールのやりとりを続けていて、Sugasawa, Kubokawa and Rao (2018, TEST) の拡張として始めたのがこの研究。 メールでRao先生に進捗を報告する度に手書きの細かいコメントとメモが送られてきて、それを解読&対応するのが結構大変だった思い出。この論文のrevisionをやっていた2018年8月に再度オタワを訪問して、Statistics Canada (カナダ統計局) でこの研究を発表させてもらった。
Sugasawa, S., Kawakubo, Y. and Datta, G. S. (2019). Observed best selective prediction in small area estimation. Journal of Multivariate Analysis 173, 383-392.
2017年3月に川久保さんと共にDattaさん (ジョージア大) を訪問し、そのときのディスカッションから生まれた研究。師匠の久保川先生の教え通り、1 visit 1 paper (1回の訪問につき1本論文を書く) を忠実に守っている。ジョージア大の周りには何もなくて、10日間くらいの滞在だったけどずっとホテルのロビーかオフィスで研究している毎日だった。
Sugasawa, S., Kobayashi, G. and Kawakubo, Y. (2019). Latent mixture modeling for clustered data. Statistics and Computing 29, 537-548.
修士から混合効果モデルの研究をしていて、平均の異質性だけではなく分布全体の異質性を表現できるようなモデルはないかなと考えていて思いついた手法。グループ全体で共通の潜在分布を想定し、各グループの分布をグループ毎に異なる混合割合による有限混合によって与えることで、分布の意味でのborrowing strengthを自然に与えることができる点が面白ポイント。この論文ではグループごとの混合割合にディリクレ分布を仮定しているため、計算が結構大変なのが難点だったのだが、それを軽減しようとグルーピングのアプローチを取り入れたSugasawa (2021, JASA)のキッカケにもなった。
Sugasawa, S., Kubokawa, T. and Rao, J. N. K. (2018). Small area estimation via unmatched sampling and linking models. TEST 27, 407-427.
2015年8月にRao先生 (カールトン大@オタワ) を訪問してそのときのディスカッションから生まれた研究。初めての研究訪問だったのでいろいろ苦戦したけど、夏のオタワは最高に過ごしやすかった思い出。
Sugasawa, S., Noma, H., Otani, T., Nishino, J. and Matsui, S. (2017). An efficient and flexible test for rare variant effects. European Journal of Human Genetics 25, 752-757.
統数研の研究員になって初めて取り組んだ研究。これまで数理統計的な内容の研究しかしてこなかったので、応用統計の側面が強い論文を書くのはかなり苦労した。当時の上司である野間先生にいろいろとコメントをもらいながら書いたし、この研究のおかげで応用統計系の論文を書くスキルがだいぶ身についたと思う。
Sugasawa, S. and Kubokawa, T. (2017). Transforming response values in small area prediction. Computational Statistics & Data Analysis 114, 47-60.
2015年8月に小地域推定の大家であるJ.N.K. Rao先生を訪問したときに、Statistics Canada (カナダ統計局) でSugasawa and Kubokawa (2015, JMA)の内容を発表する機会があって、発表準備をしているうちに実用上の限界に気付き、もう少し改良できないかなと思って書き始めたのがこの研究。査読が異様に厳しくて、なぜかrevisionを4回くらいやって (3回目のrevisionではこれまでの査読の経緯をひっくり返すような厳しい要求が返ってきて) かなり大変だった。ただ、このあたりから査読コメントでいくら厳しいことが書かれていても「major revisionなら是が非でもねじ込める」という謎の自信がついた。
Sugasawa, S., Tamae, H. and Kubokawa, T. (2017). Bayesian estimators for small area models shrinking both means and variances. Scandinavian Journal of Statistics 44, 150-167.
当時1つ下の後輩だった玉江さんが平均分散同時縮小モデルの論文を読んでいて、自分も一緒に読んでいたらベイズで綺麗に解けることを発見して1ヶ月くらいで論文にした内容。この論文が人生で初めてのベイズの論文。このモデルは頻度論的に推定するとモンテカルロ積分を含んで数値的に不安定になるのが、ベイズで推定すると安定的に推定することができ、ベイズ的な方法の研究に注力するキッカケになった研究でもある。
Kubokawa, T., Sugasawa, S., Ghosh, M. and Chaudhuri, S. (2016). Prediction in heteroscedastic nested error regression models with random dispersions. Statistica Sinica 26, 465-492.
久保川先生がMalayとSanjayと共同研究をしていて、RA的な立場で主に数値実験周りを担当した研究。1週間くらいで実装して結果報告したらすごい喜んでもらえた記憶。ここらへんからシミュレーションの設計とかが上手くなってきた気がする。
Sugasawa, S. and Kubokawa, T. (2015). Parametric transformed Fay-Herriot model for small area estimation. Journal of Multivariate Analysis 139, 295-311.
M1の5月くらいに久保川先生の研究室を初めて訪問して、そのときにネタとして振ってもらった論文。論文の書き上げから査読対応まで手取り足取り教えてもらった。D1 (2015年) の4月1日に上野の交差点でメールを開いたらアクセプトの連絡が来ていたことを今でも覚えてる。