本論文では,未観測交絡因子が存在し,かつ二値アウトカムの状況での因果効果の推定方法を検討している.この状況では,操作変数法の一種である, two-stage residual inclusion (2SRI; 二段階残差投入法) や limited information maximum likelihood (LIML; 制限情報最尤法) の利用を検討できる.これらの方法は,アウトカムだけではなく治療変数のモデルも適切に特定する必要があることが知られているが,モデル選択の適用を検討した先行研究は,著者の知る限り存在しない.そこで本研究では,2SRIとLIMLに適用可能なモデル選択規準を紹介し,シミュレーションデータ/実データを通して,その性能を比較検討した.結果としては,モデル選択を伴うLIMLがバイアス・平均二乗誤差の観点で最も性能が良く,先行研究の結果と整合する結論が得られた.
しかし,当該シミュレーションデータは限られた状況を想定しているため,より現実のデータに即したシミュレーションデータに基づく性能を検証する必要がある.