実証分析の始め方
ミクロ実証に興味がある学部3~4年生向け(卒論)
Step 0. はじめに
やばいと思ったらすぐ逃げる。ある研究室のスライドに「人生で大事な7つのこと」が書かれていると話題に。(HuffPost)を読んでください.
Step 1. 卒論とはどんなものなのかを知る
ゼミの先輩の卒業論文を読んだり,卒業論文梗概集をぱらぱらめくって,卒業研究とはそもそもどんなものかをイメージしましょう.Web上で読めるものでオススメは神戸大学経済学部優秀卒業論文賞の受賞論文です.経済学分野の日本語で書かれた論文のうち,卒論ではない査読付き学術論文を読んでみたい場合は,一橋大学が発行している『経済研究』や日本経済研究センターが発行している『日本経済研究』から探すのがオススメです.
Step 2. 興味のあるトピックを決める
Step 3. 疑問を持つ
トピックに関する疑問を書き出しましょう.「なぜ~の制度はうまくいっていないのか?」,「教科書では~の政策が望ましいと学んだが,実際の政策がそれと異なるのはなぜか?」,「授業で~の分析を学んだが,もっとよい手法があるのではないか?」,「多くの人は~と考えているようだが,本当は違うのではないか?」.何を疑問として挙げてよいか分からない場合は,Google Scholar などでそのトピックを扱っている論文を検索して,どのようなものが (Big) Question になりそうかを考えてみましょう.近年の実証論文であれば,たいていは Introduction の最初の方に (Big) Question が書かれています.トピックの研究動向を整理した「review article」や「survey article」と呼ばれるジャンルの論文(総説論文)がないかも調べてみましょう.Web of Science (契約機関のネットワーク内からアクセス可)では「Review」という document type を指定して検索できます.どこかのHandbookで取り上げられていればそれが参考になるかもしれません(Google Scholar での検索例).
論文は「問い」と「それに対する答え」によって構成されています.「問い」にはそれを明らかにすることに対する何らかの意義が求められます.その疑問に答えることで,誰が得をするでしょうか.「~が生じるミクロ経済学的なメカニズムを明らかにする」(学術的な意義;学術コミュニティが得をする)とか「~という政策の効果を測定することで,効率的な資源配分に資する」(政策的な意義;国民が得をする)といった具合です.
Step 4. データ分析できそうか考える
どのようなデータを使えば疑問に答えられる分析ができそうか見当を付けましょう.最初は「国勢調査の~という項目が市区町村レベルで整備されているので分析に使えるかも」くらいの感触でよいです.同時に,このデータに対してどのような分析方法が適用できるかを考えます.「政策を受ける人と受けない人がいて政策前後でデータがとれるので,DID のフレームワークで分析できるかも」,「クロスセクションのデータで,~を操作変数とみなせるかも」,など.類似のテーマを扱っている論文を参考にしましょう.
このデータ・手法を使うことでどのような問いに答えられるのかを考えます.その問いに意義があることも確認してください.これが卒論で扱う問い (research question)(仮)となります.
(上級者向け)研究実施上どのような難しさがあるかを洗い出して,それに対処する方法をセットで考えてみましょう.「使いたい統計データが紙媒体の冊子でしか存在しない.だから,文字認識のソフトウェアを利用して効率的にデジタイズしよう」,「DID のフレームワークで分析しようと思っているが,parallel trend の仮定が満たされないのではないか.だから,~の変数をコントロールしよう,~で instrument しよう」,といった具合です.
Step 5. 研究テーマ(仮)を考える
上記の Step 1 から Step 4 を行ったり来たりして,「問い・意義・データ・分析方法」の組み合わせを考えましょう.これが研究の「ネタ」となります.最初のうちは4つすべては揃わないかもしれませんが,それで大丈夫です.「ネタ」は1つに絞る必要はありません.複数用意できればベターです.
学術研究は意義と信頼性(正しい方法で分析しているかどうか)の他に新規性 (originality) が求められます.逆に言えば,まだ誰もやっていない要素があれば original な研究となり得ます.特定の先行研究を参照点として(Big question は固定して),別の計量モデルを適用してみる;別のデータセット(国・地域)を使ってみる;データのサブグループに焦点を当てて効果の異質性を見る;といった塩梅です.「先行研究はアメリカのデータを分析していたので,私は日本のデータで分析する」でもよいのですが,その際は日本のデータで分析する必要性を明示します.「日本はアメリカと~の点で制度的背景(慣習・法律など)が異なるので,政策の効果が異なる可能性がある」とか「日本のデータにはアメリカのデータよりも大きな外生的変分が含まれるので,識別がクリーンになる」とか.このもとで,問い・意義を改めて設定します.
Step 3 からここまで思うように進められなかった場合は,アプローチを少し変えてみましょう.(あまり興味のないトピックでもよいので)適当な論文を読んで具体的なイメージを掴みましょう.
日本のデータを分析した論文を探して,気になった論文を軸に検討してみるとよいかもしれません.たとえば,Journal of the Japanese and International Economies (Google Scholar での検索例)や Japanese Economic Review に掲載された論文は日本のデータを使用している可能性が高いです.
日本のデータに拘らずに,AER, JPE, REStud のような権威あるジャーナルに掲載された論文から調べるのもよいです(Google Scholar での検索例).著名なジャーナルにここ数年で複数の論文が出ているトピックは,現在でも学界で興味を持たれている可能性が高いです.ジャーナルの水準を見定めるのは難しいですが,目安としては,たとえば IDEAS や SJR で Top 100 くらいに入っていれば悪くないジャーナルと認識してよいです.「安田リスト」でカウント対象とされているジャーナルであれば信頼性は相当高いです.経済学のジャーナルでない場合は,Eigenfactor で AI score が 1.0 以上なら読んでみる,といった基準が便利です.(注:いずれの基準も,そのジャーナルに掲載された論文の正確性や重要性を保証するものではありません.)
openICPSR (American Economic Review, American Economic J.), Harvard Dataverse (Quarterly J. of Economics, Review of Economics and Statistics, J. of the Association of Environmental and Resource Economists), Zenodo (Review of Economic Studies), Mendeley Data (J. of Public Economics), Journal of Applied Econometrics Data Archive でデータやプログラムが公開されている論文もあります.そうした研究の reproduction (論文と同じ推定値が得られるかを検証すること)から始めてみるのが向いている人もいると思います.どんな理論・計量モデルとデータがあれば,どんな分析ができて,どんな結論を導くことができるのか,をイメージしやすくなります.可能であれば,その研究の貢献とその範囲,および議論可能な範囲を考えましょう.「この論文の研究デザインでは,~の部分については因果効果が十分に識別されている.しかし別の~の部分については分析されていない」,「この論文では~に異質性があることを明らかにしているが,そのメカニズムは明らかにされていない」など.
Step 6. 指導教員に相談する
研究テーマ(仮)を指導教員に見せて相談しましょう.この先何をすればよいか(ネタをどのように修正するか,どんな論文を参照するか,どの手法の勉強をするか,etc.)は指導教員がアドバイスしてくれます.「ネタ」が不完全でも/用意できなくても相談しましょう.学生の大味な相談内容をもとに,本人の興味があり,学術的 and/or 政策的な意義があり,かつ(データ・研究デザイン・卒論提出期限の点で)実行可能なテーマを絞り出すのは指導教員が研究者・教育者として本領を発揮する時です.指導教員に相談する前に,同じゼミの学生(同期・先輩)に見せて意見を求めてもよいです.
Step 7. 指導教員のアドバイスに従う
研究テーマが決まってどのように研究を進めるかについて指導教員からアドバイスを貰ったら基本的にはそれに従いましょう.
指導を受ける際に,次の点に注意しましょう:(1) 教員は研究の進め方に関する「正解」を最初から知っているわけではありません.みなさんが試行錯誤し,それを教員に相談し,ともに解決策を探りながら,研究は進んでいきます.最初から正解が分かっているものは研究とは呼びません.なお,卒研は文字通り研究であると同時に「教育」です.みなさんが問いを立て,文献を調べ,データを取得し,分析し,問いに対する答えを出し,文章としてまとめ,プレゼンテーションする;そうした一連の流れを計画し,教員やゼミ生からのフィードバックを受けて軌道修正しながら自律的に遂行し,また一貫して論理的に思考する訓練です;(2) 教員はエスパーではありません.みなさんがどのような作業をして,どのようなつまづきがあり,どのように対処しようとしているのか,を言語化して教員に伝えるのはみなさんの役割です;(3) 教員も間違えることがあります.にんげんだもの(み);(4) 指導教員に限らず周囲の人間からハラスメントを受けた/受けたかもしれないと感じた場合は躊躇せずに録音・録画しましょう(間に合わなければ日時と具体的内容・同席者をメモ).信頼できる友人や教員に相談し,必要があれば大学の対応窓口に行きましょう.刑法に触れる行為を受けた場合は警察に行きましょう.重要なのは証拠です.
Step 8. 分析する
R が便利です.データやコードの管理は構造的に行いましょう(cf. Krystalli, 2019).日本の市区町村レベルのデータをパネル化するのであれば,市区町村コードのコンバータ(Kondo, 2019)やMunicipality Map Maker(市区町村区域のGISデータ生成ツール)が便利です.
世の中には2種類の HDD/SSD があります.すでに壊れているものと,これから壊れるものです.データや原稿は頻繁にバックアップをとりましょう.Dropbox や OneDrive の同期機能を活用しましょう.万一PCが起動できなくなったら「KNOPPIX データ救出」で調べてください.
Step 9. 論文を書く
テーマや分析方法が似ている論文を読んで,その構成や内容・書き方を参考にしてください.剽窃に注意しましょう.翻案も質と量によってはアウトです.「卒業論文 書き方」や「economic paper writing」で検索するとそれらしい情報が見つかります.チョーベー『英語論文の書き方』(講談社; amazon.co.jp)のような書籍も参考になります.Wordを使う場合は校閲機能(変更履歴の記録)を活用しましょう.数式が多ければ TeX が便利です.
分析・論文執筆で重要なのは「割り切る力」です.完璧な論文は存在しません.(データ,能力,時間の制限によって)できないこと/できなかったことに目を向けるのではなく,できること/できたことに目を向けましょう.世の中の経済学部には卒業論文がない(または必須ではない)ところが珍しくありません.経済学分野では学部時点の知識・スキルで研究論文を書くのはハードルが高いと考えられているようです.卒業研究に取り組んでいる自分を自分で褒めてください.
Step 10. 発表する
サイモンフレーザー大Karaivanov先生の「Presenting Economics Research (PDF)」に従ってプレゼンテーション・スライドを作成してください.具体例として,シカゴ大伊藤先生・UCB Shapiro先生・Royal Economic Society YouTube channelなどを参考にできます.
何度も練習しましょう.慣れないうちは練習用に発表原稿を作るとよいです.
討論者や聴衆からの質問には簡潔に答えましょう.答えようがない質問が来たら「重要なご指摘だと思います.指導教員と相談します」とか「今後の課題とします」で切り抜けます.残念なことに,発表を spoil するコメント(≠ 厳しいコメント)をする人が稀にいますが,発表時は適当にあしらって,発表終了後は忘れてください.卒研発表会で教員が質問・コメントする目的は,(成績評価をするという目的はもちろんあるのですが,)畢竟研究の質を向上させることです.発表者を不必要に discourage させるだけのコメントをする教員は自分の役割を理解できておらず,相手をするのは時間の無駄です.
(以上,反省と自戒でした.)
修士以上向け
The Effect の Chapter 1, 2 を読みましょう.Field top journal (+ Top 5) や WP/DP (NBER SI, Job market paper) を読んでテーマを見つけましょう.一緒に論文を読む仲間を見つけましょう.学会に参加して同分野・同年代の知り合いを作りましょう.