第19章: 実証研究の実施

Jeffrey Wooldridge (2016).
Introductory Econometrics: A Modern Approach
Seventh Edition. Cengage Learning.

2025-04-04

19-1 問題の提起

19-1 問題の提起

成功する実証分析の基礎は、データで答えられる具体的な問題を提起することから始まる。

明確な目標がなければ、データ収集は非効率的になり、重要な変数を見逃したり、不適切なサンプルを選択したりする可能性がある。

問題を考える際にはデータの入手可能性やプロジェクトの期間を考慮する必要があるが、問題の具体性が最も重要である。

研究テーマの選択

研究テーマは様々な経済分野から生まれる:

研究論文を探すためのリソース

テーマ選択時の重要な考慮事項

適切に定式化された研究問題は具体的であるべきだ。

19-2 文献レビュー

19-2 文献レビュー

実証論文はたとえ短くても、関連文献のレビューを含むべきである。

オンライン検索サービスにより、関連研究を見つけることが容易になった。

検索の際は、キーワード検索では表示されない可能性のある関連トピックも考慮する必要がある。

例えば、アルコールの影響に関する研究は、薬物使用の影響に関する研究に示唆を与えることがある。

文献レビューの組み込み方

研究者によって文献レビューの組み込み方は異なる:

19-3 データ収集

19-3a 適切なデータセットの決定

データには様々な形態がある

選択は研究問題と利用可能なリソースに依存することが多い。

個人や家族レベルの問題では、調査による単一のクロスセクションが一般的だが、十分な制御変数がなければ因果関係の確立は困難である。

パネルデータ

パネルデータセット(同一単位の複数の観測値を時間経過とともに収集)は観測されない効果をコントロールするのに役立つが、個人に関して入手するのは難しい。

法人単位(学校、都市、州)のパネルデータは、これらの主体が存続する傾向があり、政府機関が定期的にそのような情報を収集するため、より容易に入手できる。

19-3b データの入力と保存

データは印刷形式または電子形式で入手できる。

電子データの場合、テキスト・ファイルが計量経済学ソフトウェアでの使用に最も柔軟性を提供する。

データ編成は重要である:

データの保存

データ入力のオプション:

田中注:現在では、Excelにデータを入力して、ExcelもしくはCSV形式で保存し、RやStataなどの統計ソフトで読み込むことが一般的である。

19-3c データの検査、クリーニング、要約

データ構造を理解することは非常に重要である。主な考慮事項は以下の通り:

要約統計量を通じたエラーの検出は不可欠である。予期しない最小値/最大値、平均値、標準偏差を発見することで、コーディングエラーが明らかになる場合がある。

時系列データの場合、季節調整と適切な順序付けを理解することが重要である。

19-4 計量経済学的分析

19-4 計量経済学的分析

テーマを確立し適切なデータを収集した後、計量経済学的アプローチを決定する。

最小二乗法(OLS)を使用する場合でも、以下の主要な仮定に対処することによりその適切性を正当化する必要がある:

注意

避けるべき一般的な間違い:

クロスセクション分析では、分散不均一性を考慮し、適切な場合には頑健な統計を使用する。

時系列アプリケーションでは、レベルと差分、トレンド、季節性、およびラグ構造に関する追加の注意が必要である。

モデルの定式化と感度分析

モデルの誤特定の可能性については、誤特定分析を実施して可能なバイアスの方向を推定する。

操作変数を使用する場合は、その妥当性を慎重に正当化する。

優れた実証論文には感度分析が含まれる

パネルデータ

パネルデータでは、複数のアプローチが利用可能:

データマイニング(有意な結果が見つかるまで様々なモデルを検索する慣行)には注意が必要である。ほとんどすべての研究者が異なる定式化を試すが、このプロセスを明示的に認め、結果を代表的に報告することが重要である。

19-5 実証論文の執筆

19-5a 序論

序論では目的と重要性を確立し、通常は文献レビューも含む。効果的な序論には以下が含まれる:

19-5b 概念的(または理論的)フレームワーク

このセクションでは、研究問題に答えるための一般的なアプローチを説明する。以下が含まれる場合がある:

19-5c 計量経済学的モデルと推定方法

推定するモデルを表す方程式を含める。モデル(母集団の関係)と推定方法を区別する。例えば:

\[ \text{colGPA} = \beta_0 + \beta_1\text{alcohol} + \beta_2\text{hsGPA} + \beta_3\text{SAT} + \beta_4\text{female} + u \]

このモデルは母集団の関係を表すため、「ハット」や特定の値を含まない点に注意。

モデルを指定した後、適切な推定方法とその正当性について議論する。

関数形式

関数形式を慎重に検討する:

2SLSなどの高度な方法については、操作変数選択の慎重な正当化を提供する。

19-5d データ

他者が作業を再現できるように、データソースを包括的に説明する。以下を含める:

19-5e 結果

前述のモデルの推定値を提示し、複雑なものに進む前に簡単な定式化から始める場合もある。

複数の変数を持つ複数のモデルの場合は、方程式ではなく表を使用する。

解釈と有意性に焦点を当てる:

関連する仮説検定を提示し、定式化変更に対する結果の感度について議論する。

19-5f 結論

主な発見を簡潔に要約し、注意事項について議論し、さらなる研究の方向性を示唆する。

読者がまず最初にこのセクションを確認して論文全体を読むかどうかを決めることを想定して、このセクションを執筆する。

19-5g スタイルのヒント

まとめ

成功する実証分析には、問題の定式化、文献レビュー、データ収集、計量経済学的定式化、および明確な発表に細心の注意を払うことが必要である。

いかなる研究の質も、このプロセス全体を通じて投入された注意と努力に最終的に依存する。