必要なパッケージの読み込み

wooldridge: データセット

library(wooldridge)

AER: 操作変数推定 ivreg()

install.packages("AER")
library(AER)

car: 線形仮説検定 linearHypothesis()

library(car)

15-1 動機: 省略変数と操作変数

内生変数問題の背景

これまでの対処法:
1. 省略変数バイアスを無視（不偏性・一致性を失う）
2. 代理変数の利用（第9章）
3. 固定効果・1階差分（第13・14章）：時間不変の省略変数のみ対処可能
本章では別のアプローチ：操作変数法 (Instrumental Variables, IV)
- 時変の省略変数・測定誤差にも対処可能
- 応用計量経済学で最重要手法の1つ

単純回帰モデルでの問題設定

モデル [15.1]: \[\log(wage) = \beta_0 + \beta_1 educ + u\]
\(u\) には観察不能な能力 (\(abil\)) が含まれる
\(\text{Cov}(educ, u) \neq 0\) \(\Rightarrow\) OLSは不一致
必要なのは \(educ\) の操作変数 \(z\)

操作変数 (Instrumental Variable) の条件

変数 \(z\) が \(x\) の操作変数になるための2条件:

操作変数の外生性 (Instrument Exogeneity) [15.4]: \[\text{Cov}(z, u) = 0\] \(z\) は誤差項と無相関（検定不可能: 経済理論で正当化）
操作変数の関連性 (Instrument Relevance) [15.5]: \[\text{Cov}(z, x) \neq 0\] \(z\) は内生変数 \(x\) と相関（検定可能: 第1段階回帰）

操作変数の候補例（賃金方程式）

IV候補	外生性	関連性
父親の教育年数 (`fatheduc`)	ある程度成立（能力との無相関を仮定）	`educ`と正相関（検定可能）
兄弟の数 (`sibs`)	成立しやすい（能力との無相関）	`educ`と負相関（検定可能）
誕生四半期 (`frstqrt`)	主張される（季節と能力は無関係）	わずかな相関（問題あり）
IQ	外生性を欠く（abilの代理変数）	—

IV推定量の導出

母集団の共分散より: \[\text{Cov}(z, y) = \beta_1 \text{Cov}(z, x) + \text{Cov}(z, u)\]
\(\text{Cov}(z, u) = 0\) のとき、\(\beta_1\) を識別 (identify) できる [15.9]: \[\beta_1 = \frac{\text{Cov}(z, y)}{\text{Cov}(z, x)}\]
標本対応のIV推定量 [15.10]: \[\hat{\beta}_1^{IV} = \frac{\sum_{i=1}^n (z_i - \bar{z})(y_i - \bar{y})}{\sum_{i=1}^n (z_i - \bar{z})(x_i - \bar{x})}\]

IV推定量の性質

一致性: \(\text{plim}(\hat{\beta}_1^{IV}) = \beta_1\)（両条件が成立するとき）
不偏性なし: IV推定量は小標本では不偏でない（大標本が望ましい）
漸近分散 [15.12]: \[\text{AsyVar}(\hat{\beta}_1^{IV}) = \frac{\sigma^2}{n \sigma_x^2 \rho_{x,z}^2}\] ここで \(\rho_{x,z}^2\) は \(x\) と \(z\) の相関の二乗
OLS分散 \(= \sigma^2 / (n\sigma_x^2)\) より常に大きい（\(\rho_{x,z}^2 \leq 1\)）
\(\rho_{x,z}^2\) が小さいほど IV の分散は巨大に \(\Rightarrow\) 弱い操作変数問題

15-1a IV推定量の統計的推論

例15.1: 既婚女性の教育収益率 (MROZ)

データ: 既婚女性428人（就業者のみ）
モデル: \(\log(wage) = \beta_0 + \beta_1 educ + u\)
IV: \(fatheduc\)（父親の教育年数）→ 関連性: 有（検定可）、外生性: 仮定

# mroz データセットを読み込む
data(mroz)
# 就業者（inlf == 1）428人を抽出
mroz_work <- subset(mroz, inlf == 1)

例15.1: 第1段階（関連性確認）

# educ を fatheduc に単回帰して関連性を確認
first_rel <- lm(educ ~ fatheduc, data = mroz_work)
# fatheduc の係数・SE・t値・p値を表示
coef(summary(first_rel))["fatheduc", ]

##     Estimate   Std. Error      t value     Pr(>|t|) 
## 2.694416e-01 2.858634e-02 9.425538e+00 2.764936e-19

例15.1: OLS vs IV の比較

# OLS推定
res_ols151 <- lm(lwage ~ educ, data = mroz_work)
# IV推定: 書式 ivreg(被説明変数 ~ 内生変数 | 操作変数)
# fatheduc を educ の IV に指定
res_iv151 <- ivreg(lwage ~ educ | fatheduc, data = mroz_work)
# educ の係数と標準誤差を OLS・IV で比較
rbind(
  OLS = coef(summary(res_ols151))["educ", 1:2],
  IV  = coef(summary(res_iv151))["educ", 1:2]
)

##       Estimate Std. Error
## OLS 0.10864866 0.01439985
## IV  0.05917348 0.03514177

例15.1: 結果の解釈

OLS: \(\hat{\beta}_{educ} \approx\) 0.109 (se = 0.014)
IV: \(\hat{\beta}_{educ} \approx\) 0.059 (se = 0.035)
IV標準誤差はOLSの約2.4倍 \(\Rightarrow\) 信頼区間がOLS推定値を含む

例15.2: 男性の教育収益率 (WAGE2)

IV: \(sibs\)（兄弟姉妹数）— 能力と無相関と仮定

# wage2 データを読み込む
data(wage2)
# 関連性確認: sibs（兄弟数）が多いほど学歴は低いか
# sibs の係数（負なら関連性あり）
lm(educ ~ sibs, data = wage2)$coef["sibs"]

##       sibs 
## -0.2279164

例15.2: OLS vs IV の比較

# OLS推定
res_ols152 <- lm(lwage ~ educ, data = wage2)
# IV推定（sibs を educ の IV に指定）
res_iv152  <- ivreg(lwage ~ educ | sibs, data = wage2)
# educ の係数と標準誤差を OLS・IV で比較
rbind(
  OLS = coef(summary(res_ols152))["educ", 1:2],
  IV  = coef(summary(res_iv152))["educ", 1:2]
)

##      Estimate  Std. Error
## OLS 0.0598392 0.005963094
## IV  0.1224326 0.026350568

IV推定値 (\(\approx\) 0.122) はOLS (\(\approx\) 0.06) より大きい

15-1b 弱い操作変数の問題

不良操作変数の漸近バイアス [15.19]

\[\text{plim}\, \hat{\beta}_1^{IV} = \beta_1 + \frac{\text{Corr}(z, u)}{\text{Corr}(z, x)} \cdot \frac{\sigma_u}{\sigma_x}\]

外生性 \(\text{Cov}(z, u) = 0\) が成立 \(\Rightarrow\) IV は一致推定
\(\text{Corr}(z, x)\) が小さいとき: \(\text{Corr}(z, u)\) がわずかでも不一致が巨大
OLSのバイアス [15.20]: \[\text{plim}\, \hat{\beta}_1^{OLS} = \beta_1 + \text{Corr}(x, u) \cdot \frac{\sigma_u}{\sigma_x}\]
IV が OLS より悪い可能性: \(\text{Corr}(z, u)\) が小さくとも \(\text{Corr}(z, x)\) が非常に小さければ IV の不一致は OLS より大きくなりうる

例15.3: 喫煙と出生時体重 (BWGHT) — 悪い操作変数

IV候補: \(cigprice\)（タバコ価格）→ \(packs\) の関連性が皆無

# bwght データを読み込む
data(bwght)
# 関連性確認: cigprice（タバコ価格）が packs（喫煙量）と相関しているか
# cigprice の係数を取得（ほぼゼロなら関連性なし）
lm(packs ~ cigprice, data = bwght)$coef["cigprice"]

##     cigprice 
## 0.0002828844

# → ほぼゼロ: cigprice は packs の有効な IV ではない
# （関連性条件 [15.5] を満たさない）

結論: 操作変数候補は必ず関連性を統計的に確認すること
関連性がない場合、IV推定値は意味をなさない

15-2 重回帰モデルへのIV拡張

構造方程式と外生変数・内生変数

構造方程式 (structural equation) [15.22]: \[y_1 = \beta_0 + \beta_1 y_2 + \beta_2 z_1 + u_1\]
- \(y_2\): 内生的説明変数 (\(\text{Cov}(y_2, u_1) \neq 0\))
- \(z_1\): 外生変数 (\(\text{Cov}(z_1, u_1) = 0\)）\(\Rightarrow\) 自身の操作変数
\(z_1\) は構造方程式に含まれるため \(y_2\) の IV に使えない \(\Rightarrow\) 追加の外生変数 \(z_2\) が必要
除外制約 (exclusion restriction): \(z_2\) は構造方程式に現れず外生

誘導型方程式と識別条件

\(y_2\) の誘導型 (reduced form) [15.26]: \[y_2 = \pi_0 + \pi_1 z_1 + \pi_2 z_2 + v_2\]
識別条件 [15.27]: \(\pi_2 \neq 0\)（\(z_2\) が \(y_2\) と偏相関を持つ）
一般化: 構造方程式 [15.28] に \(k-1\) 個の外生変数と1個の内生変数がある場合
- 誘導型 [15.30] で \(z_k\) の係数 \(\pi_k \neq 0\) が識別条件

例15.4: 大学近接性を教育のIVとして使用 (CARD)

IV: \(nearc4\)（4年制大学近辺で育ったか）、Card (1995)

# card データセットを読み込む
data(card)
# OLS推定: lwage を educ + コントロール変数に回帰
res_ols154 <- lm(lwage ~ educ + exper + expersq + black + smsa + south,
                 data = card)
# 2SLS推定: nearc4 が educ の操作変数
# 書式: ivreg(y ~ 内生+外生 | IV+外生)、外生変数は両側に書く
res_iv154 <- ivreg(lwage ~ educ + exper + expersq + black + smsa + south |
                     nearc4 + exper + expersq + black + smsa + south,
                   data = card)

例15.4: OLS vs 2SLS の比較

# educ の係数と標準誤差を OLS・2SLS で比較
rbind(
  OLS = coef(summary(res_ols154))["educ", 1:2],
  IV  = coef(summary(res_iv154))["educ", 1:2]
)

##       Estimate  Std. Error
## OLS 0.07400899 0.003505435
## IV  0.13228884 0.049233236

例15.4: 第1段階回帰（操作変数の関連性確認）

# educ を nearc4 + コントロール変数に回帰
first_stage154 <- lm(educ ~ nearc4 + exper + expersq +
                       black + smsa + south,
                     data = card)
# nearc4 の係数・SE・t値・p値を表示
coef(summary(first_stage154))["nearc4", ]

##     Estimate   Std. Error      t value     Pr(>|t|) 
## 3.373208e-01 8.250044e-02 4.088715e+00 4.451508e-05

\(nearc4\) の \(t\) 値 \(\approx\) 4.09（有意）\(\Rightarrow\) 関連性条件を満たす

例15.4: 結果の解釈

OLS: \(\hat{\beta}_{educ} \approx\) 0.074 (se = 0.004)
IV: \(\hat{\beta}_{educ} \approx\) 0.132 (se = 0.049)（Table 15.1に近似）
IV推定値はOLSの約1.8倍 \(\Rightarrow\) OLSの下方バイアスと整合的
IV標準誤差はOLSの約14倍 \(\Rightarrow\) 95%信頼区間が非常に広い

15-3 二段階最小二乗法 (2SLS)

2SLSのアイデア: 複数の操作変数

内生変数 \(y_2\) に対して複数の除外変数 \(z_2, z_3\) がある場合
それぞれ単独で使えるが、最適な線形結合を使う \(\Rightarrow\) 2SLS
第1段階 (First Stage): \(y_2\) を全外生変数に回帰して fitted values \(\hat{y}_2\) を得る [15.36]: \[\hat{y}_2 = \hat{\pi}_0 + \hat{\pi}_1 z_1 + \hat{\pi}_2 z_2 + \hat{\pi}_3 z_3\]
第2段階 (Second Stage): \(y_1\) を \(\hat{y}_2\) と \(z_1\) に回帰 [15.38]: \[y_1 \text{ on } \hat{y}_2 \text{ and } z_1\]
2SLSの標準誤差は専用コマンドで計算すること（手動計算は標準誤差が不正確）

例15.5: 既婚女性の教育収益率 (MROZ) — 2SLS

除外IV: \(motheduc\), \(fatheduc\)（両親の教育年数）
まず: 両親の教育が \(educ\) と偏相関を持つか確認（\(F\) 検定）

# educ を両親の教育年数 + 経験変数に回帰
first_stage155 <- lm(educ ~ motheduc + fatheduc + exper + expersq,
                     data = mroz_work)
# F 統計量 > 10 が弱操作変数でない目安（Stock-Yogo, 2005）
linearHypothesis(first_stage155, c("motheduc = 0", "fatheduc = 0"))

## 
## Linear hypothesis test:
## motheduc = 0
## fatheduc = 0
## 
## Model 1: restricted model
## Model 2: educ ~ motheduc + fatheduc + exper + expersq
## 
##   Res.Df    RSS Df Sum of Sq    F    Pr(>F)    
## 1    425 2219.2                                
## 2    423 1758.6  2    460.64 55.4 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

例15.5: 2SLS推定

| 左: 内生変数（educ）＋外生変数　| 右: 除外IV（motheduc, fatheduc）＋外生変数

# 2SLS推定: | 左: 内生変数+外生変数、| 右: 除外IV+外生変数
res_2sls155 <- ivreg(lwage ~ educ + exper + expersq |
                       motheduc + fatheduc + exper + expersq,
                     data = mroz_work)
# 定数・educ・exper・expersq の4係数を表示
summary(res_2sls155)$coefficients[1:4, ]

##                  Estimate   Std. Error    t value    Pr(>|t|)
## (Intercept)  0.0481003069 0.4003280776  0.1201522 0.904419479
## educ         0.0613966287 0.0314366956  1.9530242 0.051474174
## exper        0.0441703929 0.0134324755  3.2883286 0.001091838
## expersq     -0.0008989696 0.0004016856 -2.2379930 0.025740027

\(\hat{\beta}_{educ} \approx\) 0.061 (se = 0.031)、5%水準でぎりぎり有意
OLS (\(\approx\) 0.107) より低い \(\Rightarrow\) 能力バイアスと整合的

15-3c 弱い操作変数の検出

Stock-Yogo (2005) の弱操作変数検定

IV推定量は関連性が低い場合、大標本でも深刻なバイアス
実用的な基準 (Stock-Yogo, 2005):
- 操作変数が1つ: 第1段階の \(t\) 値 \(> \sqrt{10} \approx 3.2\)
- 操作変数が複数: 第1段階の除外変数の \(F\) 値 \(> 10\)
より厳密には \(F > 20\)（Olea and Pflueger, 2013）という主張も

Stock-Yogo 検定（例15.5への適用）

# linearHypothesis の結果を ht に保存して F 値を取り出す
ht <- linearHypothesis(first_stage155, c("motheduc = 0", "fatheduc = 0"))
# ht$F[2] が F 値（[1] は NA のため [2] を使う）、>> 10 → 弱い操作変数問題なし
cat("F統計量:", ht$F[2], "\n")

## F統計量: 55.4003

次数条件と階数条件

次数条件 (Order Condition): 除外された外生変数の数 \(\geq\) 内生変数の数
- ちょうど識別 (just-identified): 除外IV数 = 内生変数数
- 過剰識別 (over-identified): 除外IV数 > 内生変数数 \(\Rightarrow\) 検定可能
階数条件 (Rank Condition): 各内生変数に対して少なくとも1つの除外変数が部分相関を持つ
- 実質的に重要: 各内生変数の誘導型回帰で除外IVが有意かを確認

15-4 測定誤差問題へのIV応用

古典的測定誤差とIV

古典的測定誤差モデル [15.45, 15.46]: \[y = \beta_0 + \beta_1 x_1^* + \beta_2 x_2 + u\] \[x_1 = x_1^* + e_1 \quad \Rightarrow \quad \text{OLSバイアス（ゼロ方向）}\]
解決策: \(x_1^*\) の別の測定値 \(z_1\) を IV として使用
- \(z_1 = x_1^* + a_1\)（異なる測定誤差 \(a_1\)）
- \(e_1\) と \(a_1\) が無相関なら \(z_1\) は有効な IV

例15.6: 能力の指標としての2つのテストスコア (WAGE2)

\(IQ\)（第1テスト）と \(KWW\)（第2テスト）を能力の2測定値として使用
\(IQ\) を含む方程式を推定し、\(KWW\) を \(IQ\) の IV として使用
| 左に \(IQ\) を含め、| 右では \(KWW\) に置き換える

# IV推定: 構造方程式（左）→ 誘導型（右、IQ を KWW に置換）
res_iv156 <- ivreg(lwage ~ educ + exper + tenure + married +
                     south + urban + black + IQ |
                     KWW + exper + tenure + married +
                     south + urban + black,
                   data = wage2)

例15.6: 結果

# educ の係数・SE・t値・p値を表示
coef(summary(res_iv156))["educ", ]

##     Estimate   Std. Error      t value     Pr(>|t|) 
## 1.034136e-01 1.543919e-02 6.698122e+00 3.656739e-11

\(\hat{\beta}_{educ} \approx\) 0.103（se = 0.015）: 非有意 \(\Rightarrow\) 測定誤差の相関が疑われる

15-5 内生性検定と過剰識別制約の検定

15-5a 内生性検定

2SLSはOLSより標準誤差が大きい \(\Rightarrow\) 本当に内生性があるか確認したい
Hausman型の内生性検定（回帰ベース）手順:

誘導型で \(y_2\) を全外生変数に回帰し残差 \(\hat{v}_2\) を得る
構造方程式に \(\hat{v}_2\) を追加してOLS推定
\(\hat{v}_2\) の係数が有意 \(\Rightarrow\) \(y_2\) は内生的

15-5a 内生性検定（Rコード）

# Step 1: 誘導型残差を取得（educ の説明されない部分を分離）
v_hat <- residuals(lm(educ ~ motheduc + fatheduc + exper + expersq,
                      data = mroz_work))
# Step 2: 構造方程式に v_hat を追加（有意なら educ は内生）
endog_reg <- lm(lwage ~ educ + exper + expersq + v_hat, data = mroz_work)
# v_hat の係数・SE・t値・p値を表示
coef(summary(endog_reg))["v_hat", ]

##   Estimate Std. Error    t value   Pr(>|t|) 
## 0.05816661 0.03480728 1.67110501 0.09544055

内生性検定の結果解釈

\(\hat{\delta}_1 \approx\) 0.058, \(t \approx\) 1.67：10%水準で有意（示唆的）
5%水準では帰無仮説（\(educ\)が外生）を棄却できない
実務上の推奨: 2SLSとOLSの両方を報告し、差異を議論

15-5b 過剰識別制約の検定

過剰識別（除外IV数 > 内生変数数）の場合: 少なくとも一部のIVが外生かを検定可能
Sargan検定手順:

2SLS推定を行い残差 \(\hat{u}_1\) を得る
\(\hat{u}_1\) を全外生変数に回帰し \(R^2\) を取得
検定統計量 \(nR^2 \sim \chi^2_q\)（\(q\) = 過剰識別制約数）

Sargan検定（Rコード: Step 1–2）

# Step 1: 2SLS残差を取得
u_hat155 <- residuals(res_2sls155)
# Step 2: 残差を全外生変数に回帰（IV の外生性と残差の相関を確認）
oir_reg <- lm(u_hat155 ~ motheduc + fatheduc + exper + expersq,
              data = mroz_work)
# 観測数を取得
n <- nrow(mroz_work)

Sargan検定（Rコード: Step 3）

# Step 3: 検定統計量 nR² ～ χ²(q), q = IV数 - 内生変数数 = 2 - 1 = 1
# n × R² を計算
nR2  <- n * summary(oir_reg)$r.squared
# χ²(1) の上側確率（p値）
pval <- pchisq(nR2, df = 1, lower.tail = FALSE)

\(nR^2 =\) 0.3781
\(p\) 値 \(=\) 0.5386

過剰識別検定の解釈

\(nR^2 \approx\) 0.378, \(p \approx\) 0.539 \(\Rightarrow\) 帰無仮説（両IVが外生）を棄却できない
\(huseduc\)（夫の教育）を追加すると \(nR^2 \approx 1.11\), \(p \approx 0.574\)（2自由度）
注意: 検定は全IVが同一の方向にバイアスを持つ場合は検出できない

15-6 不均一分散と2SLS

不均一分散頑健な2SLS推定

2SLSでも不均一分散が問題になりうる
OLSと同様に、不均一分散頑健標準誤差が利用可能
Breusch-Pagan型の検定: 2SLS残差 \(\hat{u}_1\) を全外生変数に回帰した際の結合有意性

# 2SLS推定（例15.5と同じモデル）
res_hc <- ivreg(lwage ~ educ + exper + expersq |
                  motheduc + fatheduc + exper + expersq,
                data = mroz_work)
# vcovHC(): HC1型の不均一分散頑健分散共分散行列を計算
# coeftest(): 頑健 SE を使って t 検定を再実施、educ 行のみ表示
coeftest(res_hc, vcov = vcovHC(res_hc, type = "HC1"))["educ", ]

##   Estimate Std. Error    t value   Pr(>|t|) 
## 0.06139663 0.03333859 1.84160854 0.06623070

15-7/15-8 時系列・パネルデータへの応用

時系列データへの2SLS適用

時系列構造方程式 [15.52]: \[y_t = \beta_0 + \beta_1 x_{t1} + \cdots + \beta_k x_{tk} + u_t\]
2SLSの漸近的性質は弱従属系列で成立
注意点:
- トレンドや季節性がある場合は時系列ダミーを含める
- トレンド変数は常に自分自身のIVになる
- 単位根を持つ変数は1階差分後に適用
AR(1)誤差の検定: \(\hat{u}_t\) を \(\hat{u}_{t-1}\) に2SLSで回帰（[15.55]）

例15.10: 職業訓練と労働者生産性 (JTRAIN) — FD + IV

FDモデル [15.57]: \[\Delta\log(scrap_i) = \delta_0 + \beta_1 \Delta hrsemp_i + \Delta u_i\]
\(\Delta hrsemp_i\) が \(\Delta u_i\) と相関する懸念 \(\Rightarrow\) \(\Delta grant_i\) を IV に使用

# jtrain データを読み込む
data(jtrain)
# 1988 年のデータを抽出（1階差分変数が格納されている年）
j88 <- subset(jtrain, year == 1988)
# 必要な3変数のみ選択し、欠損値を除去（n = 45 になる）
j88_clean <- na.omit(j88[, c("clscrap", "chrsemp", "cgrant")])
# 2SLS: cgrant（補助金の変化）を chrsemp（訓練時間の変化）のIVとして指定
res_2sls1510 <- ivreg(clscrap ~ chrsemp | cgrant, data = j88_clean)
# chrsemp の係数・SE・t値・p値を表示
coef(summary(res_2sls1510))["chrsemp", ]

##     Estimate   Std. Error      t value     Pr(>|t|) 
## -0.014153164  0.007914742 -1.788202786  0.080790975

例15.10: 結果の解釈

2SLS: \(\hat{\beta}_1 \approx\) -0.014（se = 0.008）: 10時間の訓練増加で不良品率約14%低下
OLS: \(\hat{\beta}_1 \approx\) -0.008（se = 0.005）: 2SLSはOLSの約2倍
第1段階: \(\Delta grant\) の \(t \approx\) 4.72（強い関連性）

結合横断面・パネルデータへの2SLS

結合横断面: 年ダミーは外生 \(\Rightarrow\) 通常のIVと同様に適用
例15.9: 出生率方程式（FERTIL1）で \(educ\) を内生と仮定、両親教育をIVに
パネルデータ + IV: FD後に内生性が残る場合
- FD後のモデルで追加のIVを使用（例15.10が典型例）
- ラグ従属変数を含む動的モデルでもIV/GMM法が必要

第15章のまとめ

手法	状況	R関数
IV (1変数)	内生変数1個、IV1個	`ivreg(y ~ x \| z)`
2SLS	内生変数1個、IV複数	`ivreg(y ~ x+w \| z+w)`
2SLS（複数内生）	内生変数複数	`ivreg()`
頑健SE付き2SLS	不均一分散	`coeftest(, vcovHC())`

まとめ（続き）

操作変数の2条件: 外生性（理論で正当化）、関連性（第1段階で検定）
弱操作変数: 第1段階の \(F > 10\)（Stock-Yogo ルール）
次数条件: 除外IV数 \(\geq\) 内生変数数（識別のための必要条件）
内生性検定: 第1段階残差を構造方程式に追加して \(t\) 検定
過剰識別検定: \(nR^2 \sim \chi^2_q\)（\(q\) = 過剰識別制約数）
代償: IVの分散はOLSより常に大きい \(\Rightarrow\) 大標本が重要
応用: 省略変数、測定誤差、時系列・パネルデータすべてに使用可能

第15章: 操作変数法と二段階最小二乗法

Jeffrey Wooldridge (2018). Introductory Econometrics: A Modern Approach Seventh Edition. Cengage Learning.

準備

必要なパッケージの読み込み

15-1 動機: 省略変数と操作変数

内生変数問題の背景

単純回帰モデルでの問題設定

操作変数 (Instrumental Variable) の条件

操作変数の候補例（賃金方程式）

IV推定量の導出

IV推定量の性質

15-1a IV推定量の統計的推論

例15.1: 既婚女性の教育収益率 (MROZ)

例15.1: 第1段階（関連性確認）

例15.1: OLS vs IV の比較

例15.1: 結果の解釈

例15.2: 男性の教育収益率 (WAGE2)

例15.2: OLS vs IV の比較

15-1b 弱い操作変数の問題

不良操作変数の漸近バイアス [15.19]

例15.3: 喫煙と出生時体重 (BWGHT) — 悪い操作変数

15-2 重回帰モデルへのIV拡張

構造方程式と外生変数・内生変数

誘導型方程式と識別条件

例15.4: 大学近接性を教育のIVとして使用 (CARD)

例15.4: OLS vs 2SLS の比較

例15.4: 第1段階回帰（操作変数の関連性確認）

例15.4: 結果の解釈

15-3 二段階最小二乗法 (2SLS)

2SLSのアイデア: 複数の操作変数

例15.5: 既婚女性の教育収益率 (MROZ) — 2SLS

例15.5: 2SLS推定

15-3c 弱い操作変数の検出

Stock-Yogo (2005) の弱操作変数検定

Stock-Yogo 検定（例15.5への適用）

次数条件と階数条件

15-4 測定誤差問題へのIV応用

古典的測定誤差とIV

例15.6: 能力の指標としての2つのテストスコア (WAGE2)

例15.6: 結果

15-5 内生性検定と過剰識別制約の検定

15-5a 内生性検定

15-5a 内生性検定（Rコード）

内生性検定の結果解釈

15-5b 過剰識別制約の検定

Sargan検定（Rコード: Step 1–2）

Sargan検定（Rコード: Step 3）

過剰識別検定の解釈

15-6 不均一分散と2SLS

不均一分散頑健な2SLS推定

15-7/15-8 時系列・パネルデータへの応用

時系列データへの2SLS適用

例15.10: 職業訓練と労働者生産性 (JTRAIN) — FD + IV

例15.10: 結果の解釈

結合横断面・パネルデータへの2SLS

まとめ

第15章のまとめ

まとめ（続き）

Jeffrey Wooldridge (2018).
Introductory Econometrics: A Modern Approach
Seventh Edition. Cengage Learning.