Roth et al. (2023) What’s trending in difference-in-differences?
青山学院大学
2024-11-16
謝辞
経緯
本資料は、Roth et al. (2023) とそのワーキング・ペーパー・バージョンに従って、DiDの基本的な概念を説明し、最近の研究の展開について議論する。
論文の中でも、基礎的かつ重要な要点に絞る。(従って、原論文を適宜参照のこと)
推定(estimation)に重点を置き、証明はすべて省く。
共変量なしの基礎ケースに重点を置き、共変量ありの応用ケースは簡潔な紹介にとどめる。
数値例を追加。
Before (t=1) | After (t=2) | |
---|---|---|
NJ, 処置群 (D=1) | No | 処置 |
PA, 比較群 (D=0) | No | No |
を観察する。
Before (t=1) | After (t=2) | |
---|---|---|
NJ, 処置群 (D=1) | 2 | 4 |
PA, 比較群 (D=0) | 3 | 2 |
Before (t=1) | After (t=2) | |
---|---|---|
NJ, 処置群 (D=1) | \(Y_{i1}(1)=2\) | \(Y_{i2}(1)=4\) |
PA, 比較群 (D=0) | \(Y_{i1}(0)=3\) | \(Y_{i2}(0)=2\) |
\[ Y_{it}= \underbrace{D_{i}Y_{it}(1)}_{処置群} + \underbrace{(1-D_{i})Y_{it}(0)}_{比較群} \]
によって与えられる。
\[ \tau _{2} = \mathbb{E} [ Y_{i2}(1) - \color{purple}{Y_{i2}(0)} | \underbrace{D_{i} = 1}_{\text{処置群}}] \]
\(\tau _{2}\)を識別する際の課題は、未処置の潜在的な結果(outcome)である\(Y_{i2}(0)\)が、処置群(\(D_{i}=1\))では観測されないことである。
DiD法は、(1)未処置群の結果の変化と(2)処置群のベースラインの結果を用いて、処置群の平均的な反事実の未処置結果を推定する仮定によって、この識別問題を克服している。
\(\tau_{2}\)を識別するための重要な仮定は、平行傾向の仮定(parallel trends assumption)である。これは、処置が行われなかった場合、処置群と未処置群(比較群、対象群)の平均結果は平行に進展したであろうという直観的なものである。
仮定1(平行傾向 / Parallel Trends)
\[ \underbrace{\mathbb{E}\left[\color{purple}{Y_{i 2}(0)} -\color{blue}{Y_{i 1}(0)} \mid \underbrace{D_{i}=1}_{\text{処置群}} \right]}_{\text{処置がなかった場合の変化(反実)}} = \underbrace{\color{red}{\mathbb{E}\left[Y_{i 2}(0)-Y_{i 1}(0) \mid \underbrace{D_{i}=0}_{\text{比較群}} \right]}}_{\text{処置がなかった場合の変化(現実)}} \qquad (1) \]
また、\(\tau_{2}\)の識別に必要なもう一つの重要で隠れた仮定は、予見効果なしの仮定(no anticipatory effects assumption、無予測の仮定: no-anticipation assumption) であり、これは、処置が実施される前には因果的効果がないとするものである。
そうでなければ、第1期と第2期の処置群の結果\(Y\)の変化は、\(t=2\)期の因果的効果だけでなく、\(t=1\)期の予見効果も反映している可能性があるからである(Abbring and van den Berg, 2003; Malani and Reif, 2015)。
仮定2(予見効果なし / No Anticipatory Effects)
\[ Y_{i 1}(0)=Y_{i 1}(1) \text { for all } i \text { with } D_{i}=1 \]
\[ \mathbb{E}\left[\color{purple}{Y_{i 2}(0)} -\color{blue}{Y_{i 1}(0)} \mid \underbrace{D_{i}=1}_{\text{処置群}} \right] =\color{red}{\mathbb{E}\left[Y_{i 2}(0)-Y_{i 1}(0) \mid \underbrace{D_{i}=0}_{\text{比較群}} \right]} \]
\[ \underbrace{\color{purple}{\mathbb{E}\left[Y_{i 2}(0) \mid D_{i}=1\right]}}_{\text{処置群の反実仮想の第2期の値}} = \underbrace{\color{blue}{\mathbb{E}\left[Y_{i 1}(0) \mid D_{i}=1\right]}}_{\text{処置群の反実仮想ベースライン}} + \underbrace{\color{red}{\mathbb{E}\left[Y_{i 2}(0)-Y_{i 1}(0) \mid D_{i}=0\right]}}_{\text{比較群の変化の期待値}} \]
\[ \begin{aligned} \color{purple}{\mathbb{E}\left[Y_{i 2}(0) \mid D_{i}=1\right] } & =\color{blue}{\mathbb{E}\left[Y_{i 1}(0) \mid D_{i}=1\right]} +\color{red}{\mathbb{E}\left[Y_{i 2}(0)-Y_{i 1}(0) \mid D_{i}=0\right]} \\ & =\color{green}{\mathbb{E}\left[Y_{i 1}(1) \mid D_{i}=1\right]} +\color{red}{\mathbb{E}\left[Y_{i 2}(0)-Y_{i 1}(0) \mid D_{i}=0\right]} \end{aligned} \]
\[ \begin{aligned} \tau_{2} & = \mathbb{E}\left[Y_{i 2}(1)-\color{purple}{Y_{i 2}(0)} \mid D_{i}=1\right] \\ & = \mathbb{E}\left[Y_{i 2}(1) \mid D_{i}=1\right] - \color{purple}{\mathbb{E}\left[Y_{i 2}(0) \mid D_{i}=1\right] }\\ & = \mathbb{E}\left[Y_{i 2}(1) \mid D_{i}=1\right] - \color{green}{{\mathbb{E}\left[Y_{i 1} \mid D_{i}=1\right]}} - \color{red}{{\mathbb{E}\left[Y_{i 2}-Y_{i 1} \mid D_{i}=0\right]}} \\ & =\underbrace{\mathbb{E}\left[Y_{i 2}-Y_{i 1} \mid D_{i}=1\right]}_{\text{処置群の変化}} -\underbrace{\color{red}{\mathbb{E}\left[Y_{i 2}-Y_{i 1} \mid D_{i}=0\right]}}_{\text{比較群の変化}} \qquad (2) \end{aligned} \]
手計算によるATT推定
期待値を標本平均値に置き換えることで、\(\tau_{2}\)を推定できる。 \[ \widehat{\tau}_{2}=\left(\bar{Y}_{t=2, D=1}-\bar{Y}_{t=1, D=1}\right)-\left(\bar{Y}_{t=2, D=0}-\bar{Y}_{t=1, D=0}\right) \]
ここで、\(\bar{Y}_{t=t^{\prime}, D=d}\)は、期間\(t^{\prime}\)の群\(d\)の結果\(Y\)の標本平均値。
Before (t=1) | After (t=2) | 差 | |
---|---|---|---|
NJ, 処置群 (D=1) | \(Y_{i1}(1)=2\) | \(Y_{i2}(1)=4\) | 4-2=2 |
PA, 比較群 (D=0) | \(Y_{i1}(0)=3\) | \(Y_{i2}(0)=2\) | 2-3=-1 |
差 | 2-3=-1 | 4-2=2 | ATT=2-(-1)=3 |
Before (t=1) | After (t=2) | |
---|---|---|
現実, Y(1) NJ, 処置群 (D=1) |
\(Y_{i1}(1)=2\) | \(Y_{i2}(1)=4\) |
反実, Y(0) NJ, 処置群 (D=1) |
予 見 効果なしより \(Y_{i1}(0)=2\) |
平行傾向より \(Y_{i2}(0)=1\) |
ATT | =4-1=3 |
\[ Y_{i t}=\alpha_{i}+\phi_{t}+\left(1[t=2] \cdot D_{i}\right) \beta+\epsilon_{i t} \qquad (3) \]
平行傾向の仮定を時差あり設定に拡張する。
2群2期間版の平行傾向を、期間のすべての組み合わせと異なる時期に処置された「群」(groups)のすべての組み合わせで成立することを要求するように拡張。
仮定4(時差あり設定の平行傾向)。 全ての \(t \neq t^{\prime}\) と \(g \neq g^{\prime}\)について、 \[ \mathbb{E}\left[Y_{i t}(\infty)-Y_{i t^{\prime}}(\infty) \mid G_{i}=g\right]=\mathbb{E}\left[Y_{i t}(\infty)-Y_{i t^{\prime}}(\infty) \mid G_{i}=g^{\prime}\right] \quad (4) \]
この仮定は、処置が行われなかった反実仮想では、すべての処置グループの結果が平行して進展していたことを意味している。
(最終的にすべての個体が処置を受ける場合、処置される個体間でのみ平行傾向を課すと、ATTが識別できる期間の数は制限される。)
基本モデルの予見効果なしの仮定は、時差のある設定にも簡単に適用できる。
直観的には、ある個体が期間 \(t\)に未処置であれば、その結果は、将来どの期間に処置されるかに依存しないことを課すものである。
仮定5 時差あり予見効果なしの仮定 (Staggered no anticipation assumption)。
\[ Y_{i t}(g)=Y_{i t}(\infty) \text{ for all } t<g \]
まず、静学的TWFEの定式化(“static” TWFE specification)の議論から始める。これは、個体と期間の固定効果、および個体\(i\)が期間\(t\)で処置されたかどうかの指標\(D_{i t}\)に結果変数\(Y_{i t}\)を回帰させるものである。 \[ Y_{i t}=\alpha_{i}+\phi_{t}+D_{i t} \beta_{\text {post }}+\epsilon_{i t} \quad (5) \]
静学的定式化は、時間や個体によらず処置効果に不均質性がない場合に、賢明な推定対象(sensible estimand)をもたらす。
処置効果の不均一性が、処置後の時間または個体間のいずれにも存在する場合、静学的定式化に問題が発生する。
例えば、個々の処置効果\(\tau_{s}\)が全て正であっても、集計された処置効果の係数\(\beta_{\text {post }}\)が負となる可能性(negative weights)がある。(負の重みの可能性)
動学的TWFEでは、個体と期間の固定効果、および処置時点からの相対時間(time relative to treatment)のダミーに結果を回帰させる。 \[ Y_{i t}= \alpha_{i} +\phi_{t} +\sum_{\substack{r \neq 0 \\-\underline{T} \leqslant r \leqslant \bar{T}}} 1\left[R_{i t}=r\right] \beta_{r} +\epsilon_{i t} \quad (7) \]
ここで、\(R_{i, t}=t-G_{i}+1\)であり、処置を受けてからの経過時間をあらわす。
また、\(R_{i, t}=1\)は処置を受けた最初の期間を示す。
処置後の時間のみに異質性がある場合、賢明な因果推定対象(sensible causal estimand)を得ることができる。
コホート間の異質性がある場合、動学的定式化でも動的因果効果の賢明な推定値(sensible estimates of dynamic causal effects)を得ることができない。(この結果の導出は数学的に複雑)
Callaway and Sant’Anna (2021) は、平行傾向の仮定が共変量の条件付きでのみ成立する一般化についても考察しているが、ここでは共変量がない場合に焦点を当てる。
数学的には、任意の\(g^{\prime}>t\)(つまり、群\(g^{\prime}\)は\(t\)時点で未処置)について、以下を式(2)の識別結果の多期間版と見なすことができる。 \[ ATT(g, t)= \underbrace{\mathbb{E}\left[Y_{i t}-Y_{i, g-1} \mid G_{i}=g\right]}_{\text{既に処置済みの群の期待変化}} -\underbrace{\mathbb{E}\left[Y_{i t}-Y_{i, g-1} \mid G_{i}=g^{\prime}\right]}_{\text{未処置群の期待変化}} \]
これは、\(g^{\prime}>t\) となるどの比較群でも成り立つので、すべての \(g^{\prime} \in \mathcal{G}_{\text {comp }}\)について\(g^{\prime}>t\) となるような比較群の集合 \(\mathcal{G}_{\text {comp }}\) を平均しても、成り立つ。 \[ A T T(g, t)= \underbrace{\mathbb{E}\left[Y_{i t}-Y_{i, g-1} \mid G_{i}=g\right]}_{\text{既に処置済みの群の期待変化}} -\underbrace{\mathbb{E}\left[Y_{i t}-Y_{i, g-1} \mid G_{i} \in \mathcal{G}_{\text {comp }}\right]}_{\text{未処置群の期待変化}} \]
\[ \widehat{A T T}(g, t)= \underbrace{\frac{1}{N_{g}} \sum_{i: G_{i}=g}\left[Y_{i, t}-Y_{i, g-1}\right]}_{\text{処置群の変化の平均}} -\underbrace{\frac{1}{N_{\mathcal{G}_{c o m p}}} \sum_{i: G_{i} \in \mathcal{G}_{\text {comp }}}\left[Y_{i, t}-Y_{i, g-1}\right]}_{\text{対照群の変化の平均}} \]
期間と処置コホートの数が比較的少ない場合、関連するすべての\((g, t)\)について\(\widehat{A T T}(g, t)\)を報告することは合理的かもしれない。
しかし、処置期間やコホートが多い場合、すべての\(\widehat{A T T}(g, t)\)を報告することは煩雑である。
幸い、\(ATT(g, t)\)の任意の加重平均を推定することができる。
例えば、異なる採用(処置)コホート間の採用(処置)後\(l\)期間の処置効果の(加重)平均を与える「イベント・スタディ・パラメータ」(``event-study” parameter)を推定することができる。 \[ A T T_{l}^{w}=\sum_{g} \color{blue}{w_{g}} A T T(g, g+l) \]
ここで、\(\color{blue}{w_{g}}\)は、コホート\(g\)の重みを表す。
重み \(\color{blue}{w_{g}}\) は、異なるコホートを等しく重み付けするように選ぶことも、処置された集団における相対頻度の観点から選ぶこともできる。
仮定6(条件付き平行傾向/Conditional Parallel Trends) \[ \mathbb{E}\left[Y_{i 2}(0)-Y_{i 1}(0) \mid D_{i}=1, X_{i}\right]=\mathbb{E}\left[Y_{i 2}(0)-Y_{i 1}(0) \mid D_{i}=0, X_{i}\right] \text { (almost surely)} \qquad (10) \]
仮定7(強い重複/Strong overlap)
\[ \tau_{2}(x)=\mathbb{E}\left[Y_{i 2}(1)-Y_{i 2}(0) \mid D_{i}=1, X_{i}=x\right] \] このATTは、\(P\left(D_{i}=1 \mid X_{i}=x\right)>0\)の任意の\(x\)について識別される。
\[ \tau_{2}= \mathbb{E}\left[ \underbrace{ \left(\frac{D_{i}}{\mathbb{E}\left[D_{i}\right]} -\frac{\frac{\left(1-D_{i}\right) \color{blue}{p(X_{i})}}{\color{blue}{1-p\left(X_{i}\right)}}} {\mathbb{E}\left[\frac{\left(1-D_{i}\right) \color{blue}{p\left(X_{i}\right)}}{\color{blue}{1-p\left(X_{i}\right)}}\right]}\right)}_{\text{逆確率重み付け}\\\text{inverse probability weighting}} \left(Y_{i, 2}-Y_{i, 1} - \underbrace{\mathbb{E}\left[Y_{i, 2}-Y_{i, 1} \mid D_{i}=0, X_{i}\right]}_{\text{比較群の期待変化}\\ \text{population outcome regression}}\right)\right] \qquad (15) \]
\[ \widehat{\tau}_{2}=\frac{1}{N} \sum_{i=1}^{N}\left(\frac{D_{i}}{\frac{1}{N} \sum_{j=1}^{N} D_{j}}-\frac{\frac{\left(1-D_{i}\right) \color{blue}{\widehat{p}(X_{i})}}{\color{blue}{1-\widehat{p}(X_{i})}}}{\frac{1}{N} \sum_{j=1}^{N} \frac{\left(1-D_{j}\right) \color{blue}{\hat{p}(X_{j})}}{\color{blue}{1-\widehat{p}(X_{j})}}}\right)\left(Y_{i 2}-Y_{i 1}-\widehat{\mathbb{E}}\left[Y_{i 2}-Y_{i 1} \mid D_{i}=0, X_{i}\right]\right) \]