「経済統計の使い方」では、さまざまな分析手法の解説をしています。
https://officekaisuiyoku.com/category/statistics/DID分析は政策分析に使うものですね。
DはdifferenceのDで、差の差分析と言われています。
何の差をとるんですか。
基本的には、政策効果があったものとなかったものの差です。
もう一つの差は何ですか?
平均からの差の場合と、前期からの差の場合があります。
DID分析(Difference-in-differences design)は差の差分析と呼ばれるものです。2つの差がありますが、
- 政策効果以外の影響を除くために差をとる
- 政策を実行したものとしなかったものの差をとる
1段階目の差は、平均からの乖離の場合と、前期からの差の場合があります。差を取ることで、政策効果以外の影響を除きます。
2段階目の差は、政策効果があったものと無かったものの差です。
差の差分析
A県とB県のGDPについて、1期目と2期目の2期間の場合を考えます。1期目には政策が行われず、2期目にはA県だけ政策が行われたとします。政策効果の差は、A県(800)からB県(400)を引いた400ではありません。もともと、1期目にA県とB県には200の差があるからです。
政策の効果だけを取り出すには、1期目から2期目にかけて増えた分を比べればよいことがわかります。こうすれば、もともとあった200の差の影響を受けないためです。
A県の前期からの差は300(①の部分)、B県の前期からの差は100(②の部分)で、その差をとると200(①‐②)となり、政策効果は200だとわかります。
差分
上記は2期間だけの例ですが、期間が増えても考え方は同じで、前期との差をとると、期間を通じて存在する違いには影響を受けず、政策効果だけを取りだすことができます。
DD回帰(差分)
回帰分析を使って、政策効果を取り出すには以下の式を推計すればよいす。$DP_{it}$は、政策を実施した対象と期間のみ1、それ以外を0としたダミー変数です。
$ Δ(Y_{it}) = \alpha+βΔ(DP_{it})+e_{it} $
時間に関するダミー変数も加えますが、省略しています。
DD回帰(固定効果)
パネルデータ推計の固定効果を使うと、政策効果を取り出すことができます。これは、平均からのかい離を使って推計していることと同じです。
固定効果を使った場合は以下になります。クロスセクションと時系列のダミー変数を加えます。
$ Y_{it} = \alpha+βDP_{it}+β_iDi_i …+β_tDt_t … $
固定効果は、時間を通じて変化するものは除けますが、期間ごとに変わるものについては、それを変数として加えて除く必要があります。
具体例
仮想的なデータで考えてみましょう。2020年1月から2020年12月までのTK県とOS県とIT県のGDPがあるとします。それぞれ、1%で成長しています。2020年5月にTK県にだけ、緊急事態宣言がでて、TK県のGDPが50だけ減ったとします。これを推計して求めようと思います。
差の差分析
それぞれのGDPの差をとって、差の差分析をします。50と計算できます。
2020年5月について
- TKの差分 -45
- OSの差分 3
- ITの差分 1
政策効果のあったTKの差分からOSとITの差分を引くと、-45-(3+1)=-49となります。小数点以下四捨五入の関係で50にはなりませんが、政策効果が測れることがわかります。
DD回帰(差分)
差分のデータを作ってTKの2020年5月は1でそれ以外は0のダミー変数(SE)を使って計算します。時系列もダミー変数を使いますが、それは省いています。
$ Δ(GDP)=3.2-50.0 Δ(SE) $
という結果になります。EViewsでは以下の結果です。
DD回帰(パネル)
次に固定効果を使ってみます。それぞれの県のダミー変数を入れた場合とおなじです。この場合は、成長率は同じでも増加金額はそれぞれの県で違うので、時間の固定効果だけでは個別効果を除去できません。この方法で推計すると、緊急事態宣言の効果は-55.3になり、政策効果が多めに推定されます。
$ GDP=317.2-55.3 SE $
時系列のダミー変数の代わりに、各県にトレンド変数(@trend)を入れて、成長分を除去しています。本来は、各県とも1%ずつ増えているのに、同じ額だけ毎期増えているという式では正確な推計ではありませんが、概ね政策効果をとらえることができます。
$ GDP=299.7-50.6 SE+5.2 trendTK+ 3.2 trendOS +1.0 trendIT $