ダミー変数とは擬似変数とも呼ばれ、1とゼロからなる変数です。
大きく分けると
- 1時点の異常値を処理する異常値ダミー
- 定数項を調整する定数項ダミー
- 係数を調整する係数ダミー
があります。
経済統計の使い方では、統計データの入手法から分析法まで解説しています。

異常値ダミー
最小二乗法は、異常値に弱い推計法でもあります。たとえば、以下のデータを仮想例として使ってみましょう。


異常値は、戦争やストライキ、天候不順、政策変更などが原因で発生します。
このまま最小二乗法を適用すると以下の式になります。自由度修正済み決定係数は0.59です。
第4期の

このように、ダミー変数を利用することにより、適切な推定が行われます。
定数項ダミー
最小二乗法の定数項や係数にもダミー変数を使うことができます。まず、定数項ダミーです。
二つのカテゴリーがあって、傾きは同じだけれど水準が違う場合に使えるものです。ここでは、男女の身長を並べたデータを使ってみましょう。1年間の身長の伸びは同じと考え、男女の身長差をダミー変数で測るとします。

男女とも年間0.79cm身長が伸び、男女の差は12.0cmあることがわかります。

係数ダミー
係数ダミーは、カテゴリーによって傾きが変わる場合です。サラリーマンの昇給ペースは、一般職と総合職、正規職員と非正規職員など職種によって違います。こうした例では係数ダミーを使って両者を統合して分析することができます。以下の仮想的なデータを使います。

散布図で表すと以下のデータです。

ダミー変数が0の時、傾きは
実際の推計結果は以下になります。一般職は年間10万円収入が増え、総合職では年間20万円収入が増えるという結果になっています。
仮説検定に利用できる
ダミー変数を用いた推定は、さまざまな仮説検定に利用できます。
たとえば、定数項ダミーのケースでは、
男女の身長に差があるかどうか
の検定ができ、係数ダミーのケースでは、
一般職と総合職の昇給ペースに違いはあるか
という検定ができます。ダミー変数の係数のt値を調べればよいです。
t値は、「係数がゼロ」の対する仮説検定なので、t値が有意だということは、「ダミー変数の係数がゼロ」という帰無仮説を棄却できることを表します。「男女の身長に差がある」という帰無仮説を棄却でき、男女の身長に差があると結論づけられます。
被説明変数の場合は質的従属変数に
被説明変数に1,0の変数を使う場合があります。就職している=1、就職していない=0といった変数を使う場合です。この場合は、質的従属変数と呼び、特有の推定法が考案されています。
EViewsで異常値ダミーを使う
EViewsで、一時点ダミーを使って例を説明します。使うのは、農林水産省の「作物統計」です。2000年から水稲の作付面積と収穫量を使いました。

近似曲線を引くと、一つだけ大きく外れた点があります。2003年で、記録的な冷夏だったため、作付面積に比べて、収穫量が大きく落ち込んでいます。
作付面積から収穫量を予測する場合、2003年の異常値に引きずられる可能性があるため、ダミー変数を使って処理することにします。
