経済統計の使い方
統計初心者向けに、データや分析手法の解説をしています。「まとめページ」をご覧くだされば、全体的な内容がわかると思います。
統計学・計量経済学

【計量経済学】説明変数の内生性と操作変数|説明変数が誤差項の影響を受ける場合

説明変数が外生変数(ほかの変数から影響を受けない)であることが最小二乗法が最適な推定値になる条件ですが、それが満たされていない場合です。説明変数に内生性があるというのは、説明変数と誤差項に相関がある場合です。

説明変数に内生性がある場合は、操作変数を使うことが有効です。操作変数を使うことで、内生性の問題は解決できます。ただ、適切な操作変数を探すことが容易でないのが問題です。

経済統計の使い方では、統計データの入手法から分析法まで解説しています。

統計学・計量経済学のまとめ 統計学に関するまとめのサイトです。 教科書 「回帰分析から学ぶ計量経済学-Excelで読み解く経済の仕組み」 回帰分...

説明変数の内生性

説明変数に内生性があるとは、説明変数が誤差項と相関している場合です。最近では、因果関係の推定の際に、必要な変数を落とした場合脱落変数)に生じることが問題になっています。説明変数と誤差項に相関が生じる原因として以下の例があります。

  • 需要曲線と供給曲線の推定
  • 同時方程式モデル
  • 計測誤差がある場合
  • 欠測値がある場合

需要曲線と供給曲線

最初に問題にされたのは、需要曲線と供給曲線の推計です。需要曲線、供給曲線は以下のように書けます。

需要曲線の傾きは負、供給曲線の傾きは正となります。

価格と供給量のデータを得ることはできますが、取引が成立した点のデータしかわかりません。価格を被説明変数、需要量、供給量𝑌𝑖を被説明変数とすると、以下の式が成り立ちます。推計上難しいのは、需要曲線は右下がりなので𝛽𝑑は負、供給曲線は右上がりなので𝛽𝑠は正とう結果が出ないといけないことです。しかしデータは同じですから、異なる2つの結果は出てきません。両方が混ざった𝛽が推定されることになります。

 𝑃𝑖 =𝛼𝑑 +𝛽𝑑𝑌𝑖 +𝑒𝑑𝑖

 𝑃𝑖 =𝛼𝑠 +𝛽𝑠𝑌𝑖 +𝑒𝑠𝑖

また、この推計式は説明変数と誤差項が相関しているケースでもあります。取引が成立するのは、需要と供給の価格が等しくなった時なので、以下が成り立ちます。

𝛼𝑑 +𝛽𝑑𝑌𝑖 +𝑒𝑑𝑖 =𝛼𝑠 +𝛽𝑠𝑌𝑖 +𝑒𝑠𝑖

これを𝑌𝑖について解くと以下の式になります。

𝑌𝑖 =(𝑒𝑑𝑖𝑒𝑠𝑖)(𝛼𝑑𝛼𝑠)𝛽𝑑𝛽𝑠

説明変数𝑌𝑖は、誤差である𝑒𝑑𝑖𝑒𝑠𝑖の影響を受けていることがわかります。

同時方程式モデル

計量経済モデルでが、ある式では説明変数、他の式では被説明変数になっている変数があります。こういう場合は、説明変数が内生変数となります。

消費関数と国民所得からなる、簡単なケインズモデルを考えてみます。

𝐶𝑖 =𝑎 +𝑏𝑌𝑖 +𝑒𝑖

𝑌𝑖 =𝐶𝑖 +𝐼𝑖

消費𝐶𝑖の説明変数である国民所得𝑌𝑖は、他の変数から影響を受けない外生変数ではありません。以下のように、説明変数𝑌𝑖と誤差項𝑒𝑖は相関しています。

𝑌𝑖 =𝑎 +𝑏𝑌𝑖 +𝑒𝑖 +𝐼

𝑌𝑖 =𝑎+𝑒𝑖+𝐼1𝑏

計測誤差

計測誤差がある場合は、𝑋𝑖が確定的に決まらないことで、𝑌𝑖の回帰係数が小さ目に推定されます。理論モデルとして以下の式が成り立っているとします。

𝑌𝑖 =𝛼 +𝛽𝑋𝑖 +𝑒𝑖

ただ、𝑋𝑖は入手することができず、観測誤差のある𝑋𝑖 +𝑢𝑖しか入手することが出来ないとします。この場合、以下の式を推計することになります。

𝑌𝑖 =𝛼 +𝛽(𝑋𝑖 +𝑢𝑖) +𝑒𝑖 =𝛼 +𝛽𝑋𝑖 +𝛽𝑢𝑖 +𝑒𝑖

誤差には𝛽が含まれているので、𝛽と誤差に相関があることになります。

脱落変数がある場合

最近操作変数が頻繁に使われるようになったのは、脱落変数バイアス(Omitted variables bias:OVB)を除去するためです。

真の変数の関係が以下であるとします。

𝑌𝑖 =𝛼 +𝛽𝑋𝑖 +𝛾𝐴𝑖 +𝑒𝑖

しかし、変数𝐴𝑖は観察することができず、𝑋𝑖のみに回帰するしかないとします。また、𝐴𝑖𝑋𝑖は相関しているとします。𝐴𝑖を除いて推定すると、𝐴𝑖は誤差に含まれることになり、𝑋𝑖と誤差項は相関します

また、𝐴𝑖𝑋𝑖には以下の関係があるとします。

𝐴𝑖 =𝑎 +𝑏𝑋𝑖 +𝑢𝑖

この式を真の関係の式に代入すると以下の式となります。

𝑌𝑖 =𝛼 +𝑎 +(𝛽 +𝑏)𝑋𝑖 +𝑒𝑖 +𝑢𝑖

つまり、本来の係数は推計されずに𝛽 +𝑏が推計されることになります。これが脱落変数バイアスと呼ばれるものです。

操作変数法

説明変数と誤差項に相関がある場合、最小二乗法による推定値は、不偏性も一致性もないものになります。しかし、操作変数法を使うことで、一致性のある推定ができます。

操作変数は、𝑒𝑖と相関していないけれど、𝑖と相関している変数のことです。

年収と就学年数の例

脱落変数バイアス」がある場合について説明します。年収に与える影響は就学年数と個人の能力である場合です。しかし、個人の能力が推計できないとします。

個人の能力が脱落変数となり、もし、個人の能力が就学年数と相関がある場合、年収を就学年数だけで回帰すると脱落変数バイアスが生じてしまいます。

就学年数が個人の能力に影響を受けてしまうのが問題なので、個人の能力とは相関がないが、就学年数には影響がある変数を操作変数として捜します。

下の例では、大学までの距離を操作変数としています。大学までの距離は、個人の能力とは相関しないけれど、大学へ行きやすいことから就学年数を伸ばすことが考えられるためです。

通常の推計では就学年数は個人の能力の影響を受けますが、操作変数はその影響を断つ効果があります。

操作変数法の係数

まず、通常の最小二乗法の係数の推定値を単回帰の場合で表すと以下の式になります。

𝛽 =Σ(𝑋𝑖¯𝑋)(𝑌𝑖¯𝑌)Σ(𝑋𝑖¯𝑋)(𝑋𝑖¯𝑋)

操作変数法の係数の推定値は以下で表せます。分子と分母でそれぞれ一つずつ𝑋𝑖 ¯𝑋𝑍𝑖 ¯𝑍に変わっているということです。

𝛽𝐼𝑉 =Σ(𝑍𝑖¯𝑍)(𝑌𝑖¯𝑌)Σ(𝑍𝑖¯𝑍)(𝑋𝑖¯𝑋)

ただ、その意味するところは直感的にはわかりにくいです。

2段階最小二乗法

操作変数法は、2段階最小二乗法として計算されると考えるのがわかりやすいと思います。被説明変数を𝑌𝑖、説明変数を𝑋𝑖、操作変数を𝑍𝑖とします。

まず、𝑋𝑖𝑍𝑖を回帰して𝑋𝑖の理論値ˆ𝑋𝑖を作ります。

𝑋𝑖 =𝛼 +𝛽𝑍𝑖 +𝑢𝑖

上記式の推計結果ˆ𝑋𝑖𝑌𝑖に回帰させます。

𝑌𝑖 =𝛾 +𝜆ˆ𝑋𝑖 +𝑣𝑖

この推定結果𝜆が操作変数法による推定値になります。

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA