説明変数が外生変数(ほかの変数から影響を受けない)であることが最小二乗法が最適な推定値になる条件ですが、それが満たされていない場合です。説明変数に内生性があるというのは、説明変数と誤差項に相関がある場合です。
説明変数に内生性がある場合は、操作変数を使うことが有効です。操作変数を使うことで、内生性の問題は解決できます。ただ、適切な操作変数を探すことが容易でないのが問題です。
経済統計の使い方では、統計データの入手法から分析法まで解説しています。

説明変数の内生性
説明変数に内生性があるとは、説明変数が誤差項と相関している場合です。最近では、因果関係の推定の際に、必要な変数を落とした場合(脱落変数)に生じることが問題になっています。説明変数と誤差項に相関が生じる原因として以下の例があります。
- 需要曲線と供給曲線の推定
- 同時方程式モデル
- 計測誤差がある場合
- 欠測値がある場合
需要曲線と供給曲線
最初に問題にされたのは、需要曲線と供給曲線の推計です。需要曲線、供給曲線は以下のように書けます。

需要曲線の傾きは負、供給曲線の傾きは正となります。
価格と供給量のデータを得ることはできますが、取引が成立した点のデータしかわかりません。価格
また、この推計式は説明変数と誤差項が相関しているケースでもあります。取引が成立するのは、需要と供給の価格が等しくなった時なので、以下が成り立ちます。
これを
説明変数
同時方程式モデル
計量経済モデルでが、ある式では説明変数、他の式では被説明変数になっている変数があります。こういう場合は、説明変数が内生変数となります。
消費関数と国民所得からなる、簡単なケインズモデルを考えてみます。
消費
計測誤差
計測誤差がある場合は、
ただ、
誤差には
脱落変数がある場合
最近操作変数が頻繁に使われるようになったのは、脱落変数バイアス(Omitted variables bias:OVB)を除去するためです。
真の変数の関係が以下であるとします。
しかし、変数
また、
この式を真の関係の式に代入すると以下の式となります。
つまり、本来の係数は推計されずに
操作変数法
説明変数と誤差項に相関がある場合、最小二乗法による推定値は、不偏性も一致性もないものになります。しかし、操作変数法を使うことで、一致性のある推定ができます。
操作変数は、
年収と就学年数の例
「脱落変数バイアス」がある場合について説明します。年収に与える影響は就学年数と個人の能力である場合です。しかし、個人の能力が推計できないとします。
個人の能力が脱落変数となり、もし、個人の能力が就学年数と相関がある場合、年収を就学年数だけで回帰すると脱落変数バイアスが生じてしまいます。
就学年数が個人の能力に影響を受けてしまうのが問題なので、個人の能力とは相関がないが、就学年数には影響がある変数を操作変数として捜します。
下の例では、大学までの距離を操作変数としています。大学までの距離は、個人の能力とは相関しないけれど、大学へ行きやすいことから就学年数を伸ばすことが考えられるためです。
通常の推計では就学年数は個人の能力の影響を受けますが、操作変数はその影響を断つ効果があります。

操作変数法の係数
まず、通常の最小二乗法の係数の推定値を単回帰の場合で表すと以下の式になります。
操作変数法の係数の推定値は以下で表せます。分子と分母でそれぞれ一つずつ
ただ、その意味するところは直感的にはわかりにくいです。
2段階最小二乗法
操作変数法は、2段階最小二乗法として計算されると考えるのがわかりやすいと思います。被説明変数を
まず、
上記式の推計結果
この推定結果