最小二乗法が最適な推定値になるにはさまざまな条件がありますが、その一つに、「誤差の分散が均一である」があります。これが満たされない場合を不均一分散と呼びます。係数の標準偏差を計算する過程で、この仮定を使うため、この仮定が満たされないと、正しい係数の標準偏差が計算できないことになります。
通常の最小二乗法ではt値が小さめに計算されるので、本来有意なものを有意でないと判断する危険性があります。
この記事では不均一分散とは何か、どのように対処したらよいかをわかりやすく解説します。
経済統計の使い方では、統計データの入手法から分析法まで解説しています。

不均一分散の例
標準的な最小二乗法では以下の式が成り立っています。
このケースでは、誤差の分散の均一を仮定しています。
誤差の不均一分散の例としては、たとえば、

また、

不均一分散の問題点
不均一分散の問題点は、係数の推定値にあるのではなく、係数の分散にあります。不偏性と一致性は満たされますが、効率性(分散が最も小さい性質)が満たされません。この場合、以下の推論から、最小二乗法によるt値は小さめに計算されることになります。
- 通常の最小二乗法による係数の標準誤差は最小ではない
- 真の係数の標準誤差はもっと小さい
- t値は係数/標準誤差で計算するので、真のt値はもっと大きいはず
- 通常の最小二乗法ではt値は小さめに計算される
誤差の分散が均一な場合は以下の式で表せます。
一方、誤差の分散が不均一の場合は、均一の分散
不均一分散の検定
不均一分散の検定の一つにホワイトの検定があります。誤差の二乗が説明変数や説明変数の二乗と相関があるかどうかを検定するものです。まず、通常の最小二乗法を適用します。
次に誤差の二乗を定数項と
つまり帰無仮説
不均一分散への対処
不均一分散に対処する方法として、標準誤差を計算しなおすという方法があります。不均一分散があったとしても、最小二乗法で推定した係数は不偏推定量で問題ありません。問題なのは係数の標準誤差なので、その計算法を工夫するということです。ホワイトの推定量(ロバスト標準誤差)などが考案されています。
ホワイトの推定量は、不明な
通常、ホワイトの推定量の標準誤差の方が大きくなり、t値は小さくなります。
通常の最小二乗法は、効率的ではないので、標準誤差はさらに小さいものがあるはずです。しかし、真の分散の構造がわからないことを前提として、不均一分散があったとしても頑健な推定量という意味では、標準誤差は大きくならざるを得ないということでしょう。
加重最小二乗法
不均一分散の原因がわかっている場合に有効なのが、加重最小二乗法です。たとえば、冒頭の例のように、誤差が説明変数
EViewsで計算
Xに比例する誤差をそのまま使って、YをXに回帰する
通常の最小二乗法で推定した場合です。

ホワイトの検定
ホワイトの検定では、残差の二乗を説明変数と説明変数の二乗で回帰しています。ホワイトテストを実行するには、方程式オブジェクトのviewメニューを使います。
[View]→[Residual Diagnostics]→[Hetroskedasticity Tests…]
でwhiteを選びます。

「係数がゼロである」という帰無仮説に対応するF値は5.494483で、p値は0.0072なので、1%の有意水準で帰無仮説は棄却されます。説明変数が誤差に影響を与えており、不均一分散があることがわかります。

ホワイトの推定量
ホワイトの推定量を使うと、推定値
- 係数 0.508701→0.508701
- 標準誤差 0.028419→0.029333
- t値 17.89974→17.34245

EViewsでホワイトの推定量を計算するには、方程式の変数を入力する画面で、[option]→Coefficient covarianceのcovariance method: で、Huber-Whiteを選びます。

加重最小二乗法
加重最小二乗法の場合の結果です。データはもともと
- 係数 0.508701→0.490972
- 標準誤差 0.028419→0.015087
- t値 17.89974→32.54202

その他の問題と解決法についてはこちら
