最小二乗法を推計すると、係数が推定できます。基本的にはどんなデータでも係数は推定できますが、その係数が信頼できるとは限りません。誤差の範囲が広ければ、係数がゼロ、つまりその説明変数が被説明変数に影響しない可能性があります。これを調べるために、係数の標準誤差を計算します。
また、係数がゼロでないかどうかを調べるうえでは、単位に左右されないt値が有用になります。
経済統計の使い方では、統計データの入手法から分析法まで解説しています。

最小二乗法の基本的な形は以下とします。サンプルを表す小文字は除いています。
サンプル数はn、定数項を含む係数の数をK、Xの平均を
推定式の標準誤差
推定結果全体にどの程度誤差があるかは、誤差項の動きを見ます。誤差の平均はゼロですが、各サンプルで誤差が大きければ誤差の標準偏差は大きくなります。
推定値の誤差の分散は、サンプルから計算された誤差の不偏分散を求めることです。平均はゼロなので誤差の二乗和を自由度で割ったものになります。推定値の標準誤差は、不偏分散の平方根です。サンプル数がn、定数項を含む係数の数をKとすると以下のように書けます。
係数の標準誤差
係数の標準誤差は単回帰の場合、以下の形です。
分母は、
重回帰の場合は、定数項の列(すべて1)を含んだXの要素が縦に並んだ行列をXとして、以下のように書けます。計算されて出てくるのは、分散共分散行列です。使用するのは対角要素で、係数の標準誤差はそれぞれの平方根です。
少しわかりにくいかもしれませんので、
エクセルを使って行列計算の計算過程を示すと以下のようになります。転置行列はTRANSPOSE関数、行列の積はMMULT関数、逆行列はMINVERSE関数を使います。

t値
t値は、係数を係数の標準誤差で割ったものです。
係数が係数の標準誤差の何倍あるかを表してることになります。係数の分布を考えると、係数の値から前後標準誤差の2倍の範囲で95%以上を占めることになります。この範囲内にゼロがなければ、係数がゼロでない可能性が高いことを表します。
下のグラフで説明しましょう。係数が1と推定され、それがゼロである可能性があるかどうかを検討します。青の線で描かれた分布の場合、標準誤差が0.5でt値は2となります。この場合は、ゼロとなる可能性はかなり少ないことがわかります。
一方、ピンクの線で描かれた分布の場合、標準誤差が1でt値は1となります。係数がとりうる分布にゼロが入っています。つまり係数がゼロである可能性を否定できないということです。

まとめ
以下が記事のまとめです。
式の形 | |
推定値の標準誤差 | |
係数の標準誤差(単回帰) | |
係数の標準誤差(重回帰) | |
t値 |