経済統計の使い方では、統計データの入手法から分析法まで解説しています。

どの程度当てはまっているかを表す
決定係数は、回帰式を推定したときに、どの程度データに当てはまっているのかを示します。決定係数を説明する場合、全変動というあまり使わない用語が出てきますが、まずは、
実績値と理論値の相関を表すもの
と考えるのが良いのではないかと思います。詳しく言うと、「実績値と理論値の相関係数を二乗したもの」です。相関係数に関してはこちらを参考にしてください。
このため、0が全く当てはまってない場合、1は実績と理論値が残差なくぴったり会ったものを表します。決定係数が0.10、0.50、0.90、0.99のばらつき具合は以下の図の通りです。決定係数が0.10の場合は直線は当てはまっているように見えますが、Xが動いてもYはほとんど変化せず、ほとんど定数項だけで説明していることになっています。

実績値(
実績値が理論値とどのくらい合っているかを考えるわけですが、両者の平均をとっても意味がありません。最小二乗法では実績値と理論値の平均は同じで、誤差の平均はゼロになるためです。
そこで、実績値と理論値の相関を考えます。以下の式は、実績値と理論値の相関係数の二乗を表しています。
これを変形すると以下の式になります。これが決定係数の定義として使われるものです。
分母の
全変動、回帰変動、残差変動をまとめると以下になります。
決定係数は以下のようにも書き換えられます。
自由度修正済み決定係数
決定係数は、当てはまりを示す指標なので、説明変数を増やせば増やすほど、多かれ少なかれ決定係数は上昇します。説明変数が増えることで、係数の数値を低めるようにしたものが自由度修正済み決定係数です。残差二乗和をRSS、全変動をTSS、サンプル数をn、定数項を含む説明変数の数をKとすると以下の式になります。
RSSの関数ととらえる
残差変動は、残差二乗和(RSS:Residual Sum of Squares)と同じです。
当てはまりの指標という意味では、RSSがどの程度小さいか、という方向から考えることもできます。AICなどそのほかの当てはまり指標も基本的にはRSSの関数です。TSSを全変動、nをサンプル数、Kを定数項を含めた説明変数の数とすると、以下の式となります。
決定係数
対数尤度
赤池情報規準(AIC)
シュワルツベイズ情報規準(SBIC)
8種類算出法がある!
決定係数には8種類の算出法があり、統計ソフトによって異なる方法を使っている場合があります。Kvalseth(1985)には、8種類の決定係数の計算法が紹介されています。基本的には1式や2式で計算するわけですが、定数項が無い場合の回帰や非線形回帰の場合にほかの計算法が使われます。
ただ、線形回帰で、定数項がある場合は(1)式(2)式で問題ないので、通常はそれほど気にしなくてもよいでしょう。この記事で最初に紹介したのは(6)式です。

The American Statistician,Vol. 39, No. 4, Part 1 (Nov., 1985), pp. 279-285 (7 pages)