エクセルを使って主成分分析をやろうとすると、「エクセル統計」などのアドインソフトを購入する必要があります。しかし、gretlを使えば無料で分析することができます。使い方はそれほど難しくないので、試してみてはいかがでしょうか。
経済統計の使い方では、統計データの入手法から分析法まで解説しています。
主成分分析
データを用意します。
今回は景気動向指数一致指数CIの構成指標10指標を主成分分析にかけて、第一主成分と第二主成分を取り出してみます。景気に連動する指標の主成分なので、景気動向を表すものと考えられます。記号と変数の対応は以下の通りです。
C1 生産指数(鉱工業),C2 鉱工業用生産財出荷指数 ,C3 耐久消費財出荷指数 ,C4 労働投入量指数(調査産業計) ,C5 投資財出荷指数(除輸送機械) ,C6 商業販売額(小売業)(前年同月比) ,C7 商業販売額(卸売業)(前年同月比) ,C8 営業利益(全産業) ,C9 有効求人倍率(除学卒) ,C10 輸出数量指数
ソフトウエアのインストール、データの取り込む方法などgretlについて詳しく知りたい人は、以下を参照してください。
gretlでの操作
「表示」から「主成分分析」を選びます。基本的な操作はこれだけです。
取り込んだデータのうちどのデータを使うかを指定します。今回は10変数すべてを使います。
オプションとして、相関行列を使用するか共分散行列を使うか選べますが、単位に左右されない
相関行列を使用
のままでいいです。
OKを押すと、結果が次のように表示されます。変数が10個ある場合、10個の変数を縮約した変数が10個の主成分として作成されます。
固有値、寄与率、累積寄与率
固有値は主成分の分散を表し、特徴を明確に示すものほど分散が大きいので、最も大きい固有値を持っているものが第一主成分となります。固有値全体に占める割合が寄与率です。第一主成分だけで65.4%を占め、10個の特徴をかなり凝縮したものだと考えらます。累積寄与率は、第一主成分からの寄与率を足し上げたもので、「第何主成分まで使うか」を考える場合に使います。
固有ベクトル
固有ベクトルは、10個の主成分を作成する際の各系列のウエートになります。2乗和は1になります。PC1が第一主成分を表すので、その下1列が第一主成分のウエートになります。式としては以下を計算すると、第一主成分が計算できます。
第1主成分=-0.378×C1-0.373×C2-0.358×C3 -0.380×C4+0.285×C5+0.252×C6+0.147×C7-0.333×C8-0.195×C9 -0.360×C10
景気動向を示した系列を集めたものなので、すべてのウエートがプラスになるのが望ましいです。係数がマイナスということは、景気と反対の動きをすることになります。
第一主成分のウエートをみると、8指標のウエートがマイナスになっています。これらを合成した指標は、景気の拡大縮小の動きが反対になってしまいます。そこで、第一主成分と第二主成分のウエートの符号をすべて反対にして計算して、グラフで表示しました。
統計ソフトによっては、プラスのウエートが多くなるよう固有ベクトルの符号を変えているものもあります。ベクトルは方向を示しているので、逆向きでも問題はないです。
第一主成分を計算する際、C6 商業販売額(小売業)(前年同月比) 、C7 商業販売額(卸売業)(前年同月比) はウエートがマイナスです。その指標が上昇すると景気が悪くなるという動きを示すことになり、構成指標に入れるのは望ましくないといえます。
上記のような問題はありますが、グラフをみると、第一主成分、第二主成分とも景気動向を表していると考えられ、第二主成分はより短期の循環を表していると考えられます。