経済統計の使い方
統計初心者の社会人向けに、経済データの解説をしています。「まとめページ」をご覧くだされば、全体的な内容がわかると思います。
統計学・計量経済学

【統計学】尖度と歪度|分布の形を調べる

分布の形を調べる

変数の分布の形をみるには、まずヒストグラムを使い、代表値としては平均と分散を見ることが基本です。

さらにその系列の分布の特徴をみるには、尖度歪度が使われます。

文字通り、歪度は分布のゆがみ具合、尖度は尖り具合を表します。

経済統計の使い方では、統計データの入手法から分析法まで解説しています。

統計学・計量経済学のまとめ 統計学に関するまとめのサイトです。 教科書 「回帰分析から学ぶ計量経済学-Excelで読み解く経済の仕組み」 回帰分...

歪度

歪度は以下の式で表されます。

=E[(Xtμ)3]σ3

歪度は、分布がどの程度偏っている(歪んでいる)かを表します。歪度がプラスだと、分布が左側に歪んでおり、マイナスだと右側に歪んでいることを表します。

偏差を3乗しているので、右側の方向へ偏っていると、平均より小さいデータが多くなり、マイナスになります。分散は負になりません歪度は正の可能性も負の可能性もあります。

エクセルの関数では=SKEW(数値)を使います。

エクセルの場合は、正規分布の時の歪度が0になるように調整されています。左に偏っているとプラス、右に偏っているとマイナスになります。

尖度

尖度は以下の式で表されます。

=E[(Xtμ)4]σ4

尖度は分布の形がどの程度と尖っているのかを表します。3より大きいとかなり尖っており、3より小さいと平らに近いです。3の場合が正規分布になります。ばらつきを表す分散と似ていますが、さらに極端な値の集中を表します。

エクセルの関数では、=KURT(数値)を使います。また、エクセルの関数では、正規分布の時尖度が0になるように調整してあります。つまり、エクセルで計算されているのは以下の式です。

=E[(Xtμ)4]σ43 

正規分布とカイ二乗分布

正規分布とカイ二乗分布について、平均、標準偏差、歪度、尖度を見てみましょう。乱数を発生させて、以下の数値を1000サンプル作り、ヒストグラムにしました。平均と標準偏差はほぼ同じになります。

  • 正規分布:平均9、標準偏差4 =NORM.INV(RAND(),9,4)
  • カイ二乗分布:自由度9 =CHISQ.INV(RAND(),9)
正規分布カイ二乗分布
平均9.19.0
標準偏差4.04.3
歪度0.00.9
尖度0.01.3

モーメント

歪度や尖度を体系的に理解するにはモーメントを理解すると良いと思います。モーメントはもともと物理学の用語で、以下を表します。

ある点を中心として、回転させる能力の大きさ

式で書くと、点からの距離×力です。

統計学では、ある値からの距離の期待値モーメントと定義されます。物理学と違って、距離は考えられていますが、力は一定と想定しています。ゼロの周りのモーメントは単にモーメント、平均値(μ)の周りのモーメント中心モーメントと呼びます。r次のモーメントはモーメントをr乗したものです。次の中心モーメントは以下のように表せます。

μr=E[(Xtμ)r]

次に、モーメントを平均と標準偏差で標準化したもの標準化モーメントと呼びます。

μr=(E[Xtμ]σ)r=E[(Xtμ)r]σr 

これらのモーメントと代表値との関係をみると以下のようになります。

モーメント(ゼロの周り)中心モーメント(平均値の周り)標準化モーメント(平均値の周りで標準化)
1次平均値
2次分散
3次歪度
4次尖度

1次のモーメント

1次の原点からのモーメントは、Xtの期待値なので、平均になります。

μ=E[Xt]

2次のモーメント

2次の平均からのモーメントは分散です。

μ2=E[(Xtμ)2]

3次のモーメント

3次の標準化モーメントは歪度です。

=(E[Xtμ]σ)3=E[(Xtμ)3]σ3

4次のモーメント

4次の標準化モーメントは尖度です。

=(E[Xtμ]σ)4=E[(Xtμ)4]σ4

ジャック=ベラ検定

ジャック=ベラ検定は、正規分布しているかどうかの検定です。検定名は、考案者のCarlos JarqueとAnil K. Bera にちなんでつけられました。最初の論文はEfficient Tests for Normality, Homoscedasticity and Serial Independence of Regression Residuals です。

帰無仮説は「正規分布している」で、この仮説のもとで以下の検定統計量が自由度2のカイ二乗分布することが知られています。

JB=n6[S2+0.25(K3)2]

ここで、nはサンプル数、Sは歪度、Kは尖度です。

上記の例では以下の結果となりました。カイ二乗分布の場合は、「正規分布である」という帰無仮説を棄却できます。

正規分布カイ二乗分布
ジャック=ベラ検定量0.0344572146551
P値0.9829190.000000

まとめ

分布の特徴を表す代表値として平均、分散以外のものを紹介しました。

歪度は、分布が一方に歪んでいる度合いを表します。

尖度は、分布の尖り具合を表します。

歪度は3次の標準化モーメント、尖度は4次の標準化モーメントです。

ジャック=ベラ検定は、歪度と尖度を使った正規分布の検定です。

RELATED POST

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA