経済統計の使い方
統計初心者の社会人向けに、経済データの解説をしています。「まとめページ」をご覧くだされば、全体的な内容がわかると思います。
統計学・計量経済学

【統計学】尖度と歪度|分布の形を調べる

分布の形を調べる

変数の分布の形をみるには、まずヒストグラムを使い、代表値としては平均と分散を見ることが基本です。

さらにその系列の分布の特徴をみるには、尖度歪度が使われます。

文字通り、歪度は分布のゆがみ具合、尖度は尖り具合を表します。

経済統計の使い方では、統計データの入手法から分析法まで解説しています。

統計学・計量経済学のまとめ 統計学に関するまとめのサイトです。 回帰分析の基本 記述統計 記述統計の説明動画(エクセル) 平均 分...

歪度

歪度は以下の式で表されます。

$ 歪度=\dfrac{E[(X_t- \mu )^3]}{ \sigma^3}$

歪度は、分布がどの程度偏っている(歪んでいる)かを表します。歪度がプラスだと、分布が左側に歪んでおり、マイナスだと右側に歪んでいることを表します。

偏差を3乗しているので、右側の方向へ偏っていると、平均より小さいデータが多くなり、マイナスになります。分散は負になりません歪度は正の可能性も負の可能性もあります。

エクセルの関数では=SKEW(数値)を使います。

エクセルの場合は、正規分布の時の歪度が0になるように調整されています。左に偏っているとプラス、右に偏っているとマイナスになります。

尖度

尖度は以下の式で表されます。

$ 尖度= \dfrac{E[(X_t- \mu )^4]}{ \sigma^4} $

尖度は分布の形がどの程度と尖っているのかを表します。3より大きいとかなり尖っており、3より小さいと平らに近いです。3の場合が正規分布になります。ばらつきを表す分散と似ていますが、さらに極端な値の集中を表します。

エクセルの関数では、=KURT(数値)を使います。また、エクセルの関数では、正規分布の時尖度が0になるように調整してあります。つまり、エクセルで計算されているのは以下の式です。

$ 尖度=\dfrac{E[(X_t- \mu )^4]}{ \sigma^4}-3 $

正規分布とカイ二乗分布

正規分布とカイ二乗分布について、平均、標準偏差、歪度、尖度を見てみましょう。乱数を発生させて、以下の数値を1000サンプル作り、ヒストグラムにしました。平均と標準偏差はほぼ同じになります。

  • 正規分布:平均9、標準偏差4 =NORM.INV(RAND(),9,4)
  • カイ二乗分布:自由度9 =CHISQ.INV(RAND(),9)
正規分布カイ二乗分布
平均9.19.0
標準偏差4.04.3
歪度0.00.9
尖度0.01.3

モーメント

歪度や尖度を体系的に理解するにはモーメントを理解すると良いと思います。モーメントはもともと物理学の用語で、以下を表します。

ある点を中心として、回転させる能力の大きさ

式で書くと、点からの距離×力です。

統計学では、ある値からの距離の期待値モーメントと定義されます。物理学と違って、距離は考えられていますが、力は一定と想定しています。ゼロの周りのモーメントは単にモーメント、平均値($\mu$)の周りのモーメント中心モーメントと呼びます。$r$次のモーメントはモーメントをr乗したものです。$r$次の中心モーメントは以下のように表せます。

$ \mu_r=E[(X_t-\mu )^r]$

次に、モーメントを平均と標準偏差で標準化したもの標準化モーメントと呼びます。

$ \mu_r=\left(\dfrac{E[ X_t-\mu ]}{\sigma} \right)^r=\dfrac{E[(X_t- \mu )^r]}{ \sigma^r} $

これらのモーメントと代表値との関係をみると以下のようになります。

モーメント(ゼロの周り)中心モーメント(平均値の周り)標準化モーメント(平均値の周りで標準化)
1次平均値
2次分散
3次歪度
4次尖度

1次のモーメント

1次の原点からのモーメントは、$X_t$の期待値なので、平均になります。

$ \mu=E[X_t]$

2次のモーメント

2次の平均からのモーメントは分散です。

$ \mu_2=E[(X_t-\mu )^2]$

3次のモーメント

3次の標準化モーメントは歪度です。

$ 歪度=\left(\dfrac{E[X_t-\mu ]}{\sigma} \right)^3=\dfrac{E[(X_t- \mu )^3]}{ \sigma^3}$

4次のモーメント

4次の標準化モーメントは尖度です。

$ 尖度=\left(\dfrac{E[X_t-\mu ]}{\sigma} \right)^4=\dfrac{E[(X_t- \mu )^4]}{ \sigma^4}$

ジャック=ベラ検定

ジャック=ベラ検定は、正規分布しているかどうかの検定です。検定名は、考案者のCarlos JarqueとAnil K. Bera にちなんでつけられました。最初の論文はEfficient Tests for Normality, Homoscedasticity and Serial Independence of Regression Residuals です。

帰無仮説は「正規分布している」で、この仮説のもとで以下の検定統計量が自由度2のカイ二乗分布することが知られています。

$ JB=\dfrac{n}{6} \left[ S^2+0.25*(K-3)^2 \right] $

ここで、$n$はサンプル数、$S$は歪度、$K$は尖度です。

上記の例では以下の結果となりました。カイ二乗分布の場合は、「正規分布である」という帰無仮説を棄却できます。

正規分布カイ二乗分布
ジャック=ベラ検定量0.0344572146551
P値0.9829190.000000

まとめ

分布の特徴を表す代表値として平均、分散以外のものを紹介しました。

歪度は、分布が一方に歪んでいる度合いを表します。

尖度は、分布の尖り具合を表します。

歪度は3次の標準化モーメント、尖度は4次の標準化モーメントです。

ジャック=ベラ検定は、歪度と尖度を使った正規分布の検定です。

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA