経済統計の使い方
統計初心者向けに、データや分析手法の解説をしています。「まとめページ」をご覧くだされば、全体的な内容がわかると思います。
統計学・計量経済学

【統計学】母比率の推定|リンゴが好きな人の割合を推定する

経済統計の使い方では、統計データの入手法から分析法まで解説しています。

統計学・計量経済学のまとめ 統計学に関するまとめのサイトです。 教科書 「回帰分析から学ぶ計量経済学-Excelで読み解く経済の仕組み」 回帰分...

比率の標本から比率を推定する

母集団に、リンゴが好きな人と嫌いな人がいるとき、「リンゴが好きな人の比率」(母比率)を標本の比率から推定します。

𝑋𝑖は1か0をとるものとする。

通常の確率変数は、さまざまな値をとることができます。たとえば、サイコロの場合は、𝑋𝑖は1~6を取ります。今回は、𝑋𝑖が2つの値しかとらない場合です。起こる(𝑋𝑖)か起こらない(𝑋𝑖)かの2択の分布を考えます。これは、コインの表と裏、動物の雄と雌などのデータです。

確率pで1、確率(1-p)で0となるとき、𝑋𝑖𝑖 =1,2,3𝑛)はベルヌーイ分布に従います。

  • ベルヌーイ分布  
  • 平均 
  • 分散 𝑝(1 𝑝)

また、nが十分大きい時、標本平均(R)は、中心極限定理により、平均𝑝、分散𝑝(1 𝑝)の正規分布に従います。

区間推定の手順

nが十分大きい時、標本平均(R)は、中心極限定理により、平均p、分散p(1-p)/nの正規分布に従います。

信頼区間95%の場合、以下の式が成り立ちます。

1.96 𝑅𝑝𝑝(1𝑝)𝑛 1.96

標本平均(R)と信頼区間の関係を式で表します。

𝑝1.96𝑝(1𝑝)𝑛 𝑅 𝑝 +1.96𝑝(1𝑝)𝑛

その式を母集団の平均に関する式に変形します。

𝑅1.96𝑝(1𝑝)𝑛) 𝑝 𝑅 +1.96𝑝(1𝑝)𝑛

nが十分大きい時、p(母集団の平均)はR(標本平均)で近似できます。(大数の法則)

𝑅1.96𝑅(1𝑅)𝑛 𝑝 𝑅 +1.96𝑅(1𝑅)𝑛

計算例

あるYou tubeのサイトの認知率を大学生400人にきいたところ、320人が知っていた。この場合、日本全体の認知率は95%の信頼区間で何%から何になるか?

𝑅1.96𝑅(1𝑅)𝑛 𝑝 𝑅 +1.96𝑅(1𝑅)𝑛

  • 母集団はp
  • 標本平均Rは320/400=0.8
  • 標本数nは400

なので、以下の式となります。

0.7608≤p≤ 0.8392

つまり、認知率は76%以上83%以下です。

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA