
スポンサードリンク
こんにちは、ももやまです。
今回は、数Bの「確率分布と統計的な推測」で頻繁に出てくる「母平均・母比率の推定」について説明していきたいと思います。
「母平均・母比率の推定」に関する問題は共通テスト(センター試験)でほぼ毎年どちらかが出てくるので、必ず勉強しておきましょう!
前回の「うさぎでもわかる確率分布と統計的な推測」5日目はこちら↓
目次 [hide]
スポンサードリンク
1.中心極限定理(復習)
まずは、前回説明した中心極限定理の復習をしましょう。
母集団が(分散が0ではない)どんな分布であっても、母平均が
スポンサードリンク
2.信頼度
(1) 信頼度とは
標本調査では母集団の一部のデータを抽出し、抽出したデータから母集団のデータを予測するため、正確なデータ(母平均など)を求めることができません。
そこで、ある範囲内に正確なデータが確率はどれくらいかを表したものが信頼度となり、ある範囲のことを信頼区間と呼びます。
例
信頼度95%:信頼区間内に正しいデータがある確率が95%
信頼度99%:信頼区間内に正しいデータがある確率が99%
(2) 正規分布と信頼区間
数Bの「確率分布と統計的な推測」では、標本を正規分布とみなし、標本から計算された平均、標準偏差から信頼区間を求めます*1。
具体的には、平均が信頼区間の中央となり、そこから標準偏差と信頼度によって信頼区間が決定します。
ここからは、平均から標準偏差何個分離れたら信頼度95%(99%)に相当するのかを確認していきましょう。
信頼度95%ということは、信頼区間内に正しいデータがある確率が95%ということでしたね。
つまり、下の図のように、
上の図(標準正規分布)は
つまり、青色部分の面積が0.475(0.95÷2)になるとき、
これを正規分布表から求めると……
これを日本語で表すと、「平均 ± 標準偏差1.96個以内」が信頼度95%の範囲に相当することがわかりますね。
同様に信頼度99%の場合、
上と同じようにして正規分布表から0.495となる
日本語で表すと、「平均 ± 標準偏差2.58個以内」が信頼度99%の範囲に相当することがわかりますね。
スポンサードリンク
2.母平均の推定
簡単に求めることができる標本平均
(1) 信頼度・信頼区間
母平均
(2) 母平均の推定方法
母分散が
上の情報だけから、母集団の母平均
まず、標本の大きさ
ここで、標準偏差の形がややこしいくなるので
ここで、
ここで、信頼度95%となる
つまり、標準正規分布の灰色部分の面積が0.95になるような
また、下の図の青色面積部分と赤色面積部分はともに等しくなります。
あとは青色面積部分が0.475(0.95÷2)となるための
よって、
- 標本の大きさ
が十分に大きいので、標本平均 が平均 、分散 の正規分布に従う。 の標準偏差 は と計算できる。- 対称な区間
となる確率が %となる を正規分布表から求める。[例:信頼度95% → ] (平均から標準偏差 個分データがずれる確率が %となる を求める。) - 信頼区間が
と計算できる。
( ± 標準偏差 ( ) 個以内が信頼区間)
1問例題を解いてみましょう。
例題1
生徒が25人いるあるクラスの数学の平均点が70点だった。学年全体の分散が
解説1
母分散が
ここで
(
さらに、
すると 95%のとき
つまり、信頼度95%のときの母平均
同じように信頼度98%のときの母平均
3.母比率の推定
いよいよ「確率分布と統計的な推測」 の最終項目「母比率の推定」にやってきました。
この項目では、「母集団の中である事象が起こる確率」を比較的容易に計算ができる「標本の中である事象が起こる確率」から推定する方法について説明していきたいと思います。
(1) 母比率・標本比率
母集団(つまり調べたい対象全体)の中で、ある事象Aを満たす確率のことを母比率と呼び、標本(母集団の一部をとってきたもの)の中で事象Aを満たす確率のことを標本比率と呼びます。
標本の大きさが
例えば、100人の標本の中から、事象を満たしている人が35人いたとすると、標本比率は
実際に数字を入れて計算してみると全然大した計算じゃないなってことがわかるかと思います。
(2) 大数の法則
母集団全体を調べるのは非常に大変なので、母比率
そこで、標本の大きさ
この法則のことを大数の法則と呼びます。
大数の法則を使うことで、母比率をいったん
なお、共通テストでは問題文に
(3) 信頼度・信頼区間
母平均とほぼ同じですが、念のためもう1度説明します。
母比率
(4) 二項分布と標本比率
標本において、ある事象Aが起こるか起こらないかは独立と考えることができます*3。
(ただし、標本は十分大きく、母集団は標本よりもさらに十分に大きいことが条件ですが基本的に標本調査では満たしているので問題ありません。)
さらに標本から1つ1つのデータを抽出すると考えるます。すると、抽出したデータはある事象Aが「起こる」か「起こらない」か*4の2通りですね。
つまり、抽出したデータの中からある事象を満たしている個数
二項分布に従うと考えられれば、平均、分散、標準偏差はあっという間に求められますね。
(もし二項分布ってなんだっけと思った人はこちらの記事で早急に復習しましょう。)
標本の大きさ
また、母集団から抽出した標本の大きさ
さらに、標本比率
そのため、標本比率
この性質を用いてから、標本比率
(5) 母比率の推定の流れ
では、簡単に求めることができる標本の大きさ
上の情報だけから、母集団の母平均
まず、標本の大きさ
ここで、標準偏差の形がややこしいくなるので
ここから先は母平均の推定のときと流れが一緒です。
ここで、
ここで、信頼度95%となる
母平均と同じように正規分布表から読み取ると、
あとは、代入することで、母比率
(標本比率
- 標本の大きさ
が十分に大きいので、標本比率 が平均 、分散 の正規分布に従う。
(二項分布の式から導出) の標準偏差 は と計算できる。- 対称な区間
となる確率が %となる を正規分布表から求める。[例:信頼度95% → ] (平均から標準偏差 ( ) 個分データがずれる確率が %となる を求める。) - 信頼区間が
と計算できる。
(標本比率 ± 標準偏差 ( ) 個以内が信頼区間)
例題2
某大学の大学生400人を無作為に調査したところ、40人が北九州市出身だった。
このとき、某大学の北九州市出身の母比率
解説2
標本比率
ここで、
ここで
(標準偏差何個分かを表す
さらに、
すると 95%のとき
(平均 ± 標準偏差1.96個分が信頼度95%の信頼区間となる)
よって、信頼度95%のときの母比率
4.練習問題
では、母平均推定・母比率推定の練習をしてみましょう。
必要であればこちらから正規分布表をダウンロードし、使用してください。
※注意
小数の形で解答する場合、指定された桁数の1つ下の桁を四捨五入して解答してください。また、必要に応じて、確定された桁まで⓪をマークしてください。
例えば、[ ア ] . [ イウ ] に 2.5 と答えたいとき → 2.50 とする。
練習1 母平均の推定
とある有名なお菓子「きのこの山」の高さの母平均
ここで、標本の大きさ100は十分に大きいので、母分散が標本分散に等しいとみなせる。
よって標本平均
正規分布表を用いて
練習2 母比率の推定
某工業大学の男性に恋人がいるかを無作為に100人選んでアンケートを取ったところ、20人が「恋人がいる」と回答した。某工業大学の男性のうち、恋人がいる人の母比率
(1) このアンケートで、恋人がいる人の比率(標本比率)は 0.[ ア ] である。
ここで、標本の大きさ 100 は十分に大きいので、母比率
アンケートを取った100人の中で恋人のいる人を
さらに、標本比率
よって、母比率
(2)
母比率に対する信頼区間
- 上で求めた信頼区間の幅を
- 標本の大きさが100、標本比率0.2の信頼度99%の信頼区間の幅を
- 標本の大きさが100、標本比率0.5の信頼度95%の信頼区間の幅を
とする。このとき、
⓪
①
②
③
④
⑤
5.練習問題の答え
練習1
母分散がわからないが、問題文から母分散が標本分散に等しいと考えてよいので、母分散を標本偏差と同じ36とする。
また、標本の大きさ
(ア.イ = 0.6)
ここで
また、
正規分布表より、
(ウエ:95)
よって、信頼度95%のときの母平均
(オカキ:288 クケコ:312)
練習2
(1)
標本比率
ここで、問題文の通りに母比率
また、分散
ここで、標本比率
また、標準偏差
※ 解説なので丁寧に書いていますが、共通テストなどで解く際には、「1/100になるから平均、標準偏差も1/100になるな〜」くらいの勢いで解いてください。
ここで、
信頼度95%となる
(平均 ± 標準偏差1.96個分が信頼度95%に対する信頼区間)
よって、信頼度95%のときの母比率
(クケ:12 コサ:28)
(2)
母比率
よって信頼区間の幅の大小を比べる際には、
標準偏差0.04 × 1.96個分(
すると、正規分布表より
よって、標準偏差0.04 × 2.58個分(
標本の大きさ
よって、標準偏差0.05 × 1.96個分(
下の3つの信頼区間の幅の基準値を比べると、信頼区間の幅の大小は
信頼区間の幅を比べる問題は過去のセンター試験にも出題されているため、共通テストでも出題される可能性があります。
なので、信頼区間の幅の比べ方は頭に入れておくと安心です。
信頼区間
ここで、ある値
つまり、信頼区間の幅の大小を比べる際には、
信頼区間の幅の比べ方
5.さいごに
今回は、「確率分布と統計的な推測」の分野における「母平均・母比率の推定」について行っていきました。
共通テストでは推定を行って信頼区間を出す問題は頻出するので、必ず信頼区間の出し方を確認・復習しておきましょう。
これで数B「確率分布と統計的な推測」の試験範囲はすべてです!
おつかれさまでした!!
7日目(最終日)は、総復習問題を用意する予定です。
復習(推定の流れ)
母平均・母比率の推定は以下のような手順で行う。
- 平均(基準値、信頼区間の真ん中の値)
と標準偏差 を求める
母平均 の場合
→ 平均 、標準偏差
母比率 の場合
→ 平均 、標準偏差
- 信頼度 c %、つまり
となる確率が c %になるような を正規分布表から読み取る。
(信頼度95% → 、信頼度99% → ) - 推定したいもの(母平均 or 母比率)
の信頼区間を と求めることができる。
*1:大学の「確率・統計」になると正規分布以外のデータから信頼区間を求める場面も増えてくるのですが、高校では正規分布以外出てこないので信頼度=正規分布を使うと思ってもらってOKです。
*2:平均より大きくなってしまう誤差と小さくなってしまう誤差が起こる確率は同じ。
*3:例えばですが、「ある事象=意見に賛成している」としたときに標本数が少なければ「Xさんが賛成してるからYさんは賛成 / 反対」みたいなこと人を無視できないかもしれませんが、標本数を増やせば「誰かが賛成してるから私は反対」みたいな人はほとんどいないので無視できますよね。なので標本の大きさが十分あれば独立と考えることができます。
*4:事象の例としては、ある政党に「賛成」か「賛成ではない(反対)」か、恋人と「付き合っている」か「付き合っていない」などがあります。
*5:ただ
関連広告・スポンサードリンク