
スポンサードリンク
こんにちは、ももやまです。
今回は、大学の「確率・統計」や統計検定、院試などで出てくる確率分布のうち、離散型型確率分布、具体的には
- (離散)一様分布
- ベルヌーイ試行
- 二項分布
- ポアソン分布
- 多項分布
- 幾何分布
- 超幾何分布
がどんなものなのかについて説明していきたいと思います。
また、特に重要な分布については数式や例題や別記事などで補足しております。
なお、確率変数、確率分布、平均(期待値)、分散などの基本的な用語がよくわからない人 or 忘れてしまった人は、下の記事で復習してからこちらの記事をご覧になることをおすすめします。
目次 [hide]
スポンサードリンク
0.離散型確率分布・連続型確率分布の違い
離散型確率分布について説明する前に、まずは離散型確率分布と連続型確率分布の違いについて説明していきたいと思います。
(1) 離散型確率分布
例えば、サイコロを1回振った時に出てきた目を確率変数
サイコロを1回振ったときに出てくる目は「1, 2, 3, 4, 5, 6」の6つですね。
なので、
(例えば
このように、とぎれとぎれの値を持つような確率変数
言い換えると、それぞれの
例えば1個のサイコロを振ったときに出てくる値の目を
X | 確率 |
1 | |
2 | |
3 | |
4 | |
5 | |
6 |
のように6通りすべてを列挙できます。
(2) 連続型確率分布
例えば、ある大学の男子学生から1人選んだときの身長を
ところが、世の中には身長が「163.000000… [cm]」や「166.000000… [cm]」のように、ちょうどぴったり163[cm]や166[cm]の人はいませんね。
つまり、
(
このように、
言い換えると、それぞれの
連続型確率分布では、それぞれの
度数 | 相対度数 | |
155〜160 | 2 | 0.02 |
160〜165 | 12 | 0.12 |
165〜170 | 24 | 0.24 |
170〜175 | 28 | 0.28 |
175〜180 | 20 | 0.20 |
180〜185 | 14 | 0.14 |
合計 | 100 | 1.00 |
区切る一定範囲を細かく細かく刻んでいくと、下のようにヒストグラムを関数
このような関数のことを確率密度関数と呼びます。
(確率密度関数に関する詳しいお話はこちらをご覧ください。)
関数
なお、身長に限らず、実験などで「長さ」や「時間」や「重さ」などを測定したときの測定値はすべて連続型の確率変数となります。
ということで、ここからは離散型の確率分布で重要なものをいくつか紹介し、特に重要なものは例題などを含めて説明していきましょう。
スポンサードリンク
1.(離散)一様分布
ある確率変数
数Aで確率を習ったときに出てきた「同様に確からしい」事象がまさに一様分布に従う事象となります。
例えば、1回サイコロを振って出た目を
サイコロの目の中で1, 2, 3, 4, 5, 6どの目も出る確率は全く同じ(1/6)ですよね。
なので、サイコロの出目
スポンサードリンク
2.ベルヌーイ分布
(1) ベルヌーイ分布とは
ベルヌーイ分布を説明する前に、ベルヌーイ試行について説明しましょう。
ベルヌーイ試行とは、
- 試行結果が2通り(成功 or 失敗)しかない
- 試行を繰り返した際に、それぞれの試行が独立である
(前や後の試行が一切影響しない) - 試行を繰り返した際に、成功(失敗)確率が変化しない
試行のことを表します。例えば、
- (コイントスで)表が出る or 裏が出る
- (サイコロで)1の目が出る or 出ない
- (トランプで)1のカードを引く or 引かない
のような試行がベルヌーイ試行となります。
ベルヌーイ分布とは、ある確率変数
(2) ベルヌーイ分布の期待値・分散
では、ある確率分布
X | 確率 |
1 | p |
0 | 1-p |
期待値
3.二項分布
ベルヌーイ試行(結果が2通りしかないような試行)を
二項分布の代表例としては、
- 同じコインを100回コイントスしたときに表が出る回数
- サイコロを180回振ったときに1の目が出る回数
- じゃんけんを100回したときに勝つ回数
があります。
二項分布は、離散型確率分布の中でも特に重要なので、別の記事で詳しく説明しています。
詳しい説明については、下の記事をご覧ください。
(ただし
二項分布は超重要なので、例題で確認していきましょう。
(ついでに確率の復習もしておきましょう。)
例題1
赤玉が3個、白玉が2個が入った箱がある。
この箱の中から、玉を1つ取り出し、取り出した玉の色を記録してから元に戻す操作(復元抽出)を繰り返す。赤玉が出た回数を
(1) 操作を1回行ったとき、赤玉が出る確率を求めなさい。
(2) 操作を2回行ったとき、赤玉が1回出る確率を求めなさい。
(3) 操作を150回行ったとき、赤玉が出る回数の平均
解説1
(1)
5つの玉には、赤玉が3つあるので、確率は
(2)
操作を行ったときに、赤玉が1回出るパターンとしては、
- 1回目:赤 2回目:白
- 1回目:白 2回目:赤
の2パターンがある。よって、確率は
(3)
いよいよ二項分布の公式を使う問題です。
箱から玉を出したときに出てくる玉は
- 赤玉(確率3/5)
- 赤玉以外 [白玉] (確率2/5)
の2つですね。さらに、それぞれの操作は独立(他の回の操作に影響されない)なので、赤玉が出る回数
よって、平均
4.ポアソン分布
(1) ポアソン分布とは
先程出てきた二項分布の平均を
すると、
ここで、二項分布の試行回数
すると、平均が固定されているため、
このように、二項分布の
(二項分布の確率
(2) ポアソン分布を用いた確率の求め方
ポアソン分布に従う試行を
確率
ここで、上の式を展開すると、
それぞれに対し、
と計算できるので、
上で導出した式がポアソン分布の公式となります!
つまり、ある一定期間内に事象が平均
(ただし、
(3) ポアソン分布の平均・分散
ある確率変数
平均は、
分散は、二項分布の分散
実際に計算すると、
平均
(4) ポアソン分布を用いた例題
では、実際にポアソン分布を使った問題を解いていきましょう。
期末試験や数検でもたまに出てきますよ。
例題2
※ 必要であれば
(1)
(このお話はあくまでも仮定です)
コナンくんが住んでいる街「米花町」では、1週間に平均1回殺人事件が発生する。
殺人事件の発生回数がポアソン分布に従うと仮定したとき、1週間に3回殺人事件が発生する確率を小数第2位まで求めなさい。
(2)
あるソーシャルゲームのガチャでは、最高レアを1%の確率で引くことができる。
100連ガチャを回したとき、つまり100回ガチャを引く試行を行ったとき、最高レアが1回も出ない確率、1回だけ出る確率、2回だけ出る確率をそれぞれ求めなさい。
解答2
ある一定期間内で平均
(1)
今回は、ある期間内に1回殺人事件が発生するので
よって、確率は、
(2)
100回ガチャを引く試行を行ったとき、確率0.01で出てくる最高レアを引く回数の平均
また、確率
よって、1回も最高レアを引けない確率は
また、1回だけ最高レアを引く確率は
(二項分布の場合)
0回、1回、2回最高レアが出る確率は
(
5.多項分布
(1) 多項分布とは
二項分布は、1回の試行で起こりえる結果が2通り(出る or 出ない)の試行を何回か繰り返したときに事象が起こる回数
この2通りの部分を
(2) 多項分布の平均と分散
二項分布の式の
(
6.幾何分布
確率
例えばコイントスで、表が初めて出る確率を考えてみましょう。
1回目で初めて表が出る確率は、言うまでもなく1/2です。
2回目で初めて表が出る確率は、1回目で裏が出て、2回目で表が出ればいいので、
3回目、4回目…と計算していき、表にしていくと下のように0に収束するようなグラフを得ることができます。
もう1つ例を考えてみましょう。
サイコロを振ったときに
少し緩やかになりましたが、回数を増やすにつれて0に収束するようなグラフとなりましたね。
(上のような回数を増やすにつれて0に収束していくグラフが幾何分布の特徴!)
7.超幾何分布
ある2つの集団(あたりの集団 or はずれの集団)があるとします。
この集団から、何回か復元抽出を行ったときにあたりを引ける回数
(具体例:赤玉5個、白玉5個入った箱から、無作為に1つ選び、選んだものを記録してからもとに戻す操作(復元抽出)を4回繰り返したとき、赤玉が出る回数
上の復元抽出を非復元抽出、つまり選んだものを元に戻さずそのまま試行を繰り返したものが超幾何分布となります。
(具体例:赤玉5個、白玉5個入った箱から、無作為に1つ選び、選んだものを戻さずに操作を4回繰り返したとき、赤玉が出る回数
超幾何分布についてもう少し理解を深めるために例題を解いてみましょう。
例題3
(1)
赤玉が3個、白玉が2個が入った箱がある。この箱の中から、同時に2つ取り出す(非復元抽出)。
このとき、赤玉が1回出る確率
(ちなみに復元抽出の場合の確率:12/25)
(2)
この中から同時に
解説3
(1)
5個の箱の中から、同時に2つ取り出す取り出し方は
また、取り出した2つの玉のうち、赤が1個、白が1個ずつ選ばれる総数は、
- 赤玉が3個中1個選ばれる確率
→ 通り - 白玉が2個中1個
→ 通り
の積で決まるので、6通りとなる。
よって、確率
(復元抽出のときより確率が高いですね!)
(2)
n個の箱の中から、同時にkつ取り出す取り出し方は
また、取り出した2つの玉のうち、赤が
- 赤玉が
個中 個選ばれる確率
→ 通り - 白玉が
個中 個選ばれる確率
→ 通り
の積で決まる。
よって、確率
8.さいごに
今回は、大学の「確率・統計」や、統計検定、院試で出てくる確率分布の中で、主要な離散型確率分布について説明していきました。
次回は連続型の確率分布について説明していきたいと思います。
*1:最高レアを引くか引かないかのベルヌーイ試行なので。
関連広告・スポンサードリンク