スポンサードリンク
こんにちは、ももやまです。
今日は、確率・統計分野の中で出てくるポアソン分布と、ポアソン分布を使った確率を求める計算方法を紹介していきます。
※ 本記事には、二項分布の内容が出てきます。「二項分布ってなんだっけ?」とか「二項分布忘れちゃったな」という人は、下の記事にて復習することをおすすめします。
目次 [hide]
スポンサードリンク
1. ポアソン分布とは?
ポアソン分布とは、「ごく稀にしか起こらないけど、いつ起こるか分からない出来事」の回数」をモデル化したものです。
このモデル化をしたデータを元に、事象が起こる確率を近似的に求めることができるのがポアソン分布の強みです。
例えば、こんな問題を求めることができるようになります。
※ 実際にどう解くかは、4章の「例題でポアソン分布の理解を深めよう」で説明します。
1%の確率で1等が出るくじがある。このくじに100回チャレンジしたとき、1等が2回出る確率を求めなさい。
桃山先生が書くプログラムは、平均して100行ごとに1個のバグが潜んでいる。桃山先生が300行のコードを書くときに、バグが3個以上潜んでいる確率を求めなさい。
スポンサードリンク
2. ポアソン分布を用いた確率導出公式
ある事象がポアソン分布に従う(or 近似できる)場合、事象が起こる確率を以下の公式で簡単に求めることができます。
ある事象が単位時間あたりに、平均して
このとき、同じ単位時間内に事象が
※1
※2
※3 ポアソン分布を使用して確率を求める際には、次の条件を満たす必要があります。ただし、テストで出てくる問題では、以下の条件はすべて満たしているのであまり気にする必要はありません。
【ポアソン分布を使うため条件】
- 同じ瞬間に、複数の事象が起こらないこと。
- 事象が起こる確率は常に一定であること。
(例えば、1時間に平均3回の事象が起こる場合、どの時間を切り出しても必ず事象が起こる確率は1時間に平均3回であること。) - 事象が独立していること。
(例えば、1時間に平均3回の事象が起こる場合、最初の30分で10回の事象が起こったとしても、後ろの30分で事象が起こる確率は変わらず1時間に平均3回であること。)
公式導出
[i] 二項分布からポアソン分布へ
二項分布とは、結果が2通りしかない[1]例: コイントスをして表が出るか裏が出るか 事象を複数回(
ここで、
ポアソン分布では、試行回数
[ii] 公式が導出されるまでの流れ
まず、ある試行を
この式を、少し変形してから、次の2つに分けてみましょう。
ここで2つ目のピンク色部分の式は、
そのため、
また、3つ目の紫色部分の式も、
そのため、
これら3つの式を組み合わせることで、ポアソン分布の公式をつぎのように導出できます。
スポンサードリンク
3. ポアソン分布の期待値・分散
つぎに、ポアソン分布に従う確率変数
(1) ポアソン分布の期待値
ポアソン分布は、「二項分布における、試行回数
そのため、ポアソン分布の期待値
(2) ポアソン分布の分散
二項分布の分散は、
ここで、ポアソン分布は
したがって、ポアソン分布の分散
分散
そのため、ポアソン分布の期待値は定義そのもの
確率変数
期待値と分散が等しくなるのが、ポアソン分布の特徴!
4. 例題でポアソン分布の理解を深めよう
では実際に、ポアソン分布を使った確率計算を2つの例題で体験してみましょう。
(1) 例題1.
1%の確率で1等が出るくじがある。このくじに100回チャレンジしたとき、1等が2回出る確率を求めなさい。(小数第2位まで求めること。)
※ 必要であれば、
[解説]
まず、1%で当たるくじを100回引いたときに、1等が出る回数の期待値は次のように求められます。
つまり、くじを100回引くという事象を行ったときに1等が平均して1回出ることが期待されます。なので、ポアソン分布のパラメータ
今回は、1等が2回出る確率
※ 二項分布でつぎのように計算しても、確率 0.18 を導出することができます[3]こんな計算、手では絶対したくありませんよね!。ポアソン分布での近似がうまく行っているということですね!
(2) 例題2.
桃山先生が書くプログラムは、平均して100行ごとに1個のバグが潜んでいる。ある日、桃山先生が300行のコードを書くこととなった。つぎの(1), (2)の問いに答えなさい。(答えは、小数第2位まで求めること。)
(1) 桃山先生が書いた300行のコードの中に、バグが1つも潜んでいない確率を求めなさい。
(2) 桃山先生が書いた300行のコードの中に、バグが3個以上潜んでいる確率を求めなさい。
※ 必要であれば、
[解説]
(1)
平均して100行ごとに1個のバグが潜んでいるということは、300行のコードを書いた際は、平均して3個のバグが潜んでいるといえます。
今回は、バグが1つも潜んでいない確率
あとは、ポアソン分布の公式に平均
実際に代入すると、確率を次のように求められます。
よって、バグが1つも潜んでいない確率は 0.05 と求められます。
(2)
バグが3個以上
ここで、バグが2個以下である確率は、
[i] バグが1つも潜んでいない確率[ii} バグが1つ潜んでいる確率
[iii] バグが2つ潜んでいる確率
の和で計算ができます。
[i] バグが1つも潜んでいない確率(1)の計算結果を利用できます。
よって、バグが2個以下である確率
バグが3個以上潜んでいる確率
5. 練習問題で確認!
最後に、練習問題でポアソン分布が理解できるかを確認しましょう!
桃山先生が営んでいるラーメン店「ラーメン桃山」では、15分あたり平均2人の来店がある。来店人数がポアソン分布に従うと仮定できるとき、つぎの(1)〜(3)の問いに答えなさい。
(1) 30分あたりの来店人数の期待値、分散を求めなさい。
(2) 30分間に1人も来店しない確率を求めなさい。(小数第2位まで記すこと。)
(3) 30分間の来店人数が2人以下となる確率を求めなさい。(小数第2位まで記すこと。)
※ 必要であれば、
6. 練習問題の答え
(1)
15分あたり平均2人の来店があるということは、30分あたりの来店人数の期待値は次のように求められます。
よって、30分あたりの来店人数の期待値は4人となります。
また、ポアソン分布の特徴として、期待値と分散は同じ値になります。
したがって、30分あたりの来店人数の分散も4となります。
(2)
30分あたりの来店人数の期待値は4人なので、ポアソン分布のパラメータ
今回求めたい確率は、30分間に1人も来店しない確率
あとは、ポアソン分布の公式
(3)
30分間の来店人数が2人以下となる確率確率は、
[i] 30分間に1人も来店しない場合の確率[ii} 30分間に1人来店する場合の確率
[iii] 30分間に2人来店する場合の確率
の和で計算ができます。
[i] 30分間に1人も来店しない場合の確率(2)の計算結果を利用できます。
よって、30分間の来店人数が2人以下となる確率
よって、30分間の来店人数が2人以下となる確率は 0.24 と求められます。
関連広告・スポンサードリンク