うさぎでもわかる確率・統計　累積分布関数のいろは

2024年6月9日 2024年6月9日 35分46秒

ももうさ

スポンサードリンク

こんにちは、ももやまです。

今日は、確率・統計に出てくる「累積分布関数」についてお勉強していきましょう！

目次 [hide]

1. 確率密度関数の復習
- (1) 確率分布関数のイメージ
- (2) 確率分布関数で重要な6つの性質・公式
2. 累積分布関数のイメージ
3. 例題を解いてみよう
- 例題1. 確率密度関数から累積分布関数への変換
- 例題2. 累積分布関数から確率密度関数への変換
4. 練習問題にチャレンジ
- 練習1.
- 練習2.
5. 練習問題の答え
- 解答1
- 解答2
6. まとめ

スポンサードリンク

1. 確率密度関数の復習

累積分布関数を知るためには、確率密度関数の知識が前提となってきます。

なので、まずは確率密度関数について簡単におさらいしましょう。

(1) 確率分布関数のイメージ

確率密度関数は、ヒストグラムに出てくる相対度数を細かく細かく刻んで、滑らかな曲線になったものを関数にしたものです。

f:id:momoyama1192:20200224154703g:plain — 相対度数をヒストグラムにして細かく刻みます

f:id:momoyama1192:20200224143825g:plain — 細かくなったヒストグラムをなめらか・連続的にしたものが確率密度関数です

(2) 確率分布関数で重要な6つの性質・公式

確率分布関数 $f (x)$ で出てくる重要な6つの公式を、復習しましょう。

確率分布関数の復習

確率密度関数 ( f(x) ) で与えられる確率変数 ( X ) 。ただし、 $X$ は、の値を取るとする。

その1. 確率の密度は、必ず正である。 $f (x) ≧ 0$

その2. 確率の密度 $f (x)$ は1を超えることもある。
※ 確率の密度は、確率とは異なるもの

その3. 確率変数 $X$ が、 $a ≦ x ≦ b$ となる確率は、以下の積分式で求められる。 $\int_{a}^{b} f (x) d x$

その4. 確率の和は1であるため、以下の積分式が成立する。 $\int_{- \infty}^{\infty} f (x) d x = 1$ ※ 高校数学の数Bで「確率分布と統計的な推測」を勉強してきた人は、取りうる値が $m ≦ x ≦ M$ の確率変数 $X$ に対して、 $\int_{m}^{M} f (x) d x = 1$ が成立する、という表記法のほうが馴染みがあると思います。（高校数学では広義積分を習わないため）

その5. 期待値(平均) $E (X)$ は、次の積分式で計算ができる。 $\int_{- \infty}^{\infty} x f (x) d x$ ※ 取りうる値が $m ≦ x ≦ M$ の確率変数 $X$ の場合、期待値は $\int_{m}^{M} x f (x) d x$ で計算できる。（数Bの「確率分布と統計的推測」ではこの表記を使用）

その6. 分散 $V (X)$ は、期待値(平均) $μ = E (X)$ を用いて以下の(1), (2)の式のいずれかで計算ができる。（推奨: (1)の式）

(1) 2乗した値の期待値 - 期待値の2乗で計算 $\begin{aligned} V (X) & = E (X^{2}) - {[E (X)]}^{2} \\ = \int_{- \infty}^{\infty} x^{2} f (x) d x - {(\int_{- \infty}^{\infty} x f (x) d x)}^{2} \\ = \int_{- \infty}^{\infty} x^{2} f (x) d x - μ^{2} \end{aligned}$

※ 取りうる値が $m ≦ x ≦ M$ の確率変数 $X$ の場合は、分散を $\begin{aligned} V (X) = \int_{m}^{M} x^{2} f (x) d x - {(\int_{m}^{M} x f (x) d x)}^{2} \\ = \int_{m}^{M} x^{2} f (x) d x - μ^{2} \end{aligned}$ と計算できる。（数Bの「確率分布と統計的推測」ではこの表記を使用）

(2) 各値とその期待値(平均)の差を2乗したものの期待値(平均) $V (X) = \int_{- \infty}^{\infty} (x - μ)^{2} f (x) d x$ ※ とりうる値が $m ≦ x ≦ M$ の確率変数 $X$ の場合は、 $V (X) = \int_{m}^{M} (x - μ)^{2} f (x) d x$ で計算できる。

軽くおさらいしても、「確率密度関数があまりよくわからないなぁ。」という人は、以下の記事にて確率密度関数について解説しているので、リンク先の記事をご覧ください。

スポンサードリンク

2. 累積分布関数のイメージ

(1) 相対度数と累積相対度数

累積分布関数について説明する前に、まずは「相対度数」と「累積相対度数」について復習しましょう。

※ 「累積相対度数」というのが、累積分布関数のベースとなってきます。

[a] 相対度数

相対度数とは、データをある範囲ごとに区切ったときに、その範囲内にどれくらいの割合のデータがあるかを、それぞれの範囲ごと（階級ごと）に表したものです。

式で書くと、

（相対度数）＝（各階級ごとの度数）÷（全体の度数）

となります。

例えば、階級「身長170cm以上175cm未満」の相対度数は $28 \div 100 = 0.28$ と計算できます。

表1. 度数と相対度数の関係

身長	度数	相対度数
155 - 160	2	0.02
160 - 165	12	0.12
165 - 170	24	0.24
170 - 175	28	0.28
175 - 180	20	0.20
180 - 185	14	0.14
合計	100	1.00

[b] 累積相対度数

累積相対度数は、相対度数を累積していったものです。つまり、「（小さい階級から数えていったときに）ある区間までのデータの割合を累積したもの」と言えます。

例えば、先ほどの表1のデータを見てみましょう。

表1の各階級ごとの累積相対度数は、

155cm以上160cm未満 → 累積相対度数は、そのまま相対度数0.02。
160cm以上165cm未満 → 160cm未満までの累積相対度数0.02に、160cm以上165cm未満の相対度数0.12を足すので、0.02 + 0.12 = 0.14。
165cm以上170cm未満 → 165cm未満までの累積相対度数0.14に、165cm以上170cm未満の相対度数0.24を足すので、0.14 + 0.24 = 0.38。
170cm以上175cm未満 → 170cm未満までの累積相対度数0.38に、170cm以上175cm未満の相対度数0.28を足すので、0.38 + 0.28 = 0.66。
175cm以上180cm未満 → 175cm未満までの累積相対度数0.66に、175cm以上180cm未満の相対度数0.20を足すので、0.66 + 0.20 = 0.86。
180cm以上185cm未満 → 180cm未満までの累積相対度数0.86に、180cm以上185cm未満の相対度数0.14を足すので、0.86 + 0.14 = 1.00。

と計算できます。

表2. 相対度数と累積相対度数の関係

身長	度数	相対度数	累積相対度数	計算式_{(累積相対度数)}
155 - 160	2	0.02	0.02	0.02
160 - 165	12	0.12	0.14	0.02 + 0.12
165 - 170	24	0.24	0.38	0.14 + 0.24
170 - 175	28	0.28	0.66	0.38 + 0.28
175 - 180	20	0.20	0.86	0.66 + 0.20
180 - 185	14	0.14	1.00	0.86 + 0.14
合計	100	1.00	-	-

(2) 累積相対度数から累積分布関数へ

表2で求めた、各階級ごとの累積相対度数を、下のようなヒストグラムの形にします。

さらに、このヒストグラムの横軸をどんどん細かくしていくことを考えていきます。

累積分布関数 $F (x)$ は、この細かくなったヒストグラムをなめらかかつ連続的にしたもの、だと思っていただければOKです。

(3) 確率密度関数 f(x) と累積分布関数 F(x) の関係

[a] f(x)からF(x)を求める方法

累積相対度数というのは、ある区間までの相対度数を累積したものでした。

この考えは、累積分布関数でも言えます。つまり、累積分布関数 $F (x)$ は、それまでの値 $x$ までの確率密度関数 $f (x)$ をすべて累積した（＝足し合わせた）ようなものと言えます。

ここで、確率密度関数 $f (x)$ は連続なので、ある値 $x$ までの累積は、積分を使って計算することが出来ます。

具体的に、ある値 $x$ における累積分布関数 $F (x)$ 、つまり値 $x$ までの確率密度関数 $f (x)$ をすべて累積したものは、確率密度関数 $f (x)$ を用いて次のように計算できます。 $F (x) = \int_{- \infty}^{x} f (t) d t$ ※ $f (t)$ は確率密度関数 $f (x)$ の $x$ を $t$ におきかえたもの。

[b] F(x)からf(x)を求める方法

確率密度関数 $f (x)$ から累積分布関数 $F (x)$ は、積分をすることで求めることが出来ましたね。

そのため、累積分布関数 $F (x)$ から確率密度関数 $f (x)$ を求める際には、累積分布関数 $F (x)$ を微分することで求めることが出来ます。式で書くと、以下の通りです。 $f (x) = \frac{d}{d x} F (x)$

まとめ: f(x)とF(x)の関係

(4) 累積分布関数 F(x)で覚えておきたい3つの性質

つぎに、累積分布関数で覚えておきたい3つの性質を紹介します。

性質1. $F (x)$ は必ず0以上1以下

累積分布関数 $F (x)$ は確率なので、値は必ず0以上1以下の値を取ります。 $0 ≦ F (x) ≦ 1$

性質2. $F (x)$ は単調増加

累積相対度数では、前の階級値の相対度数をどんどん累積していって求めるため、前の階級値の累積相対度数よりも累積相対度数が小さくなることは絶対にありません。

累積分布関数 $F (x)$ でも累積相対度数の考え方と同じように、それまでの確率密度 $f (x)$ をすべて足し合わせて求めていくため、 $x$ の値が増えると、必ず $F (x)$ は大きい or 同じ値を取ります。

数式で書くと、 $x_{1} < x_{2} \to F (x_{1}) ≦ F (x_{2})$ となります。

性質3. $F (x)$ と極限

累積分布関数 $F (x)$ では、つぎの2つの極限式が成り立ちます^[1]直接試験で出てくることは少ないですが、求めた累積分布関数 $F (x)$ が正しいかどうかの検算に使えます。。

[1]

lim_{x \to - \infty} F (x) = 0

解説:

x

が限りなく小さいときは、何も累積されていない状態なので、0となる。

[2]

lim_{x \to \infty} F (x) = 1

解説:

x

が限りなく大きいときは、すべての確率密度

f (x)

が累積されている状態のため、1となる。

この2つの性質は、図で見るとより分かりやすくなると思うので、図でも確認しましょう。

スポンサードリンク

3. 例題を解いてみよう

ここからは、実際に例題を解くことで、試験でよく出題される確率密度関数 $f (x)$ と累積分布関数 $F (x)$ の変換計算に慣れましょう。

例題1. 確率密度関数から累積分布関数への変換

例題1

確率変数 $X$ の確率密度関数 $f (x)$ が、つぎのように定義されている。 $\begin{array}{r} f (x) = {\begin{cases} 0 & (x < 0) \\ \frac{1}{4} & (0 ≦ x < 2) \\ \frac{1}{2} & (2 ≦ x < 3) \\ 0 & (3 ≦ x) \end{cases} \end{array}$

このとき、累積分布関数 $F (x)$ を求めなさい。

解説1

確率密度関数が

$x < 0$ … [i]
$0 ≦ x < 2$ … [ii]
$2 ≦ x < 3$ … [iii]
$3 ≦ x$ … [iv]

で分かれているので、この4つに場合分けして計算しましょう。

[i]

x < 0

のとき

\begin{aligned} F (x) & = \int_{- \infty}^{x} f (t) d t \\ = \int_{- \infty}^{x} 0 d t \\ = 0 \end{aligned}

※ 試験では、わざわざ式で書かなくていいレベル。

[ii]

0 ≦ x < 2

のとき

\begin{aligned} F (x) & = \int_{- \infty}^{x} f (t) d t \\ = \int_{- \infty}^{0} 0 d t + \int_{0}^{x} \frac{1}{4} d t \\ = 0 + {[\frac{1}{4} t]}_{0}^{x} \\ = \frac{1}{4} x \end{aligned}

[iii]

2 ≦ x < 3

のとき

\begin{aligned} F (x) & = \int_{- \infty}^{x} f (t) d t \\ = \int_{- \infty}^{0} 0 d t + \int_{0}^{2} \frac{1}{4} d t + \int_{2}^{x} \frac{1}{2} d t \\ = 0 + {[\frac{1}{4} t]}_{0}^{2} + {[\frac{1}{2} t]}_{2}^{x} \\ = (\frac{1}{4} \cdot 2 - \frac{1}{4} \cdot 0) + (\frac{1}{2} x - \frac{1}{2} \cdot 2) \\ = \frac{1}{2} x - \frac{1}{2} \end{aligned}

[iv]

3 ≦ x

のとき

\begin{aligned} F (x) & = \int_{- \infty}^{x} f (t) d t \\ = \int_{- \infty}^{0} 0 d t + \int_{0}^{2} \frac{1}{4} d t + \int_{2}^{3} \frac{1}{2} d t + \int_{3}^{x} 0 d t \\ = 0 + {[\frac{1}{4} t]}_{0}^{2} + {[\frac{1}{2} t]}_{2}^{3} + 0 \\ = (\frac{1}{4} \cdot 2 - \frac{1}{4} \cdot 0) + (\frac{1}{2} \cdot 3 - \frac{1}{2} \cdot 2) \\ = \frac{1}{2} + \frac{1}{2} \\ = 1 \end{aligned}

※ 累積分布関数の性質として、

lim_{x \to \infty} F (x) = 1

よって、累積分布関数 $F (x)$ は、 $\begin{array}{r} F (x) = {\begin{cases} 0 & (x < 0) \\ \frac{1}{4} x & (0 ≦ x < 2) \\ \frac{1}{2} x - \frac{1}{2} & (2 ≦ x < 3) \\ 1 & (3 ≦ x) \end{cases} \end{array}$ と計算できる。

例題2. 累積分布関数から確率密度関数への変換

例題2

確率変数 $X$ の累積分布関数 $F (x)$ が、つぎのように定義されている。 $\begin{array}{r} f (x) = {\begin{cases} 0 & (x < 0) \\ \frac{1}{4} x & (0 ≦ x < 1) \\ \frac{1}{4} x^{2} & (1 ≦ x < 2) \\ 1 & (2 ≦ x) \end{cases} \end{array}$

このとき、確率密度関数 $f (x)$ を求めなさい。

解説2

累積分布関数が

$x < 0$ … [i]
$0 ≦ x < 1$ … [ii]
$1 ≦ x < 2$ … [iii]
$2 ≦ x$ … [iv]

で分かれているので、この4つに場合分けして計算しましょう。

[i]

x < 0

のとき

\begin{aligned} f (x) & = \frac{d}{d x} F (x) \\ = \frac{d}{d x} (0) \\ = 0 \end{aligned}

※ 試験では、わざわざ式で書かなくていいレベル。

[ii]

0 ≦ x < 1

のとき

\begin{aligned} f (x) & = \frac{d}{d x} F (x) \\ = \frac{d}{d x} (\frac{1}{4} x) \\ = \frac{1}{4} \end{aligned}

[iii]

1 ≦ x < 2

のとき

\begin{aligned} f (x) & = \frac{d}{d x} F (x) \\ = \frac{d}{d x} (\frac{1}{4} x^{2}) \\ = \frac{1}{2} x \end{aligned}

[iv]

2 ≦ x

のとき

\begin{aligned} f (x) & = \frac{d}{d x} F (x) \\ = \frac{d}{d x} (0) \\ = 0 \end{aligned}

※ 試験では、わざわざ書く必要なし。

よって、確率密度関数 $f (x)$ は、 $\begin{array}{r} f (x) = {\begin{cases} 0 & (x < 0) \\ \frac{1}{4} & (0 ≦ x < 1) \\ \frac{1}{2} x & (1 ≦ x < 2) \\ 0 & (2 ≦ x) \end{cases} \end{array}$ と計算できる。

4. 練習問題にチャレンジ

それでは、累積分布関数の理解が出来ているか、実際に練習問題を解くことで確認しましょう！

練習1.

例題1

確率変数 $X$ の確率密度関数 $f (x)$ が、つぎのように定義されている。 $\begin{array}{r} f (x) = {\begin{cases} 2 x e^{- x^{2}} & (x ≧ 0) \\ 0 & (x < 0) \end{cases} \end{array}$

このとき、累積分布関数 $F (x)$ を求めなさい。

練習2.

例題2

確率変数 $X$ の累積分布関数 $F (x)$ が、つぎのように定義されている。 $\begin{array}{r} f (x) = {\begin{cases} 0 & (x < 1) \\ (x - 1)^{2} & (1 ≦ x < 2) \\ 1 & (2 ≦ x) \end{cases} \end{array}$

(1) 確率密度関数 $f (t)$ を求めなさい。
(2) 確率変数 $X$ の期待値 $E (X)$ を求めなさい。
(3) 確率変数 $X$ の分散 $V (X)$ を求めなさい。

5. 練習問題の答え

解答1

確率密度関数が

$x ≧ 0$ … [i]
$x < 0$ … [ii]

で分かれているので、この4つに場合分けして計算しましょう。

[i]

x ≧ 0

のとき

\begin{aligned} F (x) & = \int_{- \infty}^{x} f (t) d t \\ = \int_{- \infty}^{0} 0 d t + \int_{0}^{x} 2 t e^{- t^{2}} d t \\ = 2 \int_{0}^{x} t e^{- t^{2}} d t \\ = - \int_{0}^{x} - 2 t e^{- t^{2}} d t \\ = - {[e^{- t^{2}}]}_{0}^{x} \\ = - (e^{- x^{2}} - e^{0^{2}}) \\ = - (e^{- x^{2}} - 1) \\ = 1 - e^{- x^{2}} \end{aligned}

[ii]

x < 0

のとき

\begin{aligned} F (x) & = \int_{- \infty}^{x} f (t) d t \\ = \int_{- \infty}^{x} 0 d t \\ = 0 \end{aligned}

※ 試験では、わざわざ式で書かなくていいレベル。

よって、累積分布関数 $F (x)$ は、 $\begin{array}{r} F (x) = {\begin{cases} 1 - e^{- x^{2}} & (x ≧ 0) \\ 0 & (x < 0) \end{cases} \end{array}$ と計算できる。

※ [i]の積分が合っているか不安な人は、累積分布関数 $F (x)$ の極限式 $lim_{x \to \infty} F (x) = 1$ が成り立つか確認するのがおススメです。実際に計算してみると、 $\begin{aligned} lim_{x \to \infty} F (x) & = lim_{x \to \infty} 1 - e^{- x^{2}} \\ = 1 - lim_{x \to \infty} e^{- x^{2}} \\ = 1 - 0 \\ = 1 \end{aligned}$ となり、問題ないことが分かります。

解答2

(1)

累積分布関数が

$x < 1$ … [i]
$1 ≦ x < 2$ … [iii]
$2 ≦ x$ … [iv]

で分かれているので、この4つに場合分けして計算する。

[i]

x < 1

のとき

\begin{aligned} f (x) & = \frac{d}{d x} F (x) \\ = \frac{d}{d x} (0) \\ = 0 \end{aligned}

※ 試験では、わざわざ式で書かなくていいレベル。

[ii]

1 ≦ x < 2

のとき

\begin{aligned} f (x) & = \frac{d}{d x} F (x) \\ = \frac{d}{d x} {(x - 1)^{2}} \\ = \frac{d}{d x} (x^{2} - 2 x + 1) \\ = 2 x - 2 \end{aligned}

[iii]

2 ≦ x

のとき

\begin{aligned} f (x) & = \frac{d}{d x} F (x) \\ = \frac{d}{d x} (0) \\ = 0 \end{aligned}

※ 試験では、わざわざ式で書かなくていいレベル。

よって、確率密度関数 $f (x)$ は、 $\begin{array}{r} f (x) = {\begin{cases} 0 & (x < 1) \\ 2 x - 2 & (1 ≦ x < 2) \\ 0 & (2 ≦ x) \end{cases} \end{array}$ と計算できる。

(2)

確率密度関数 $f (x)$ が求まっているので、求めた $f (x)$ を、期待値の公式 $E (X) = \int_{- \infty}^{\infty} x f (x) d x$ に入れればOK。

実際に計算すると、 $\begin{aligned} E (X) & = \int_{- \infty}^{\infty} x f (x) d x \\ = \int_{- \infty}^{1} x \cdot 0 d x + \int_{1}^{2} x (2 x - 2) d x + \int_{2}^{\infty} x \cdot 0 d x \\ = \int_{1}^{2} 2 x^{2} - 2 x d x \\ = 2 \int_{1}^{2} x^{2} - x d x \\ = 2 {[\frac{1}{3} x^{3} - \frac{1}{2} x^{2}]}_{1}^{2} \\ = 2 {(\frac{1}{3} \cdot 2^{3} - \frac{1}{2} \cdot 2^{2}) - (\frac{1}{3} \cdot 1^{3} - \frac{1}{2} \cdot 1^{2})} \\ = 2 {(\frac{8}{3} - 2) - (\frac{1}{3} - \frac{1}{2})} \\ = 2 {\frac{2}{3} - (- \frac{1}{6})} \\ = 2 \cdot \frac{5}{6} \\ = \frac{5}{3} \end{aligned}$ と計算できる。

(3)

確率密度関数 $f (x)$ を、分散の公式 $\begin{aligned} V (X) & = E (X^{2}) - {[E (X)]}^{2} \\ = \int_{- \infty}^{\infty} x^{2} f (x) d x - {[E (X)]}^{2} \end{aligned}$ に入れればOK。

ここで、 $\begin{aligned} E (X^{2}) & = \int_{- \infty}^{\infty} x^{2} f (x) d x \\ = \int_{- \infty}^{1} x^{2} \cdot 0 d x + \int_{1}^{2} x^{2} (2 x - 2) d x + \int_{2}^{\infty} x^{2} \cdot 0 d x \\ = \int_{1}^{2} 2 x^{3} - 2 x^{2} d x \\ = 2 \int_{1}^{2} x^{3} - x^{2} d x \\ = 2 {[\frac{1}{4} x^{4} - \frac{1}{3} x^{3}]}_{1}^{2} \\ = 2 {(\frac{1}{4} \cdot 2^{4} - \frac{1}{3} \cdot 2^{3}) - (\frac{1}{4} \cdot 1^{4} - \frac{1}{3} \cdot 1^{3})} \\ = 2 {(4 - \frac{8}{3}) - (\frac{1}{4} - \frac{1}{3})} \\ = 2 {\frac{4}{3} - (- \frac{1}{12})} \\ = 2 \cdot \frac{17}{12} \\ = \frac{17}{6} \end{aligned}$ と計算できるので、分散は、 $\begin{aligned} V (X) & = E (X^{2}) - {[E (X)]}^{2} \\ = \frac{17}{6} - {(\frac{5}{3})}^{2} \\ = \frac{17}{6} - \frac{25}{9} \\ = \frac{51}{18} - \frac{50}{18} \\ = \frac{1}{18} \end{aligned}$ と計算できる。