【基本】確率変数と確率分布
ここでは、確率変数と確率分布について説明していきます。過去に学んだ確率について振り返りながら、用語の導入を行うのが主な内容です。
確率変数
場合の数と確率では、確率について見てきました。復習しながら、新しい用語を導入していきます。
100円玉、50円玉、10円玉を1枚ずつ投げて、表の出る枚数を $X$ とおきましょう。このとき、 $X$ は、 $0,1,2,3$ のどれかの値をとりますが、どの値をとるかは投げてみるまでわかりません。
$X=0$ となる確率は、\[ \frac{1}{2^3}=\frac{1}{8} \]となります。また、 $X=1$ となる確率は、表になるコインの選び方が $3$ 通りあるのだから、\[ \frac{3}{8} \]となります。
この例の $X$ のように、ある試行の結果によって値が定まり、その値をとる確率が定まるような変数を、確率変数(random variable) といいます。
確率変数は、 $X$ や $Y$ など、大文字で表すことが多いです。
今後、少し抽象的な話が出てくるのですが、その場合に、上のような確率変数を導入すると便利なんです。今はまだ、よさがわからないかもしれませんが、徐々に分かってくるはずです。
確率の表し方
確率変数 $X$ が $a$ という値をとる確率を $P(X=a)$ で表します。この $P$ は、確率という意味の probability に由来しています。
先ほどの例でいえば、 $P(X=0)=\dfrac{1}{8}$ や $P(X=1)=\dfrac{3}{8}$ となります。
また、 $a$ 以上 $b$ 以下の値をとる確率は $P(a\leqq X \leqq b)$ と表します。先ほどの例でいえば、
\begin{eqnarray}
P(0\leqq X \leqq 2)
&=&
\frac{1}{8}+\frac{3}{8}+\frac{3}{8} \\[5pt]
&=&
\frac{7}{8}
\end{eqnarray}となります。
確率分布
冒頭の例で、 $P(X=k)$ の値をまとめると、次のようになります。
\begin{eqnarray} \begin{array}{c|cccc|c} X & 0 & 1 & 2 & 3 & \textsf{計} \\ \hline P & \dfrac{1}{8} & \dfrac{3}{8} & \dfrac{3}{8} & \dfrac{1}{8} & 1 \end{array} \end{eqnarray}このような「確率変数のとり得る値とその確率」を表す対応関係を、 $X$ の確率分布(probability distribution) といいます。単純に、分布 ということもあります。
また、「確率変数 $X$ の分布はこのようになる」というのと、「確率変数 $X$ は、この分布に従う」を同じ意味で使います。
一般に、確率変数 $X$ のとり得る値が $x_1,x_2,\cdots,x_n$ であるとき、 $P(X=k)$ を $p_k$ で表すことにすると、確率分布は次のようになります。
\begin{eqnarray} \begin{array}{c|cccc|c} X & x_1 & x_2 & \cdots & x_n & \textsf{計} \\ \hline P & p_1 & p_2 & \cdots & p_n & 1 \end{array} \end{eqnarray}このとき、次のことが成り立ちます。
\begin{eqnarray}
p_1 \geqq 0,\ p_2\geqq 0,\ \cdots,\ p_n\geqq 0 \\[5pt]
p_1+p_2+\cdots+p_n=1
\end{eqnarray}
どちらも、確率で学んだ内容から考えれば、当たり前に感じるはずです。
おわりに
ここでは、確率変数と確率分布について見てきました。どの用語も、今後は頻繁に出てきます。