【基本】二項分布
ここでは、二項分布について見ていきます。
二項分布
確率の問題でよくある設定に、「ある試行を繰り返す」というのがあります。例えば、さいころを3回投げるときに、1の目が出る回数を $X$ とする、というような状況です。これは「さいころを投げる」を繰り返しているわけですね。
$r=0,1,2,3$ とします。1の目が $r$ 回出る確率は、次のように書けます(参考:【基本】反復試行の確率)。\[ P(X=r) = {}_3\mathrm{C}_r \left(\frac{1}{6}\right)^r \left(\frac{5}{6}\right)^{3-r} \]簡単に復習すると、3回中、どの $r$ 回で1が出るかが ${}_3\mathrm{C}_r$ 通りあり、選んだタイミングで1が出る確率が $\left(\frac{1}{6}\right)^r$ で、残りの回で1以外の出る確率が $\left(\frac{5}{6}\right)^{3-r}$ となるので、これらを掛け合わせればいい、ということですね。
一般に、1回の試行で事象 $A$ の起こる確率が $p$ であるとし、 $q=1-p$ とします。この試行を $n$ 回行う反復試行で、 $A$ が起こる回数を $X$ とおくと、\[ P(X=r) = {}_n\mathrm{C}_r p^r q^{n-r} \]となります(ただし、 $r=0,1,2,\cdots,n$)。そのため、 $X$ の確率分布は次のようになります。
\begin{eqnarray} \begin{array}{c|cccccc|c} X & 0 & 1 & \cdots & r & \cdots & n & \textsf{計} \\ \hline P & {}_n\mathrm{C}_0 q^n & {}_n\mathrm{C}_1 p q^{n-1} & \cdots & {}_n\mathrm{C}_r p^r q^{n-r} & \cdots & {}_n\mathrm{C}_n p^n & 1 \\ \end{array} \end{eqnarray}合計が $1$ になるかどうかはパッと見るとわからないかもしれません。しかし、【基本】n乗の展開と二項定理 や 【標準】n乗の展開と二項定理 で見た内容を使うと、二項定理から
\begin{eqnarray}
(p+q)^n
&=&
{}_n\mathrm{C}_n p^n+{}_n\mathrm{C}_{n-1} p^{n-1}q+\cdots \\
& & +{}_n\mathrm{C}_r p^r q^{n-r}+\cdots+{}_n\mathrm{C}_1 pq^{n-1}+{}_n\mathrm{C}_0 q^n
\end{eqnarray}が成り立ちます。右辺は先ほどの分布に出てきた確率がすべて足されていて、左辺にある $p+q$ は $1$ です。こうして、確率の合計が $1$ であることが確かめられました。
この確率分布は、とてもよく出てくる基本的なものなので、名前がついています。二項分布(binomial distribution) といいます。名前は二項定理との関連性からもわかりますね。
二項分布で大事な要素は、「何回繰り返すか」と「考えたい事象が起こる確率が何か」です。ここまでの文章でいうと、 $n$ と $p$ です。二項分布の頭文字と合わせて、二項分布は $B(n,p)$ と表します。例えば、先ほどの例であれば、 $B\left(3,\dfrac{1}{6}\right)$ となります。
二項分布の期待値
先ほどの例、つまり、二項分布 $B\left(3,\dfrac{1}{6}\right)$ に従う $X$ について、定義にもとづいて期待値を求めてみましょう。
\begin{eqnarray}
E(X)
&=&
\sum_{r=0}^3 r {}_3\mathrm{C}_r \left(\frac{1}{6}\right)^r \left(\frac{5}{6}\right)^{3-r} \\[5pt]
&=&
\frac{1\cdot 3\cdot 5^2+2\cdot 3\cdot 5^1+3\cdot 1\cdot 5^0}{6^3} \\[5pt]
&=&
\frac{75+30+3}{216} \\[5pt]
&=&
\frac{1}{2} \\[5pt]
\end{eqnarray}このようになります。少し計算が面倒です。
分散も求めてみましょう。
\begin{eqnarray}
E(X^2)
&=&
\sum_{r=0}^3 r^2 {}_3\mathrm{C}_r \left(\frac{1}{6}\right)^r \left(\frac{5}{6}\right)^{3-r} \\[5pt]
&=&
\frac{1^2\cdot 3\cdot 5^2+2^2\cdot 3\cdot 5^1+3^2\cdot 1\cdot 5^0}{6^3} \\[5pt]
&=&
\frac{75+60+9}{216} \\[5pt]
&=&
\frac{2}{3} \\[5pt]
\end{eqnarray}なので
\begin{eqnarray}
V(X)
&=&
E(X^2)-\left\{E(X)\right\}^2 \\[5pt]
&=&
\frac{2}{3}-\left(\frac{1}{2}\right)^2 \\[5pt]
&=&
\frac{5}{12}
\end{eqnarray}となります。計算できないほどではないですが、これも少し大変ですね。
$n=3$ の時点でこんなに大変だと、もっと大きな値になるとますます計算が大変になります。しかし、実は、もっと楽に二項分布の期待値や分散を計算することができます。その方法については、次のページで見ることにしましょう(参考:【基本】二項分布の期待値と分散)。
おわりに
ここでは、二項分布について見てきました。今までも確率の問題でよくある状況でしたが、「二項分布」という名前がついていたんですね。
二項分布の期待値や分散を具体的に計算しましたが、計算は大変でした。実は、もっと楽に出す方法があるので、次はそれを見ることにしましょう。