【基本】二項分布の期待値と分散
ここでは、二項分布の期待値と分散を求めていきます。
二項分布の期待値を求める準備
【基本】二項分布の後半では、具体的な例で期待値や分散を計算してみました。ただ、少し計算が面倒でした。実はもっと楽に求める方法があります。そのために、少し準備をしましょう。
二項分布 $B(n,p)$ を考えます。つまり、1回の試行で事象 $A$ の起こる確率が $p$ とします。この試行を $n$ 回繰り返したとき、 $A$ が起こる回数 $X$ の確率分布、ということですね。(例えば、サイコロを $n$ 回振って、1が $X$ 回出る、みたいな状況を考えます)
この状況で、そのまま期待値を計算すると、 $n$ が大きくなったときに計算が大変です。しかし、これを分解してみましょう。
つまり、この試行を $n$ 回行う状況で、 $k$ 回目で $A$ が起こったら $1$ となり、起こらなければ $0$ という値をとる $X_k$ というものを考えましょう($k=1,2,\cdots,n$)。これももちろん確率変数です。
このとき、\[ X=X_1+X_2+\cdots+X_n \]となります。 $k$ 回目で $A$ が起こったら $1$ になるので、全部足せば、$n$ 回の試行で $A$ が起こった回数になります。
このように $X$ を $X_k$ たちに分解すると、計算がかなり簡単になります。 $X_1,X_2,\cdots,X_n$ は互いに独立なので、以前にみた内容が使えるようになります。
二項分布の期待値
それでは先ほどの内容を踏まえて、二項分布の期待値を計算してみます。
先ほど述べたように、$X=X_1+X_2+\cdots+X_n$ と分解します。このとき、 $P(X_k=1)=p$ となり、 $P(X_k=0)=1-p$ となります。よって、 $X_k$ の期待値は次のように計算できます。
\begin{eqnarray}
E(X_k)
&=&
1\cdot p+0\cdot(1-p)=p
\end{eqnarray}また、「和の平均は、平均の和」になります(参考:【基本】確率変数の和の期待値)。これは独立でなくても成り立ちます。これを使えば
\begin{eqnarray}
E(X)
&=&
E(X_1+X_2+\cdots+X_n) \\[5pt]
&=&
E(X_1)+E(X_2)+\cdots+E(X_n) \\[5pt]
&=&
np
\end{eqnarray}となります。イメージでいうと、1回行うと、平均的に $p$ 回起こるのだから、 $n$ 回やれば $np$ 回起こる、という感じです。
【基本】二項分布の後半では、 $B\left(3,\dfrac{1}{6}\right)$ の期待値をがんばって計算して $\dfrac{1}{2}$ になることを求めましたが、先ほどわかったことを使うと\[ 3\cdot\frac{1}{6}=\frac{1}{2} \]と、あっさり求めることができるようになります。これなら $n$ が大きくなっても、ぜんぜん困らないですね。
二項分布の分散
次に、分散と標準偏差も求めてみましょう。
$X$ の分散を考える前に、 $X_k$ の分散を考えておきます。そのために、 $E(X_k^2)$ を求めておきます。
\begin{eqnarray}
E(X_k^2)
&=&
1^2\cdot p+0^2\cdot(1-p) =p
\end{eqnarray}これより、【基本】確率変数の分散の公式で見た内容を使えば、
\begin{eqnarray}
V(X_k^2)
&=&
E(X_k^2) -\left\{E(X_k)\right\}^2 \\[5pt]
&=&
p-p^2 =p(1-p)
\end{eqnarray}となります。
また、独立な確率変数に対しては、「和の分散は、分散の和」になります(参考:【基本】独立な確率変数の和の分散)。このことから
\begin{eqnarray}
V(X)
&=&
V(X_1+X_2+\cdots+X_n) \\[5pt]
&=&
V(X_1)+V(X_2)+\cdots+V(X_n) \\[5pt]
&=&
np(1-p)
\end{eqnarray}となります。また、標準偏差は\[ \sigma(X)=\sqrt{np(1-p)} \]となります。
【基本】二項分布の後半では、 $B\left(3,\dfrac{1}{6}\right)$ の分散もがんばって計算して $\dfrac{5}{12}$ になることを求めましたが、先ほどわかったことを使うと\[ 3\cdot\frac{1}{6}\cdot\frac{5}{6}=\frac{5}{12} \]と、あっさり求めることができるようになります。
おわりに
ここでは、二項分布の期待値や分散を簡単に求める方法を見ました。まとめると次のようになります。
\begin{eqnarray} E(X) &=& np \\[5pt] V(X) &=& np(1-p) \\[5pt] \sigma(X) &=& \sqrt{np(1-p)} \\[5pt] \end{eqnarray}
教科書によっては、 $1-p$ を $q$ とおいているものもあります。上の公式を使えば、 $n$ が大きい場合でもあっさりと期待値や分散を計算できますね。