【基本】確率変数の分散の公式
ここでは、確率変数の分散について、定義以外の求め方を紹介していきます。
確率変数の分散のもう一つの求め方
データの分析の【標準】データの分散で見たように、分散の求め方は2種類ありました。確率変数の場合も、2種類あります。
本来の定義では、以下のように求めます。(参考:【基本】確率変数の分散)
\begin{eqnarray}
& &
V(X) \\[5pt]
&=&
\sum_{k=1}^n (x_k-m)^2p_k \\[5pt]
\end{eqnarray}
これを変形していくと、次のようになります。
\begin{eqnarray}
& &
V(X) \\[5pt]
&=&
\sum_{k=1}^n (x_k-m)^2p_k \\[5pt]
&=&
\sum_{k=1}^n (x_k^2-2mx_k+m^2) p_k \\[5pt]
&=&
\sum_{k=1}^n x_k^2p_k -2m\sum_{k=1}^n x_kp_k +m^2\sum_{k=1}^n p_k \\[5pt]
\end{eqnarray}ここで、最後の式の2つ目の $\sum$ は期待値の式そのものです。また、3つ目の $\sum$ は、確率をすべて足したものなので、 $1$ です。なので、
\begin{eqnarray}
& &
V(X) \\[5pt]
&=&
\sum_{k=1}^n x_k^2p_k -2m\cdot m +m^2 \\[5pt]
&=&
\sum_{k=1}^n x_k^2p_k -m^2 \\[5pt]
\end{eqnarray}となります。この1つ目の $\sum$ は、 $X^2$ の期待値になっています。そのため、次の式が成り立つことがわかります。\[ V(X)=E(X^2)-\{E(X)\}^2 \]言葉でいえば、「2乗の平均 引く 平均の2乗」ということです。
このように求められると何がいいのかは、次の例題を見るとわかるでしょう。
例題
この問題を、2通りの方法で解いてみます。
どちらの方法で解く場合も、まずは期待値を求めておく必要があります。
\begin{eqnarray}
E(X)
&=&
0\cdot\frac{1}{8}+1\cdot\frac{3}{8}+2\cdot\frac{3}{8}+3\cdot\frac{1}{8} \\[5pt]
&=&
\frac{3+6+3}{8} \\[5pt]
&=&
\frac{3}{2} \\[5pt]
\end{eqnarray}
次に、定義通り、分散を求めてみましょう。
\begin{eqnarray}
V(X)
&=&
E((X-m)^2) \\[5pt]
&=&
\left(0-\frac{3}{2}\right)^2\cdot\frac{1}{8}
+\left(1-\frac{3}{2}\right)^2\cdot\frac{3}{8}
+\left(2-\frac{3}{2}\right)^2\cdot\frac{3}{8}
+\left(3-\frac{3}{2}\right)^2\cdot\frac{1}{8} \\[5pt]
&=&
\frac{9}{4}\cdot\frac{1}{8}
+\frac{1}{4}\cdot\frac{3}{8}
+\frac{1}{4}\cdot\frac{3}{8}
+\frac{9}{4}\cdot\frac{1}{8} \\[5pt]
&=&
\frac{9+3+3+9}{32}=\frac{3}{4} \\[5pt]
\end{eqnarray}となります。結構、計算が大変ですね。
一方、先ほど見た内容を使って解いてみましょう。 $X^2$ の期待値を求めないといけないので、次のように計算します。
\begin{eqnarray}
E(X^2)
&=&
0^2\cdot\frac{1}{8}+1^2\cdot\frac{3}{8}+2^2\cdot\frac{3}{8}+3^2\cdot\frac{1}{8} \\[5pt]
&=&
\frac{3+12+9}{8} \\[5pt]
&=&
3 \\[5pt]
\end{eqnarray}これを使って、「2乗の平均 引く 平均の2乗」を計算すればいいんでしたね。次のようになります。
\begin{eqnarray}
V(X)
&=&
E(X^2) - \{E(X)\}^2 \\[5pt]
&=&
3 - \left(\frac{3}{2}\right)^2 \\[5pt]
&=&
3 - \frac{9}{4}=\frac{3}{4} \\[5pt]
\end{eqnarray}
同じ結果になりました。ただ、計算量はぜんぜん違いますね。
定義通りに計算すると、 $(x_k-m)^2$ を計算しないといけないのですが、 $x_k$ が整数で、期待値 $m$ が分数のようなときだと、この計算がすごく面倒になります。一方、 $E(X^2)$ はそんなに大変にはならないことが多いし、 $\{E(X)\}^2$ はすぐに計算できます。つまり、計算量は比較的少ないということです。
ちなみに、ここで紹介した式は、「どっち引くどっちだっけ?」となりやすいかもしれません。ただ、分散は負にならないので、もしも忘れてしまったら、負にならないように引けばいいだけです。
おわりに
ここでは、確率変数の分散の計算方法を見てきました。定義通りに求める以外にも方法があり、具体的に計算する場合には計算が楽になることが多いので、ここで紹介した方法もできるようになっておきましょう。