【基本】確率変数の変換
ここでは、ある確率変数に定数を足したり掛けたりして変換し、変換した後の期待値や分散がどうなるかを見ていきます。
確率変数の変換と期待値
【基本】期待値では、コインを6枚同時に投げて、表が出た枚数だけ100円硬貨がもらえる、という状況を考えました。このときに期待値を計算したのですが、次のように計算しました。
\begin{eqnarray}
&&
0\times\frac{ {}_6\mathrm{C}_0}{2^6} +
100\times\frac{ {}_6\mathrm{C}_1}{2^6} +200\times\frac{ {}_6\mathrm{C}_2}{2^6}+ 300\times\frac{ {}_6\mathrm{C}_3}{2^6} \\[5pt]
&&
\quad +400\times\frac{ {}_6\mathrm{C}_4}{2^6} +500\times\frac{ {}_6\mathrm{C}_5}{2^6}+600\times\frac{ {}_6\mathrm{C}_6}{2^6} \\[5pt]
&=&
\frac{100\times(0\cdot1 +1\cdot 6 +2\cdot 15 +3\cdot 20+4\cdot 15 +5\cdot 6 +6\cdot 1)}{2^6} \\[5pt]
\end{eqnarray}分子を $100$ でくくることで計算をしやすくしていますが、一般的にこのような変形ができます。
確率変数 $X$ が次のような分布に従っているとします。
\begin{eqnarray} \begin{array}{c|cccc|c} X & x_1 & x_2 & \cdots & x_n & \textsf{計} \\ \hline P & p_1 & p_2 & \cdots & p_n & 1 \end{array} \end{eqnarray}$a,b$ を定数としたとき、 $Y=aX+b$ と定めると、 $Y$ も確率変数となります。 $y_k=ax_k+b$ とおけば、$Y$ の確率分布は次のようになります。
\begin{eqnarray} \begin{array}{c|cccc|c} Y & y_1 & y_2 & \cdots & y_n & \textsf{計} \\ \hline P & p_1 & p_2 & \cdots & p_n & 1 \end{array} \end{eqnarray}新しい確率分布ができあがりました。このように、ある確率変数から別の確率変数を作ることを、確率変数の変換といいます。
この $Y$ の期待値を、 $X$ の期待値を利用して求めてみます。まずは、定義通り計算していきます。
\begin{eqnarray} E(Y) &=& \sum_{k=1}^n y_k p_k \\[5pt] &=& \sum_{k=1}^n (ax_k+b)p_k \\[5pt] &=& a\sum_{k=1}^n x_kp_k+b\sum_{k=1}^n p_k \\[5pt] \end{eqnarray}展開して足す順番を変えるとこのようになります。最後の式の1つ目の $\sum$ は、期待値の式そのものです。2つ目の $\sum$ は、確率をすべて足したものなので、 $1$ です。なので、
\begin{eqnarray}
E(Y)
&=&
a\sum_{k=1}^n x_kp_k+b\sum_{k=1}^n p_k \\[5pt]
&=&
a E(X)+b
\end{eqnarray}となることがわかります。
つまり、確率変数を $a$ 倍すると、期待値も $a$ 倍されることがわかります。また、$b$ を足すと、期待値も $b$ だけ増えることがわかります。
これを使えば、上で見たコインの例は、コインの枚数の期待値を出してから、 $100$ を掛けて求めることができる、ということになります。
確率変数の変換と分散
先ほどは、期待値を計算しましたが、今度は変換後の分散を考えてみましょう。(ちなみに、データの分析でも、【応用】データの変換で分散はどう変わるかに、似た内容があります)
$Y$ の分散、つまり、 $aX+b$ の分散は、以下を足していくことになります。
\begin{eqnarray}
& &
((ax_k+b)-E(Y))^2 \\[5pt]
&=&
((ax_k+b)-(aE(X)+b))^2 \\[5pt]
&=&
a^2 (x_k -E(X))^2 \\[5pt]
\end{eqnarray}$b$ は打ち消し合って消え、 $a$ は2回掛けられているので、 $a^2$ を前に出してきた、というわけです。
ところで、最後の式のカッコの部分を $k$ について足せば、これは $X$ の分散の定義そのものです。なので、\[ V(Y)=a^2V(X) \]となることがわかります。$b$ が消えていますが、これは次のように考えるといいでしょう。そもそも分散とは散らばり具合を表しているものだったので、すべての値が定数だけズレても、散らばり具合は変わりません。そのため、 $b$ は消えたということです。
標準偏差もすぐに求められます。
\begin{eqnarray}
\sigma(Y)
&=&
\sqrt{V(Y)} \\[5pt]
&=&
|a|\sqrt{V(X)} \\[5pt]
\end{eqnarray}となります。 $a$ には絶対値がつくことに注意しましょう。具体的な値を計算している場合は大丈夫と思いますが、文字のままで話をしているときは、符号に注意しましょう。
おわりに
ここでは、確率変数の変換により、期待値や分散がどうなるかを見ました。もう一度まとめておきます。
\begin{eqnarray} E(Y) &=& aE(X)+b \\[5pt] V(Y) &=& a^2V(X) \\[5px] \sigma(Y) &=& |a| \sigma(X) \\[5px] \end{eqnarray}
これらを使うと、$Y$ の期待値や分散を定義通り求めるよりも、計算が楽になるケースがあります。利用できるときは利用しましょう。