【基本】確率変数の独立
ここでは、確率変数の独立について見ていきます。
確率変数の積について
【基本】確率変数の和の期待値では、 $E(X+Y)=E(X)+E(Y)$ となることを見ました。これを見ると、 $E(XY)$ は $E(X)E(Y)$ と等しくなるんじゃないか、という気がします。が、残念ながら、実はそうはなりません。
上のリンク先で見たのと同じ例を考えます。同時分布が次のようになっている状況を考えます。
$X$
$Y$
|
$0$ | $1$ | $2$ | 計 |
$0$ | $\dfrac{7}{15}$ | $\dfrac{14}{45}$ | $\dfrac{1}{45}$ | $\dfrac{4}{5}$ |
$1$ | $\dfrac{7}{45}$ | $\dfrac{2}{45}$ | $0$ | $\dfrac{1}{5}$ |
計 | $\dfrac{28}{45}$ | $\dfrac{16}{45}$ | $\dfrac{1}{45}$ | $1$ |
$E(XY)$ を計算しましょう。 $XY=0$ となる場合は考えなくていいので、結局、 $X=1,Y=1$ の場合だけを考えればいいため、\[ E(XY)=\frac{2}{45} \]となります。たしかに、 $E(X)E(Y)=\dfrac{2}{25}$ とは一致しません。
残念ですが、 $E(XY)$ と $E(X)E(Y)$ が一致するとは限りません。しかし、一致するための条件が存在します。そこで重要なのが、確率変数の独立、という性質です。
確率変数の独立
確率変数の独立は、次のように定義されます。
例えば、冒頭の例であれば、 $P(X=0,Y=0)=\dfrac{7}{15}$ ですが、 $P(X=0)=\dfrac{4}{5}$, $P(Y=0)=\dfrac{28}{45}$ なので、 $P(X=0,Y=0)\ne P(X=0)P(Y=0)$ だから、独立ではありません。
一方、例えば、以下のような同時分布になっている場合を考えましょう。
$X$
$Y$
|
$0$ | $1$ | $2$ | 計 |
$0$ | $\dfrac{112}{225}$ | $\dfrac{64}{225}$ | $\dfrac{4}{225}$ | $\dfrac{4}{5}$ |
$1$ | $\dfrac{28}{225}$ | $\dfrac{16}{225}$ | $\dfrac{1}{225}$ | $\dfrac{1}{5}$ |
計 | $\dfrac{28}{45}$ | $\dfrac{16}{45}$ | $\dfrac{1}{45}$ | $1$ |
この場合は、 $P(X=a,Y=b)=P(X=a)P(Y=b)$ となるので、 $X$ と $Y$ は独立である、といいます。
また、3つ以上の場合も同様に定義します。確率変数 $X_1,X_2,\cdots,X_n$ があって、任意の値 $a_1,a_2,\cdots,a_n$ に対して\[ P(X_1=a_1,X_2=a_2,\cdots,X_n=a_n)=P(X_1=a_1)P(X_2=a_2)\cdots P(X_n=a_n) \]が成り立つとき、確率変数 $X_1,X_2,\cdots,X_n$ は互いに独立である、といいます。
試験では、確率変数が独立であるかどうかを聞かれることはほとんどないでしょう。一般に、2つの独立な試行 $T_1,T_2$ があるとき、 $T_1$ だけに関する確率変数 $X$ と $T_2$ だけに関する確率変数 $Y$ は、独立になります(参考:【基本】独立試行)。このことを利用して独立であるという場面がほとんどだと思います。
おわりに
ここでは、確率変数の独立について見てきました。この独立という性質があると、期待値や分散に関するいい性質が使えるようになります。それについては、また別のページで見ることにします(参考:【基本】独立な確率変数の積の期待値)。