【発展】共分散のもう一つの求め方

【標準】データの分散で見たように、分散には定義の式とは別の求め方がありました。共分散にも別バージョンがあります。分散のときほど使われませんが、ここでその求め方について見ていきます。

【広告】

共分散のもう1つの求め方

分散を定義通りに求めるなら次のような式になります。\[ \frac{1}{n}\left\{(x_1-\bar{x})^2+(x_2-\bar{x})^2+\cdots+(x_n-\bar{x})^2\right\} \]これを次のようにも計算できる、というのが、【標準】データの分散で見た内容でした。\[\frac{1}{n}(x_1^2+x_2^2+\cdots+x_n^2) -\bar{x}^2 \]言葉で書くと「2乗の平均値 引く 平均値の2乗」ですね。

同じような計算を、共分散で行ってみましょう。

共分散は、定義通りに求めるなら次のようになります(参考:【基本】相関係数#共分散)。\[ \frac{1}{n} \{ (x_1-\bar{x})(y_1-\bar{y}) +(x_2-\bar{x})(y_2-\bar{y}) +\cdots +(x_n-\bar{x})(y_n-\bar{y}) \} \]ここで、 $\bar{x}$, $\bar{y}$ は平均を表しています。そのため、次の式が成り立ちます。
\begin{eqnarray}
x_1+x_2+\cdots+x_n=n\bar{x} \\
y_1+y_2+\cdots+y_n=n\bar{y} \\
\end{eqnarray}これを踏まえて、上の共分散の式を変形していきましょう。

波カッコの中の k 番目の項について考えてみましょう。この部分だけを展開すると、次のようになります。
\begin{eqnarray}
& &
(x_k-\bar{x}) (y_k-\bar{y}) \\
&=&
x_ky_k -x_k\bar{y} -\bar{x}y_k +\bar{x}\bar{y}
\end{eqnarray}

このように分解して、 $k=1$ のときから $k=n$ のときまで足すとどうなるかを考えます。

$x_ky_k$ の部分は、次のようにそのまま足すことになります。\[ x_1y_1+x_2y_2+\cdots +x_ny_n \]

$-x_k\bar{y}$ の部分を足すと、次のようになります。
\begin{eqnarray}
& &
-x_1\bar{y} -x_2\bar{y} -\cdots -x_n\bar{y} \\
&=&
-\bar{y}(x_1 +x_2 +\cdots +x_n) \\
&=&
-\bar{y}\times n\bar{x} \\
&=&
-n\bar{x}\bar{y} \\
\end{eqnarray}途中で、和を $n\bar{x}$ で置き換える変形を使っています。

同じように $-\bar{x}y_k$ の部分を足した値も $-n\bar{x}\bar{y}$ になることがわかります。

最後の $+\bar{x}\bar{y}$ の部分は、同じ値を n 回足すことになるので、和は $n\bar{x}\bar{y}$ となります。

以上から、共分散の定義に出てくる式は、次のように変形できることがわかります。
\begin{eqnarray}
& &
\frac{1}{n} \{ (x_1y_1+x_2y_2+\cdots +x_ny_n) -n\bar{x}\bar{y}-n\bar{x}\bar{y}+n\bar{x}\bar{y} \} \\[5pt] &=&
\frac{1}{n} \{ (x_1y_1+x_2y_2+\cdots +x_ny_n) -n\bar{x}\bar{y} \} \\[5pt] &=&
\frac{1}{n} (x_1y_1+x_2y_2+\cdots +x_ny_n) -\bar{x}\bar{y} \\[5pt] \end{eqnarray}これは、言葉でいうと、「積の平均値 引く 平均値の積」ということができます。分散のときとどことなく似ていますね。

おわりに

ここでは、共分散のもう一つの求め方を紹介しました。分散のときと似たような式変形を行うと、似たような結果が得られます。ただ、分散のときに比べて、上に書いた共分散の別バージョンの使いどころはそんなには多くないです。