【基本】データの平均値
【導入】データの代表値でも書きましたが、たくさんのデータがある場合、すべてのデータとにらめっこしていても、比較したり分析することは難しいです。そこで、データ全体の特徴を表すものとして「平均値」がよく使われます。ここでは、この平均値について見ていきます。
身長データ
男性5人組のグループが3つあったとしましょう。このグループの名前を A, B, C と呼ぶことにします。
グループA の各メンバーの身長が次のようになっていたとします。単位はcmです。\[ 166, 171, 175, 168, 172 \]みんな、だいたい170㎝くらいですね。
グループB は、次のようになっていたとします。\[ 170, 167, 167, 181, 185 \]180cm台が2人もいるので、グループA よりグループB のほうが身長が高い傾向がある、といえそうです。
グループC のメンバーの身長は、こうなっていたとします。\[ 170, 176, 176, 170, 182 \]180cm台がいるうえ、160cm台がいないので、グループC もグループAよりは身長が高いと言えるでしょう。しかし、B と C を比較するとどうでしょうか。B には 160cm台が2人いるけど、180cm台も2人いるので、比較しづらいです。
複数の数値をそのまま比較するのは、ちょっと難しそうです。
平均値
このように、複数のデータがあって、比較・分析したいときには、平均値(mean value)がよく使われます。平均値とは、「すべての数値を足して、数値の個数で割ったもの」です。平均値は、単に「平均」とも呼ばれます。
例えば、グループA の平均身長は次のようになります。\[ \frac{166+171+175+168+172}{5}=170.4 \]また、グループB とグループC の平均身長も同じように出すと、次のようになります。
\begin{eqnarray}
& & \frac{170+167+167+181+185}{5} = 174 \\[5pt]
& & \frac{170+176+176+170+182}{5} = 174.8 \\[5pt]
\end{eqnarray}
このように、平均値は、数値の和を数値の個数で割って算出します。これは、「合計が変わらない状態で、すべてのデータが同じ数字だったらどうなるか」を表しているものであり、データのでこぼこを平(たい)らに均(なら)したもの、ということができます。
平均身長で考えると、AよりもB、BよりもCの方が身長が高い、と言えます。このように、平均値はデータ全体の特徴を表す数値(代表値)として使われます。
式でまとめると、次のようになります。
仮平均
平均値を算出するときに、すべての数値を足す計算が出てきます。数値が大きくなってくると、計算が大変です。そのような場合には、仮平均というものが使えます。
仮平均とは、仮で設定する平均のことです。この仮平均とのズレの平均を使うと計算が楽になります。といっても、文字の説明ではよくわからないので、実際に計算してみましょう。
上の例のグループA のメンバーの身長は次の通りでした。\[ 166, 171, 175, 168, 172 \]だいたい170㎝くらいです。そのため、とりあえず、170を仮平均とします。そして、この仮平均とのズレを考えます。すると、次のようになります。\[ -4,1,5,-2,2 \]この平均を計算したものと仮平均 170 とを足したものが、元の数値の平均になります。つまり、次のように計算できる、ということです。
\begin{eqnarray}
170+\frac{-4+1+5-2+2}{5}=170.4
\end{eqnarray}もちろん、上で出したときと同じ結果になっています。
この理屈は、次の式変形を見ればわかると思います。
\begin{eqnarray}
& &
\frac{166+171+175+168+172}{5} \\[5pt]
&=&
\frac{(170-4)+(170+1)+(170+5)+(170-2)+(170+2)}{5} \\[5pt]
&=&
\frac{170\times 5-4+1+5-2+2}{5} \\[5pt]
&=&
170+\frac{-4+1+5-2+2}{5} \\[5pt]
\end{eqnarray}一番初めの式が、定義通りの式です。それぞれの数値を「仮平均+ズレ」と分解すると、分子には「仮平均×数値の個数+ズレの和」が出てきます。そのため、式全体では「仮平均+仮平均からのズレの平均」となります。これが最後の式です。
仮平均の数字は好きな数字を選ぶことができます。ズレが小さくなるように仮平均を設定すれば、計算は楽になります。
おわりに
代表値としてよく使われる、平均値・平均を紹介しました。日常生活でも、「テストの平均点」などと使われているので親しみやすいと思います。また、仮平均は計算量が減ることが多いので、ぜひ覚えておきましょう。