なかけんの数学ノート

【基本】データの平均値

【導入】データの代表値でも書きましたが、たくさんのデータがある場合、すべてのデータとにらめっこしていても、比較したり分析することは難しいです。そこで、データ全体の特徴を表すものとして「平均値」がよく使われます。ここでは、この平均値について見ていきます。

[広告]

身長データ

次の数値は、嵐の5人のメンバーの身長です。2016年11月2日時点のウィキペディアを参照しています。単位はcmです。\[ 166, 171, 175, 168, 172 \]みんな、だいたい170㎝くらいですね。

一方、TOKIOのメンバーの身長は次のようになっています。\[ 170, 167, 167, 181, 185 \]180cm台が2人もいるので、嵐よりTOKIOの方が身長が高そうですね。

また、SMAPのメンバーの身長はこうなっています。\[ 170, 176, 176, 170, 182 \]180cm台がいるうえ、160cm台がいないので、嵐よりは身長が高いと言えるでしょう。しかし、TOKIOとSMAPで比較するとどうでしょうか。TOKIOには160cm台が2人いるけど、180cm台も2人いるので、嵐のときより比較しづらいです。

複数の数値をそのまま比較するのは、ちょっと難しそうです。

平均値

このように、複数のデータがあって、比較・分析したいときには、平均値(mean value)がよく使われます。平均値とは、「すべての数値を足して、数値の個数で割ったもの」です。平均値は、単に「平均」とも呼ばれます。

例えば、嵐の平均身長は次のようになります。\[ \frac{166+171+175+168+172}{5}=170.4 \]また、TOKIOとSMAPの平均身長も同じように出すと、次のようになります。
\begin{eqnarray}
& & \frac{170+167+167+181+185}{5} = 174 \\[5pt]
& & \frac{170+176+176+170+182}{5} = 174.8 \\[5pt]
\end{eqnarray}

このように、平均値は、数値の和を数値の個数で割って算出します。これは、「合計が変わらない状態で、すべてのデータが同じ数字だったらどうなるか」を表しているものであり、データのでこぼこを平(たい)らに均(なら)したもの、ということができます。

平均身長で考えると、嵐よりもTOKIO、TOKIOよりもSMAPの方が身長が高い、と言えます。このように、平均値はデータ全体の特徴を表す数値(代表値)として使われます。

式でまとめると、次のようになります。

平均値
データの値が $x_1,x_2,\cdots,x_n$ のとき、この平均値 $\bar{x}$ は次の式で表される。\[ \bar{x}=\frac{x_1+x_2+\cdots+x_n}{n} \]
[広告]

仮平均

平均値を算出するときに、すべての数値を足す計算が出てきます。数値が大きくなってくると、計算が大変です。そのような場合には、仮平均というものが使えます。

仮平均とは、仮で設定する平均のことです。この仮平均とのズレの平均を使うと計算が楽になります。といっても、文字の説明ではよくわからないので、実際に計算してみましょう。

嵐のメンバーの身長は次の通りでした。\[ 166, 171, 175, 168, 172 \]だいたい170㎝くらいです。そのため、とりあえず、170を仮平均とします。そして、この仮平均とのズレを考えます。すると、次のようになります。\[ -4,1,5,-2,2 \]この平均と仮平均とを足したものが、元の数値の平均になります。つまり、次のように計算できる、ということです。
\begin{eqnarray}
170+\frac{-4+1+5-2+2}{5}=170.4
\end{eqnarray}もちろん、上で出したときと同じ結果になっています。

この理屈は、次の式変形を見ればわかると思います。
\begin{eqnarray}
& &
\frac{166+171+175+168+172}{5} \\[5pt]
&=&
\frac{(170-4)+(170+1)+(170+5)+(170-2)+(170+2)}{5} \\[5pt]
&=&
\frac{170\times 5-4+1+5-2+2}{5} \\[5pt]
&=&
170+\frac{-4+1+5-2+2}{5} \\[5pt]
\end{eqnarray}一番初めの式が、定義通りの式です。それぞれの数値を「仮平均+ズレ」と分解すると、分子には「仮平均×数値の個数+ズレの和」が出てきます。そのため、式全体では「仮平均+仮平均からのズレの平均」となります。これが最後の式です。

仮平均の数字は何でも問題ありません。ズレが小さくなるように仮平均を設定すれば、計算は楽になります。

おわりに

代表値としてよく使われる、平均値・平均を紹介しました。日常生活でも、「テストの平均点」などと使われているので親しみやすいと思います。また、仮平均は計算量が減ることが多いので、ぜひ覚えておきましょう。

[広告]
対象者: 数学I
分野: データの分析
トピック: データの分析
レベル: 基本
キーワード: 平均
更新日:2016/12/08