🏠 Home / 数学I / データの分析 / データの代表値

【基本】データの平均値

【導入】データの代表値でも書きましたが、たくさんのデータがある場合、すべてのデータとにらめっこしていても、比較したり分析することは難しいです。そこで、データ全体の特徴を表すものとして「平均値」がよく使われます。ここでは、この平均値について見ていきます。

📘 目次

身長データ

男性5人組のグループが3つあったとしましょう。このグループの名前を A, B, C と呼ぶことにします。

グループA の各メンバーの身長が次のようになっていたとします。単位はcmです。\[ 166, 171, 175, 168, 172 \]みんな、だいたい170㎝くらいですね。

グループB は、次のようになっていたとします。\[ 170, 167, 167, 181, 185 \]180cm台が2人もいるので、グループA よりグループB のほうが身長が高い傾向がある、といえそうです。

グループC のメンバーの身長は、こうなっていたとします。\[ 170, 176, 176, 170, 182 \]180cm台がいるうえ、160cm台がいないので、グループC もグループAよりは身長が高いと言えるでしょう。しかし、B と C を比較するとどうでしょうか。B には 160cm台が2人いるけど、180cm台も2人いるので、比較しづらいです。

複数の数値をそのまま比較するのは、ちょっと難しそうです。

平均値

このように、複数のデータがあって、比較・分析したいときには、平均値(mean value)がよく使われます。平均値とは、「すべての数値を足して、数値の個数で割ったもの」です。平均値は、単に「平均」とも呼ばれます。

例えば、グループA の平均身長は次のようになります。\[ \frac{166+171+175+168+172}{5}=170.4 \]また、グループB とグループC の平均身長も同じように出すと、次のようになります。
\begin{eqnarray} & & \frac{170+167+167+181+185}{5} = 174 \\[5pt] & & \frac{170+176+176+170+182}{5} = 174.8 \\[5pt] \end{eqnarray}

このように、平均値は、数値の和を数値の個数で割って算出します。これは、「合計が変わらない状態で、すべてのデータが同じ数字だったらどうなるか」を表しているものであり、データのでこぼこを平(たい)らに均(なら)したもの、ということができます。

平均身長で考えると、AよりもB、BよりもCの方が身長が高い、と言えます。このように、平均値はデータ全体の特徴を表す数値(代表値)として使われます。

式でまとめると、次のようになります。

平均値
データの値が $x_1,x_2,\cdots,x_n$ のとき、この平均値 $\bar{x}$ は次の式で表される。\[ \bar{x}=\frac{x_1+x_2+\cdots+x_n}{n} \]

仮平均

平均値を算出するときに、すべての数値を足す計算が出てきます。数値が大きくなってくると、計算が大変です。そのような場合には、仮平均というものが使えます。

仮平均とは、仮で設定する平均のことです。この仮平均とのズレの平均を使うと計算が楽になります。といっても、文字の説明ではよくわからないので、実際に計算してみましょう。

上の例のグループA のメンバーの身長は次の通りでした。\[ 166, 171, 175, 168, 172 \]だいたい170㎝くらいです。そのため、とりあえず、170を仮平均とします。そして、この仮平均とのズレを考えます。すると、次のようになります。\[ -4,1,5,-2,2 \]この平均を計算したものと仮平均 170 とを足したものが、元の数値の平均になります。つまり、次のように計算できる、ということです。
\begin{eqnarray} 170+\frac{-4+1+5-2+2}{5}=170.4 \end{eqnarray}もちろん、上で出したときと同じ結果になっています。

この理屈は、次の式変形を見ればわかると思います。
\begin{eqnarray} & & \frac{166+171+175+168+172}{5} \\[5pt] &=& \frac{(170-4)+(170+1)+(170+5)+(170-2)+(170+2)}{5} \\[5pt] &=& \frac{170\times 5-4+1+5-2+2}{5} \\[5pt] &=& 170+\frac{-4+1+5-2+2}{5} \\[5pt] \end{eqnarray}一番初めの式が、定義通りの式です。それぞれの数値を「仮平均+ズレ」と分解すると、分子には「仮平均×数値の個数+ズレの和」が出てきます。そのため、式全体では「仮平均+仮平均からのズレの平均」となります。これが最後の式です。

仮平均の数字は好きな数字を選ぶことができます。ズレが小さくなるように仮平均を設定すれば、計算は楽になります。

おわりに

代表値としてよく使われる、平均値・平均を紹介しました。日常生活でも、「テストの平均点」などと使われているので親しみやすいと思います。また、仮平均は計算量が減ることが多いので、ぜひ覚えておきましょう。

関連するページ

YouTubeもやってます

チャンネル登録はコチラから (以下は、動画のサンプルです)
【むずかしい】防衛医科大学校2024年度数学第5問 藤田医科大学2024年度後期数学第1問8 岡山大学2024年度数学文理共通第1問 埼玉大学文系2024年度数学第3問 順天堂大学医学部2024年度数学第3問 東北大学2024年度後期数学文理共通第4問