【導入】データの代表値
🕒 2016/11/02
🔄 2023/05/01
クラス対抗のボウリング大会があったとしましょう。ゲームが終わった後、みんなのスコアを見てどのクラスが一番ボウリングがうまかったかを考えたいのですが、どうすればいいでしょうか。
みんなのスコアをただ並べてみても、たぶんよくわからないと思うんですよね。例えば、Aクラスが26人でBクラスが24人だったとして、合計50個の数字をただ眺めていただけでは、どっちがよかったのかよくわかりません。
「平均値」を使えばいいんじゃないか、と思った人もいるでしょう。実際、データ全体を代表する数字があったほうが比較したり、分析したりしやすいので、日常生活でも平均値はよく使われますよね。このように、ある集団のデータ全体の特徴を表す数値を、データの代表値(representative value)といいます。よく使われる代表値として、平均値がありますが、他には、中央値、最頻値があります。
今後、これらの代表値について、計算の仕方や特徴について見ていきます。