【導入】データの相関
🕒 2016/11/15
🔄 2023/05/01
【導入】データの代表値や【導入】データの散らばりで見てきた内容は、データの違いを考えるときに使うことが多いです。例えば、「A組の平均点より、B組の平均点の方が高い」とか、「C国の年収よりD国の年収の方が散らばりが大きい」というような分析で使われることが多いです。
以降では、「データの違い」ではなく、「データの関係」に着目した指標を考えていきます。例えば、「身長が高いほど、体重が重い」とか「身長が高いほど、50m走のタイムが早い」などというように、2つのデータの関連性の表し方を見ていきます。
具体的には、2つのデータの関係を視覚的に理解するための散布図、散布図を数値化した相関表、そして、2つのデータの関連性を数値で表す相関係数などについて、以降のページで見ていくことにします。