問題文中の画像は、大学入試センターのサイトから取得しています。
【必答問題】
問題編
問題
$\def\myBox#1{\bbox[3px, border:2px solid]{\ \bf{ #1 }\ }}\def\mybox#1{\bbox[4px, border:1px solid gray]{\ #1\ }}$高等学校(中等教育学校を含む)の卒業者のうち、大学または短期大学に進学した者の割合(以下、進学率)と、就職した者の割合(以下、就職率)が47都道府県別に公表されている。
(1) 図1は2016年度における都道府県別の進学率のヒストグラムであり、図2は2016年度における都道府県別の就職率の箱ひげ図である。なお、ヒストグラムの各階級の区間は、左側の数値を含み、右側の数値を含まない。
次の $\mybox{サ}$ に当てはまるものを、下の 0 ~ 3 のうちから一つ選べ。
2016年度における都道府県別の進学率(横軸)と就職率(縦軸)の散布図は $\myBox{サ}$ である。
(2) 図3は、1973年度から2018年度まで、5年ごとの10個の年度(それぞれを時点という)における都道府県別の進学率(上側)と就職率(下側)を箱ひげ図で表したものである。ただし、設問の都合で1993年度における箱ひげ図は表示していない。
次の $\mybox{シ}$ に当てはまるものを、下の 0 ~ 4 のうちから一つ選べ。図3から読み取れることとして、正しい記述は $\myBox{シ}$ である。
0: 1993年度を除く9時点すべてにおいて、進学率の左側のひげの長さと右側のひげの長さを比較すると、右側のほうが長い。
1: 2003年度、2008年度、2013年度、2018年度の4時点すべてにおいて、就職率の左側のひげの長さと右側のひげの長さを比較すると、左側のほうが長い。
2: 2003年度、2008年度、2013年度、2018年度の4時点すべてにおいて、就職率の四分位範囲は、それぞれの直前の時点より減少している。
3: 1993年度を除く時点ごとに進学率と就職率の四分位範囲を比較すると、つねに就職率の方が大きい。
4: 就職率について、1993年度を除くどの時点においても最大値は最小値の2倍以上である。
(3) 図4は、1993年度における都道府県別の進学率(横軸)と就職率(縦軸)の散布図である。
次の $\mybox{ス}$, $\mybox{セ}$ に当てはまる最も適切なものを、それぞれの解答群から一つずつ選べ。
1993年度における就職率の $\myBox{ス}$ は 34.8% である。
また、1993年度における進学率の $\mybox{ス}$ は $\myBox{セ}$ %である。$\myBox{ス}$ の解答群
0: 最小値
1: 中央値
2: 最大値
3: 第1四分位数
4: 第3四分位数
5: 四分位範囲$\myBox{セ}$ の解答群
0: $10.0$
1: $20.1$
2: $29.7$
3: $34.5$
4: $39.7$
5: $44.4$
(4) 図4に記した1993年度における都道府県別の進学率と就職率の相関係数を計算したところ、 $-0.41$ であった。就職率が 45% を超えている5都道府県を黒丸で示したのが図5である。
次の $\mybox{ソ}$ に当てはまるものを、下の 0 ~ 5 のうちから一つ選べ。就職率が 45% を超えている5都道府県を除外したときの相関係数を $r$ とおくと、 $\myBox{ソ}$ である。
0: $r\lt -0.41$
1: $r=-0.41$
2: $-0.41 \lt r \lt 0$
3: $r=0$
4: $0\lt r\lt 0.41$
5: $r\geqq 0.41$
(5) 1993年度における進学率 $X$, 就職率 $Y$ について、 $X$ の平均値の2乗の値を求めたい。 $X^2$ の平均値、 $Y$ の平均値と標準偏差、 $X$ と $Y$ の共分散と相関係数は表1のとおりであった。ただし、 $X$ と $Y$ の共分散とは、 $X$ の偏差と $Y$ の偏差の積の平均値である。なお、表1の数値は正確な値であり、四捨五入されていないものとする。
表1 2乗の平均値、平均値、標準偏差、共分散、および相関係数
$X^2$ の
平均値$1223$ $Y$ の
平均値$34$ $Y$ の
標準偏差$7.6$ $X$ と $Y$ の
共分散$-20$ $X$ と $Y$ の
相関係数$-0.41$ また、必要であれば以下の事実を用いてもよい。
$n$ を自然数とする。実数値のデータ $u_1, u_2,\cdots,u_n$ に対して、平均値を $\bar{u}$ 、分散を $s^2$ とおくと\[ s^2=\frac{u_1^2+u_2^2+\cdots+u_n^2}{n} -(\bar{u})^2 \]が成り立つ。
$X$ の標準偏差は、小数第2位を四捨五入すると、 $\myBox{タ}.\myBox{チ}$ である。
次の $\mybox{ツ}$ に当てはまる数値として最も近いものを、下の 0 ~ 7 のうちから一つ選べ。
$X$ の平均値の2乗の値は $\myBox{ツ}$ である。
0: $1122$
1: $1156$
2: $1182$
3: $1223$
4: $1260$
5: $1296$
6: $1332$
7: $1369$
考え方
(1)は、矛盾するものを消去していきましょう。(5)はヒントが書いてあるので、それを使えば難しくはないでしょう。計算は少し面倒ですが。