センター試験 数学I・数学A 2019年度追試 第2問 [2] 解説

【必答問題】

問題編

問題

 $\def\myBox#1{\bbox[3px, border:2px solid]{\ \bf{ #1 }\ }}\def\mybox#1{\bbox[4px, border:1px solid gray]{\ #1\ }}$疫病Aに関するいくつかのデータについて考える。

(1) 図1は、47都道府県の40歳以上69歳以下を対象とした「疫病Aの検診の受診率」のヒストグラムである。なお、ヒストグラムの各階級の区間は、左側の数値を含み、右側の数値を含まない。

 次の $\mybox{サ}$ に当てはまるものを、下の 0 ~ 5 のうちから一つ選べ。

 疫病Aの検診の受診率の中央値として図1のヒストグラムと矛盾しないものは $\myBox{サ}$ である。

 0: 16.0
 1: 24.0
 2: 35.6
 3: 43.4
 4: 44.7
 5: 46.0


(2) 疫病Aの「調整済み死亡数」が毎年、都道府県ごとに算出されている。なお、この調整済み死亡数は年齢構成などを考慮した10万人あたりの死亡数であり、例えば5.3のように小数になることもある。

 図2は、各都道府県の疫病Aによる調整済み死亡数 $Y$ を、年ごとに箱ひげ図にして並べたものである。

 図2に関する次の記述(I)、(II)、(III)について正誤を判定する。

(I) 1996年から2009年までの間における各年の $Y$ の中央値は、前年より小さくなる年もあるが、この間は全体として増加する傾向にある。

(II) $Y$ の最大値が最も大きい年と $Y$ の最大値は最も小さい年とを比べた場合、これら二つの年における最大値の差は2以下である。

(III) 1996年と2014年で、 $Y$ が9以下の都道府県数を比べると、2014年は1996年の $\dfrac{1}{2}$ 以下である。

 次の $\mybox{シ}$ に当てはまるものを、次の 0 ~ 7 のうちから一つ選べ。

 (I)、(II)、(III)の記述の正誤について正しい組合せは $\myBox{シ}$ である。

0 1 2 3
(I)
(II)
(III)
4 5 6 7
(I)
(II)
(III)


(3) 図3は、ある年の47都道府県の喫煙率 $X$ と同じ年の調整済み死亡数 $Y$ との関係を表している。

 次の $\mybox{ス}$ に当てはまるものを、下の⓪ ~ ③ のうちから一つ選べ。

 $Y$ のヒストグラムとして最も適切なものは $\myBox{ス}$ である。


(4) 表1は、図3に表されている喫煙率 $X$ と調整済み死亡数 $Y$ の平均値、分散および共分散を計算したものである。ただし、共分散とは「 $X$ の偏差と $Y$ の偏差の積の平均値」である。なお、表1の数値は四捨五入していない正確な値とする。

表1 平均値、分散、共分散
平均値 分 散 共分散
$X$ 9.6 4.8 1.75
$Y$ 10.2 2.4

 喫煙率 $X$ のとる値を $x$ 、調整済み死亡数 $Y$ のとる値を $y$ とする。次の $x$ と $y$ の関係式(*) はデータの傾向を知るためによく使われる式である。\[ y-\bar{y}=\frac{s_{XY}}{s_{X}^2}(x-\bar{x}) \quad \cdots (*) \]ここで、 $\bar{x}, \bar{y}$ はそれぞれ $X, Y$ の平均値、 $s_{X}^2$ は $X$ の分散、 $s_{XY}$ は $X$ と $Y$ の共分散を表す。

 次の $\mybox{セ}$, $\mybox{ソ}$, $\mybox{タ}$ それぞれに当てはまる数値として最も近いものを下の0 ~ 9のうちから一つずつ選べ。

 図3の散布図に対する関係式(*)は $y=\myBox{セ}x+\myBox{ソ}$ であり、図4はこの関係式を図3に当てはめたものである。
 喫煙率が3%から20%の間では同じ傾向があると考えたとき、上で求めた式を用いると、喫煙率が4%であれば調整済み死亡数は $\myBox{タ}$ である。

 0: 0.36
 1: 0.53
 2: 0.80
 3: 1.26
 4: 2.77

 5: 5.13
 6: 6.74
 7: 8.18
 8: 8.87
 9: 9.95

【広告】

考え方

(1)は、中央値の定義がわかっていれば解けるでしょう。(2)は、箱ひげ図の見方がわかっていれば解けます。どれもあまりひねったものではないです。

(3)は、散布図とヒストグラムの関係を考えますが、これもヒストグラムをどう作るかがわかっていれば難しくはありません。

データの分析は、最後に抽象的で難しい問題が出題されることが多いですが、(4)は、例年ほどは難しくはありません。見慣れない式が出てきますが、各変数が何を表しているか説明されているので、言われた通りに計算するだけです。