共通テスト 数学I・数学A 2021年度追試 第2問 [2] 解説

【必答問題】

問題編

問題

(問題文の訂正内容は反映済みです)

 $\def\myBox#1{\bbox[3px, border:2px solid]{\ \bf{ #1 }\ }}\def\mybox#1{\bbox[4px, border:1px solid gray]{\ #1\ }}\def\dBox#1{\bbox[4px, border: 2px solid ]{\bbox[2px, border: 1px solid ]{\ \bf{ #1 }\ } }}\def\dbox#1{\bbox[4px, border: 1px solid ]{\bbox[2px, border: 1px solid ]{\ #1\ } }}$総務省が実施している国勢調査では都道府県ごとの総人口が調べられており、その内訳として日本人人口と外国人人口が公表されている。また、外務省では旅券(パスポート)を取得した人数を都道府県ごとに公表している。加えて、文部科学省では都道府県ごとの小学校に在籍する児童数を公表している。

 そこで、47都道府県の、人口1万人あたりの外国人人口(以下、外国人数)、人口1万人あたりの小学校児童数(以下、小学生数)、また、日本人1万人あたりの旅券を取得した人数(以下、旅券取得者数)を、それぞれ計算した。

(1) 図1は、2010年における47都道府県の、旅券取得者数(横軸)と小学生数(縦軸)の関係を黒丸で、旅券取得者数(横軸)と外国人数(縦軸)の関係を白丸で表した散布図である。

 次の(I)、(II)、(III)は図1の散布図に関する記述である。

 (I) 小学生数の四分位範囲は、外国人数の四分位範囲より大きい。
 (II) 旅券取得者数の範囲は、外国人数の範囲より大きい。
 (III) 旅券取得者数と小学生数の相関係数は、旅券取得者数と外国人数の相関係数より大きい。

(I)、(II)、(III)の正誤の組合せとして正しいものは $\dBox{ツ}$ である。

$\dbox{ツ}$ の解答群

 0: (I) 正 (II) 正 (III) 正
 1: (I) 正 (II) 正 (III) 誤
 2: (I) 正 (II) 誤 (III) 正
 3: (I) 正 (II) 誤 (III) 誤
 4: (I) 誤 (II) 正 (III) 正
 5: (I) 誤 (II) 正 (III) 誤
 6: (I) 誤 (II) 誤 (III) 正
 7: (I) 誤 (II) 誤 (III) 誤

(2) 一般に、度数分布表

階級値 $x_1$ $x_2$ $x_3$ $x_4$ $\cdots$ $x_k$
度数 $f_1$ $f_2$ $f_3$ $f_4$ $\cdots$ $f_k$ $n$

が与えられていて、各階級に含まれるデータの値がすべてその階級値に等しいと仮定すると、平均値 $\bar{x}$ は\[ \bar{x}=\dfrac{1}{n}(x_1f_1+x_2f_2+x_3f_3+x_4f_4+\cdots+x_kf_k) \]で求めることができる。さらに階級の幅が一定で、その値が $h$ のときは\[ x_2=x_1+h, x_3=x_1+2h, x_4=x_1+3h, \cdots, \ x_k=x_1+(k-1)h \]に注意すると\[ \bar{x}=\dBox{テ} \]と変形できる。

$\dbox{テ}$ については、最も適当なものを、次の 0 ~ 4 のうちから一つ選べ。

 0: $\dfrac{x_1}{n}(f_1+f_2+f_3+f_4+\cdots+f_k)$

 1: $\dfrac{h}{n}(f_1+2f_2+3f_3+4f_4+\cdots+kf_k)$

 2: $x_1+\dfrac{h}{n}(f_2+f_3+f_4+\cdots+f_k)$

 3: $x_1+\dfrac{h}{n}\{f_2+2f_3+3f_4+\cdots+(k-1)f_k\}$

 4: $\dfrac{1}{2}(f_1+f_k)x_1-\dfrac{1}{2}(f_1+kf_k)$


 図2は、2008年における47都道府県の旅券取得者数のヒストグラムである。なお、ヒストグラムの各階級の区間は、左側の数値を含み、右型の数値を含まない。

 図2のヒストグラムに関して、各階級に含まれるデータの値がすべてその階級値に等しいと仮定する。このとき平均値 $\bar{x}$ は小数第1位を四捨五入すると $\myBox{トナニ}$ である。

(3) 一般に、度数分布表

階級値 $x_1$ $x_2$ $\cdots$ $x_k$
度数 $f_1$ $f_2$ $\cdots$ $f_k$ $n$

が与えられていて、各階級に含まれるデータの値がすべてその階級値に等しいと仮定すると、分散 $s^2$ は\[
s^2=\dfrac{1}{n} \left\{\left(x_1-\bar{x}\right)^2 f_1 +\left(x_2-\bar{x}\right)^2 f_2 +\cdots +\left(x_k-\bar{x}\right)^ 2f_k\right\} \]で求めることができる。さらに $s^2$ は\[ s^2=\dfrac{1}{n} \left\{ \left(x_1^2f_1+x_2^2f_2+\cdots+x_k^2f_k\right) -2\bar{x}\times\dBox{ヌ} +\left(\bar{x}\right)^2\times\dBox{ネ} \right\} \]と変形できるので\[ s^2=\dfrac{1}{n}(x_1^2f_1+x_2^2f_2+\cdots x_k^2f_k)-\dBox{ノ}\quad\cdots① \]である。

$\dbox{ヌ}$ ~ $\dbox{ノ}$ の解答群(同じものを繰り返し選んでもよい。)

 0: $n$
 1: $n^2$
 2: $\bar{x}$
 3: $n\bar{x}$
 4: $2n\bar{x}$
 5: $n^2\bar{x}$
 6: $\left(\bar{x}\right)^2$
 7: $n\left(\bar{x}\right)^2$
 8: $2n\left(\bar{x}\right)^2$
 9: $3n\left(\bar{x}\right)^2$


 図3は、図2を再掲したヒストグラムである。

 図3のヒストグラムに関して、各階級に含まれるデータの値がすべてその階級値に等しいと仮定すると、平均値 $\bar{x}$ は(2)で求めた $\mybox{トナニ}$ であり。 $\mybox{トナニ}$の値と式①を用いると、分散 $s^2$ は $\dBox{ハ}$ である。

$\dbox{ハ}$ については、最も近いものを、次の 0 ~ 7 のうちから一つ選べ。

 0: 3900
 1: 4900
 2: 5900
 3: 6900
 4: 7900
 5: 8900
 6: 9900
 7: 10900

【広告】

考え方

(1)は、四分位範囲、範囲、相関係数が全部わかっていないと正解できません。定義がわかっていれば選ぶのは難しくないですが、分野の範囲全体をおさえていないといけません。

(2)と(3)は、抽象的な計算が苦手な人にはつらい問題です。どちらも、抽象的な計算をした後に、それを使って具体的な計算をしてみましょう、という流れなので、前半ができないと後半を解くのも難しくなります。

計算を頑張ればできるかもしれませんが、愚直に計算するのは、それはそれで厳しいです。特に(3)の後半はかなり大変になってしまいます。

なかなか点数のとりにくいセットだと思います。

1 2