センター試験 数学I・数学A 2020年度 第2問 [2] 解説
【必答問題】
(図は省略しています。図は別のサイトなどでご覧ください。)
問題編
問題
(1) 次の $\mybox{コ}$, $\mybox{サ}$ に当てはまるものを下の 0 ~ 5 のうちから一つずつ選べ。ただし、解答の順序は問わない。
99個の観測値からなるデータがある。四分位数について述べた記述で、どのようなデータでも成り立つものは $\myBox{コ}$ と $\myBox{サ}$ である。
0: 平均値は第1四分位数と第3四分位数の間にある。
1: 四分位範囲は標準偏差より大きい。
2: 中央値より小さい観測値の個数は49個である。
3: 最大値に等しい観測値を1個削除しても第1四分位数は変わらない。
4: 第1四分位数より小さい観測値と、第3四分位数より大きい観測値をすべて削除すると、残りの観測値の個数は51個である。
5: 第1四分位数より小さい観測値と、第3四分位数より大きい観測値とをすべて削除すると、残りの観測地からなるデータの範囲はもとのデータの四分位範囲に等しい。
(2) 図1は、平成27年の男の市区町村別平均寿命のデータを47の都道府県 $\mathrm{P}_1$, $\mathrm{P}_2$, $\cdots$, $\mathrm{P}_{47}$ ごとに箱ひげ図にして、並べたものである。
次の(I), (II), (III)は図1に関する記述である。
(I) 四分位範囲はどの都道府県においても1以下である。
(II) 箱ひげ図は中央値が小さい値から大きい値の順に上から下へ並んでいる。
(III) $\mathrm{P}_1$ のデータのどの値と $\mathrm{P}_{47}$ のデータのどの値とを比較しても1.5以上の差がある。
次の $\mybox{シ}$ に当てはまるものを、下の 0 ~ 7 のうちから一つ選べ。
(I), (II), (III)の正誤の組み合わせとして正しいものは $\myBox{シ}$ である。
(I) (II) (III) 0 正 正 正 1 正 正 誤 2 正 誤 正 3 誤 正 正 4 正 誤 誤 5 誤 正 誤 6 誤 誤 正 7 誤 誤 誤
(3) ある県は20の市区町村からなる。図2はその件の男の市区町村別平均寿命のヒストグラムである。なお、ヒストグラムの各階級の区間は、左側の数値を含み、右側の数値を含まない。
次の $\mybox{ス}$ に当てはまるものを、下の 0 ~ 7 のうちから一つ選べ。
図2のヒストグラムに対応する箱ひげ図は $\myBox{ス}$ である。
(4) 図3は、平成27年の男の都道府県別平均寿命と女の都道府県別平均寿命の散布図である。2個の点が重なって区別できないところは黒丸にしている。図には補助的に切片が5.5から7.5まで0.5刻みで傾き1の直線を5本付加している。
次の $\mybox{セ}$ に当てはまるものを、下の 0 ~ 3 のうちから一つ選べ。
都道府県ごとに男女の平均寿命の差をとったデータに対するヒストグラムは $\myBox{セ}$ である。なお、ヒストグラムの各階級の区間は、左側の数値を含み、右側の数値を含まない。
考え方
(1)は、多くのケースで成り立つものが多いのですが、「どのようなデータでも」成り立つものを考えなくてはいけません。現実的にはありえなさそうな、極端な例を考えて除外していくしかありません。
(2)は、一つ一つ吟味していきます。(III)は、どこを比較すればいいかをまず考えましょう。
(3)は、明らかにダメだとわかるものを除外してから、残った選択肢を比較してみましょう。そこで違う部分を確認する、という順番でやると、特定しやすいでしょう。
(4)は、補助的に付加された直線が何を意味するか考えましょう。どれか1つの点を取り出して、それがヒストグラムのどこに入るか、などを考えるとわかりやすいかもしれません。
【必答問題】
(図は省略しています。図は別のサイトなどでご覧ください。)
解答編
問題
(1) 次の $\mybox{コ}$, $\mybox{サ}$ に当てはまるものを下の 0 ~ 5 のうちから一つずつ選べ。ただし、解答の順序は問わない。
99個の観測値からなるデータがある。四分位数について述べた記述で、どのようなデータでも成り立つものは $\myBox{コ}$ と $\myBox{サ}$ である。
0: 平均値は第1四分位数と第3四分位数の間にある。
1: 四分位範囲は標準偏差より大きい。
2: 中央値より小さい観測値の個数は49個である。
3: 最大値に等しい観測値を1個削除しても第1四分位数は変わらない。
4: 第1四分位数より小さい観測値と、第3四分位数より大きい観測値をすべて削除すると、残りの観測値の個数は51個である。
5: 第1四分位数より小さい観測値と、第3四分位数より大きい観測値とをすべて削除すると、残りの観測地からなるデータの範囲はもとのデータの四分位範囲に等しい。
解説
0と1は、四分位数と平均値や標準偏差との比較を行っています。平均値は、データに極端な値が含まれている場合に影響を受けますが、四分位数や中央値は極端な値が含まれていてもそれほど受けません。そのため、例外的な状況を考えるために、極端な値が含まれている例を用いて考えていくのがいいです。
ここでは、98個の値が0で、残り1個の値が99という例を考えてみます。第1四分位数と第3四分位数はもちろん0です。平均値は1なので、選択肢0は成り立ちません。また、四分位範囲(第3四分位数と第1四分位数との差)は0ですが、標準偏差は正の値なので、選択肢1も成り立ちません。
同じケースを考えると、中央値は0なので、中央値より小さい値はありません。よって、選択肢2も成り立ちません。第1四分位数より小さい値と第3四分位数より大きい値をすべて削除すると、98個の値が残るので、選択肢4も間違いです。
答えはこれで確定しますが、残りの選択肢も見ておきます。
まずは、選択肢3です。99個の値があるとき、下から49個目が中央値となります。第1四分位数は、下側48個の値の使って、下から24個目と25個目の平均となります。次に、最大値に等しい値を1個削除した場合を考えます。このとき、98個の値があり、中央値は下から48個目と49個目の平均で、第1四分位数は、下から24個目と25個目の平均となります。削除されたのは最大値であり、下側の値は変わっていないので、第1四分位数の値は変わりません。どのようなデータでも成り立ちます。
選択肢5は、四分位範囲が「第3四分位数から第1四分位数を引いたもの」であり、データの範囲が「最大値から最小値を引いたもの」であることを考えると、どのようなデータでも成り立つことがわかります。
以上から、3と5だとわかります。
解答
コサ:35
解答編 つづき
問題
(2) 図1は、平成27年の男の市区町村別平均寿命のデータを47の都道府県 $\mathrm{P}_1$, $\mathrm{P}_2$, $\cdots$, $\mathrm{P}_{47}$ ごとに箱ひげ図にして、並べたものである。
次の(I), (II), (III)は図1に関する記述である。
(I) 四分位範囲はどの都道府県においても1以下である。
(II) 箱ひげ図は中央値が小さい値から大きい値の順に上から下へ並んでいる。
(III) $\mathrm{P}_1$ のデータのどの値と $\mathrm{P}_{47}$ のデータのどの値とを比較しても1.5以上の差がある。
次の $\mybox{シ}$ に当てはまるものを、下の 0 ~ 7 のうちから一つ選べ。
(I), (II), (III)の正誤の組み合わせとして正しいものは $\myBox{シ}$ である。
(I) (II) (III) 0 正 正 正 1 正 正 誤 2 正 誤 正 3 誤 正 正 4 正 誤 誤 5 誤 正 誤 6 誤 誤 正 7 誤 誤 誤
解説
一つ一つ見ていきましょう。
(I) の四分位範囲とは、第3四分位数から第1四分位数を引いたものです。箱ひげ図でいうと、箱の長さです。これが1以下になっているかどうかを見てみると、そうはなっていません。たとえば、 $\mathrm{P}_{10}$ を見ると、1.5程度あります。なので、この記述は誤りです。
(II) の中央値とは、箱の中央にある太線で表されています。上から順に見ていくと、 $\mathrm{P}_{10}$, $\mathrm{P}_{11}$ を見比べれば、下のほうが中央値が小さくなっていることがわかります。そのため、この記述も誤りであることがわかります。
(III) を考えるには、 $\mathrm{P}_1$ の最大値と $\mathrm{P}_{47}$ の最小値を比較すればいいですね。前者は、だいたい79.5程度で、後者は81.2程度です。このことから、1.5以上の差があることがわかります。よって、正しい記述です。
こうして、誤誤正の順に並んでいる選択肢6が正しいことがわかります。
解答
シ:6
解答編 つづき
問題
(3) ある県は20の市区町村からなる。図2はその件の男の市区町村別平均寿命のヒストグラムである。なお、ヒストグラムの各階級の区間は、左側の数値を含み、右側の数値を含まない。
次の $\mybox{ス}$ に当てはまるものを、下の 0 ~ 7 のうちから一つ選べ。
図2のヒストグラムに対応する箱ひげ図は $\myBox{ス}$ である。
解説
まず、ヒストグラムを見ると、79.5未満のデータがないことがわかるので、79.5以下の部分までひげがのびている1と2の選択肢は除外されます。また、79.5以上80.0未満のデータがあることから、80.0未満のデータがない6と7も除外されます。81.5以上82.0未満のデータがあるので、このデータがない0,1,2,3の選択肢は除外されます。
残るのは、4と5です。第1四分位数が違うので、これをヒストグラムから読み取りましょう。20個の値があるので、第1四分位数は、下から5番目と6番目の平均です。どちらの値も、80.0以上80.5未満なので、第1四分位数もこの範囲です。箱の左側がこの範囲に入っているのは4なので、これが正しいことがわかります。
解答
ス:4
解答編 つづき
問題
(4) 図3は、平成27年の男の都道府県別平均寿命と女の都道府県別平均寿命の散布図である。2個の点が重なって区別できないところは黒丸にしている。図には補助的に切片が5.5から7.5まで0.5刻みで傾き1の直線を5本付加している。
次の $\mybox{セ}$ に当てはまるものを、下の 0 ~ 3 のうちから一つ選べ。
都道府県ごとに男女の平均寿命の差をとったデータに対するヒストグラムは $\myBox{セ}$ である。なお、ヒストグラムの各階級の区間は、左側の数値を含み、右側の数値を含まない。
解説
一番右にある直線は、男80.0女85.5などの点を通っていることから、切片が5.5であることがわかります。その1つ左にある直線は、男80.0女86.0などの点を通っていることから、切片が6.0であることがわかります。なので、この2つの直線の間にある点は、ヒストグラムでは、5.5以上6.0未満のところに対応します。点の数は9個なので、ヒストグラムを見れば、3だけが正しいことがわかります。
念のため、一番左にある直線とその1つ右にある直線も考えてみます。これは、7.0以上7.5未満の範囲に対応し、点の数が3個です。選択肢3のヒストグラムを見ると、7.0以上7.5未満の値の数は、2+1=3個なので、確かにあっています。他の選択肢は、この範囲の値の数も異なっています。
以上から、3が正しいことがわかります。
解答
セ:3