センター試験 数学I・数学A 2019年度 第2問 [2] 解説
【必答問題】
問題編
問題
全国各地の気象台が観測した「ソメイヨシノ(桜の種類)の開花日」や、「モンシロチョウの初見日(初めて観測した日)」、「ツバメの初見日」などの日付を気象庁が発表している。気象庁発表の日付は普通の月日形式であるが、この問題では該当する年の1月1日を「1」とし、12月31日を「365」(うるう年の場合は「366」)とする「年間通し日」に変更している。例えば、2月3日は、1月31日の「31」に2月3日の3を加えた「34」となる。
(1) 図1は全国48地点で観測しているソメイヨシノの2012年から2017年までの6年間の開花日を、年ごとに箱ひげ図にして並べたものである。
図2はソメイヨシノの開花日の年ごとのヒストグラムである。ただし、順番は年の順に並んでいるとは限らない。なお、ヒストグラムの各階級の区間は、左側の数値を含み、右側の数値を含まない。
次の $\mybox{ソ}$, $\mybox{タ}$ に当てはまるものを、図2の 0 ~ 5のうちから一つずつ選べ。
・2013年のヒストグラムは $\mybox{ソ}$ である。
・2017年のヒストグラムは $\mybox{タ}$ である。(出典:図1、図2は気象庁「生物季節観測データ」Webページにより作成)
(2) 図3 と図4 は、モンシロチョウとツバメの両方を観測している 41地点における、2017年の初見日の箱ひげ図と散布図である。散布図の点には重なった点が2点ある。なお、散布図には原点を通り傾き 1 の直線(実線)、切片が -15 および 15 で傾きが 1 の2本の直線(破線)を付加している。
次の $\mybox{チ}$, $\mybox{ツ}$ に当てはまるものを、下の 0 ~ 7 のうちから一つずつ選べ。ただし、解答の順序は問わない。
図3、図4 から読み取れることとして正しくないものは、 $\myBox{チ}$, $\myBox{ツ}$ である。
0: モンシロチョウの初見日の最小値はツバメの初見日の最小値と同じである。
1: モンシロチョウの初見日の最大値はツバメの初見日の最大値より大きい。2: モンシロチョウの初見日の中央値はツバメの初見日の中央値より大きい。
3: モンシロチョウの初見日の四分位範囲はツバメの初見日の四分位範囲の3倍より小さい。4: モンシロチョウの初見日の四分位範囲は15日以下である。
5: ツバメの初見日の四分位範囲は15日以下である。6: モンシロチョウとツバメの初見日が同じ所が少なくとも4地点ある。
7: 同一地点でのモンシロチョウの初見日とツバメの初見日の差は15日以下である。(出典:図3、図4は気象庁「生物季節観測データ」Webページにより作成)
(3) 一般に $n$ 個の数値 $x_1,x_2,\cdots,x_n$ からなるデータ $X$ の平均値を $\bar{x}$ 、分散を $s^2$ 、標準偏差を $s$ とする。各 $x_j$ に対して\[ x_i'=\frac{x_i-\bar{x} }{s}\ (i=1,2,\cdots ,n) \]と変換した $x_1',x_2',\cdots,x_n'$ をデータ $X'$ とする。ただし、 $x\geqq 2$, $s\gt 0$ とする。
次の $\mybox{テ}$, $\mybox{ト}$, $\mybox{ナ}$ に当てはまるものを、下の 0 ~ 8 のうちから一つずつ選べ。ただし、同じものを繰り返し選んでもよい。
・ $X$ の偏差 $x_1-\bar{x}$, $x_2-\bar{x}$, $\cdots$, $x_n-\bar{x}$ の平均値は $\myBox{テ}$ である。
・ $X'$ の平均値は $\myBox{ト}$ である。
・ $X'$ の標準偏差は $\myBox{ナ}$ である。0: $0$
1: $1$
2: $-1$3: $\bar{x}$
4: $s$5: $\dfrac{1}{s}$
6: $s^2$
7: $\dfrac{1}{s^2}$
8: $\dfrac{\bar{x} }{s}$
図4で示されたモンシロチョウの初見日のデータ $M$ とツバメの初見日のデータ $T$ について上の変換を行ったデータをそれぞれ $M'$, $T'$ とする。
次の $\myBox{ニ}$ に当てはまるものを、図5の 0 ~ 3 のうちから一つ選べ。
変換後のモンシロチョウの初見日のデータ $M'$ と変換後のツバメの初見日のデータ $T'$ の散布図は、 $M'$ と $T'$ の標準偏差の値を考慮すると $\myBox{ニ}$ である。
考え方
(1)は、最大値などの特徴的な値をもとに選んでいきましょう。
(2)は、四分位範囲までは箱ひげ図を、残りは散布図で考えましょう。実線・破線と値の関係を考えましょう。
(3)は、値の変換で、平均値や標準偏差がどう変わるか、式の定義から考えてみましょう。最後の散布図は、標準偏差の値から、ありえない散布図を消して答えを出します。
毎年、最後の問題が難しいですが、変換によって標準偏差などがどう変わるかはよく聞かれる内容です。
【必答問題】
解答編
問題
全国各地の気象台が観測した「ソメイヨシノ(桜の種類)の開花日」や、「モンシロチョウの初見日(初めて観測した日)」、「ツバメの初見日」などの日付を気象庁が発表している。気象庁発表の日付は普通の月日形式であるが、この問題では該当する年の1月1日を「1」とし、12月31日を「365」(うるう年の場合は「366」)とする「年間通し日」に変更している。例えば、2月3日は、1月31日の「31」に2月3日の3を加えた「34」となる。
(1) 図1は全国48地点で観測しているソメイヨシノの2012年から2017年までの6年間の開花日を、年ごとに箱ひげ図にして並べたものである。
図2はソメイヨシノの開花日の年ごとのヒストグラムである。ただし、順番は年の順に並んでいるとは限らない。なお、ヒストグラムの各階級の区間は、左側の数値を含み、右側の数値を含まない。
次の $\mybox{ソ}$, $\mybox{タ}$ に当てはまるものを、図2の 0 ~ 5のうちから一つずつ選べ。
・2013年のヒストグラムは $\mybox{ソ}$ である。
・2017年のヒストグラムは $\mybox{タ}$ である。(出典:図1、図2は気象庁「生物季節観測データ」Webページにより作成)
解説
2013年の箱ひげ図を見ると、135以上の値があるので、この値に着目してヒストグラムを選びましょう。135以上の値があるのは3だけなので、これが答えです。
最大値について着目すると、2012年には130の値があり、対応するヒストグラムを探すと1であることがわかります。2017年の箱ひげ図を見ると、120より大きな値があります。残っているヒストグラムのうち、120以上の値があるのは4だけなので、2017年に対応するヒストグラムは4であることがわかります。
解答
ソ:3
タ:4
解答編 つづき
問題
(2) 図3 と図4 は、モンシロチョウとツバメの両方を観測している 41地点における、2017年の初見日の箱ひげ図と散布図である。散布図の点には重なった点が2点ある。なお、散布図には原点を通り傾き 1 の直線(実線)、切片が -15 および 15 で傾きが 1 の2本の直線(破線)を付加している。
次の $\mybox{チ}$, $\mybox{ツ}$ に当てはまるものを、下の 0 ~ 7 のうちから一つずつ選べ。ただし、解答の順序は問わない。
図3、図4 から読み取れることとして正しくないものは、 $\myBox{チ}$, $\myBox{ツ}$ である。
0: モンシロチョウの初見日の最小値はツバメの初見日の最小値と同じである。
1: モンシロチョウの初見日の最大値はツバメの初見日の最大値より大きい。2: モンシロチョウの初見日の中央値はツバメの初見日の中央値より大きい。
3: モンシロチョウの初見日の四分位範囲はツバメの初見日の四分位範囲の3倍より小さい。4: モンシロチョウの初見日の四分位範囲は15日以下である。
5: ツバメの初見日の四分位範囲は15日以下である。6: モンシロチョウとツバメの初見日が同じ所が少なくとも4地点ある。
7: 同一地点でのモンシロチョウの初見日とツバメの初見日の差は15日以下である。(出典:図3、図4は気象庁「生物季節観測データ」Webページにより作成)
解説
順番に見ていきましょう。
0の初見日の最小値は、箱ひげ図の左端を見ればいいですね。同じ値です。正しいですね。
1の初見日の最大値は、箱ひげ図の右端を見れない位ですね。モンシロチョウのほうが大きいので正しいです。
2の中央値は、箱ひげ図の中央の線の位置を見ればいいです。モンシロチョウのほうが大きいので正しいです。
3と4と5の四分位範囲は、箱ひげ図の箱の長さです。モンシロチョウは、85弱から105弱までの20くらいです。一方、ツバメは90弱から95強までの、10弱ですね。ツバメの最小値と70都の目盛りの幅を見ると、四分位範囲の左側が90と1目盛りの差ということはなく、2目盛りだとわかります。四分位範囲の右端も95より2目盛り右側なので、ツバメの四分位範囲は9です。
以上から、3にある「モンシロチョウの初見日の四分位範囲はツバメの初見日の四分位範囲の3倍より小さい」は、正しいですね。4の、モンシロチョウの初見日の四分位範囲は、20日くらいなので、15日以下ということはありません。これは正しくありません。5のツバメの初見日の四分位範囲は、9日なので、15日以下です。
6は、初見日が同じであることを何で判断すればいいかを考えます。散布図の、傾き1の直線上にあるということは、モンシロチョウとツバメの初見日が一致していることを表しているので、この直線上に点が何個あるかを数えればいいことがわかります。ダブっているかもしれませんが、4点あるので、初見日が同じ地点が4地点はあることがわかります。正しいですね。
7は、例えば、モンシロチョウが70弱でツバメが90弱の点を見てみましょう。この点は、傾きが1で切片が15の直線より上にあります。上側の破線よりも上にあるということは、差が15よりも大きいということなので、初見日の差が15日よりも大きい地点があることになります。なので、正しくありません。
以上から、4と7が正しくないことがわかります。
解答
チツ:4・7
解答編 つづき
問題
(3) 一般に $n$ 個の数値 $x_1,x_2,\cdots,x_n$ からなるデータ $X$ の平均値を $\bar{x}$ 、分散を $s^2$ 、標準偏差を $s$ とする。各 $x_j$ に対して\[ x_i'=\frac{x_i-\bar{x} }{s}\ (i=1,2,\cdots ,n) \]と変換した $x_1',x_2',\cdots,x_n'$ をデータ $X'$ とする。ただし、 $x\geqq 2$, $s\gt 0$ とする。
次の $\mybox{テ}$, $\mybox{ト}$, $\mybox{ナ}$ に当てはまるものを、下の 0 ~ 8 のうちから一つずつ選べ。ただし、同じものを繰り返し選んでもよい。
・ $X$ の偏差 $x_1-\bar{x}$, $x_2-\bar{x}$, $\cdots$, $x_n-\bar{x}$ の平均値は $\myBox{テ}$ である。
・ $X'$ の平均値は $\myBox{ト}$ である。
・ $X'$ の標準偏差は $\myBox{ナ}$ である。0: $0$
1: $1$
2: $-1$3: $\bar{x}$
4: $s$5: $\dfrac{1}{s}$
6: $s^2$
7: $\dfrac{1}{s^2}$
8: $\dfrac{\bar{x} }{s}$
図4で示されたモンシロチョウの初見日のデータ $M$ とツバメの初見日のデータ $T$ について上の変換を行ったデータをそれぞれ $M'$, $T'$ とする。
次の $\myBox{ニ}$ に当てはまるものを、図5の 0 ~ 3 のうちから一つ選べ。
変換後のモンシロチョウの初見日のデータ $M'$ と変換後のツバメの初見日のデータ $T'$ の散布図は、 $M'$ と $T'$ の標準偏差の値を考慮すると $\myBox{ニ}$ である。
解説
$X$ の偏差 $x_1-\bar{x}$, $x_2-\bar{x}$, $\cdots$, $x_n-\bar{x}$ の平均値を式で表すと、すべてを足して個数で割ればいいので、
\begin{eqnarray}
& &
\frac{(x_1-\bar{x})+(x_2-\bar{x})+\cdots+(x_n-\bar{x})}{n} \\[5pt]
&=&
\frac{(x_1+x_2+\cdots+x_n)-n\bar{x} }{n} \\[5pt]
&=&
\frac{x_1+x_2+\cdots+x_n}{n}-\bar{x} \\[5pt]
\end{eqnarray}となります。ただ、最後の式の前半部分は、 $X$ の平均そのものなので、 $\bar{x}-\bar{x}$ となり、 $0$ となります。
平均値からの差、を足し合わせると、0になります。例えば、5教科の平均点を出して、各教科の平均点からの差を具体的に計算してみると、納得できるでしょう。
$X'$ の平均値は、平均が0になるものを $s$ で割っただけなので、やはり平均は0です。わざわざ式で書けば
\begin{eqnarray}
& &
\frac{\frac{x_1-\bar{x} }{s}+\frac{x_2-\bar{x} }{s}+\cdots+\frac{x_n-\bar{x} }{s} }{n} \\[5pt]
&=&
\frac{(x_1-\bar{x})+(x_2-\bar{x})+\cdots+(x_n-\bar{x})}{sn} \\[5pt]
&=&
\frac{1}{s}\times\frac{(x_1+x_2+\cdots+x_n)-n\bar{x} }{n} \\[5pt]
\end{eqnarray}となり、後半は同じ計算をして0となることがわかります。
次に、 $X'$ の標準偏差について考えましょう。標準偏差とは、平均からの差の2乗を足し、個数で割った値の、正の平方根でした。今の場合、 $X'$ は平均が0なので、ただ2乗して個数で割ればいいので、標準偏差は、次のように計算できます。
\begin{eqnarray}
& &
\sqrt{\frac{\left(\frac{x_1-\bar{x} }{s}\right)^2+\left(\frac{x_2-\bar{x} }{s}\right)^2 +\cdots+\left(\frac{x_n-\bar{x} }{s}\right)^2}{n} } \\[5pt]
&=&
\frac{1}{s}\sqrt{\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2 +\cdots+(x_n-\bar{x})^2}{n} }
\end{eqnarray}となります。ルートの中の $\dfrac{1}{s^2}$ をルートの外に出しただけの変形です。ただ、よく見ると、最後の式のルートの部分は、 $X$ の標準偏差の式そのものになっています。なので、最後の式のルートのところは、実は $s$ に置き換えられるので、この値は $1$ だとわかります。このようにして、 $X'$ の標準偏差は、 $1$ であることがわかります。
この変換により、散布図がどう変わるかを考えましょう。まず、もとの散布図と比べて、各散布図がどうなっているかを見てみましょう。0と2、1と3は点の配置がまったく同じですね。そして、よく見ると0の左下にある、横並びになっている点2つが、1では右上に来ています。つまり、180度ひっくり返した図になっていることがわかります。
しかし、この変換では、ある値を引いて、正の数で割っているだけなので、上下が反転することはありません。なので、もとの散布図と同じ散らばりになっている、0か2のどちらかであることがまずわかります。
次に、0と2の違いを見ると、軸の幅が違いますね。先ほど求めたように、標準偏差が $1$ であることから、どちらの軸が正しいのか考えてみます。
標準偏差は、平均からの差の2乗を足し、個数で割った値の、正の平方根です。今の場合、平均は0だったので、値を2乗して足し合わせ、個数で割って、正の平方根を考えれば、それが標準偏差になります。ということは、もし各値の絶対値がすべて1未満であれば、足し合わせて個数で割った値も1未満となり、標準偏差が1になることがありません。なので、散布図が0のようになることはありえません。
以上から、散布図は2であることがわかります。「相関係数が-1から1までの値をとる」というのと混同しないようにしましょう。その話は、ここの話と全く異なります。
解答
テトナ:001
ニ:2