共通テスト 数学II・数学B 2021年度追試 第3問 解説
【第3問~第5問から2問選択】
問題編
問題
(正規分布表は省略しています)
以下の問題を解答するにあたっては、必要に応じて33ページの正規分布表を用いてもよい。
ある大学には、多くの留学生が在籍している。この大学の留学生に対して学習や生活を支援する留学生センターでは、留学生の日本語の学習状況について関心を寄せている。
(1) この大学では、留学生に対する授業として、以下に示す三つの日本語学習コースがある。
初級コース:1週間に10時間の日本語の授業を行う
中級コース:1週間に8時間の日本語の授業を行う
上級コース:1週間に6時間の日本語の授業を行うすべての留学生が三つのコースのうち、いずれか一つのコースのみに登録することになっている。留学生全体における各コースに登録した留学生の割合は、それぞれ
初級コース:20%、中級コース:35%、上級コース: $\myBox{アイ}$ %
であった。ただし、数値はすべて正確な値であり、四捨五入されていないものとする。
この留学生の集団において、一人を無作為に抽出したとき、その留学生が1週間に受講する日本語学習コースの授業の時間数を表す確率変数を $X$ とする。 $X$ の平均(期待値)は $\dfrac{\myBox{ウエ} }{2}$ であり、 $X$ の分散は $\dfrac{\myBox{オカ} }{20}$ である。
次に、留学生全体を母集団とし、 $a$ 人を無作為に抽出したとき、初級コースに登録した人数を表す確率変数を $Y$ とすると、 $Y$ は二項分布に従う。このとき、 $Y$ の平均 $E(Y)$ は\[ E(Y)=\dfrac{\myBox{キ} }{\myBox{ク} } \]である。
また、上級コースに登録した人数を表す確率変数を $Z$ とすると、 $Z$ は二項分布に従う。 $Y$, $Z$ の標準偏差をそれぞれ $\sigma(Y)$, $\sigma(Z)$ とすると\[ \dfrac{\sigma(Z)}{\sigma(Y)}=\dfrac{\myBox{ケ}\sqrt{\myBox{コサ} }}{\myBox{シ} } \]である。
ここで、 $a=100$ としたとき、無作為に抽出された留学生のうち、初級コースに登録した留学生が28人以上となる確率を $p$ とする。 $a=100$ は十分大きいので、 $Y$ は近似的に正規分布に従う。このことを用いて $p$ の近似値を求めると、 $p=\dBox{ス}$ である。
$\dbox{ス}$ については、最も適当なものを、次の 0 ~ 5 のうちから一つ選べ。
0: 0.002
1: 0.023
2: 0.228
3: 0.477
4: 0.480
5: 0.977(2) 40人の留学生を無作為に抽出し、ある1週間における留学生の日本語学習コース以外の日本語の学習時間(分)を調査した。ただし、日本語の学習時間は母平均 $m$ 、母分散 $\sigma^2$ の分布に従うものとする。
母分散 $\sigma^2$ を $640$ と仮定すると、標本平均の標準偏差は $\myBox{セ}$ となる。調査の結果、40人の学習時間の平均値は $120$ であった。標本平均が近似的に正規分布に従うとして、母平均 $m$ に対する信頼度 95% の信頼区間を $C_1\leqq m \leqq C_2$ とすると
\begin{eqnarray} C_1 &=& \myBox{ソタチ}\ .\ \myBox{ツテ} \\[5pt] C_2 &=& \myBox{トナニ}\ .\ \myBox{ヌネ} \\[5pt] \end{eqnarray}である。(3) (2)の調査とは別に、日本語の学習時間を再度調査することになった。そこで、50人の留学生を無作為に抽出し、調査した結果、学習時間の平均値は $120$ であった。
母分散 $\sigma^2$ を $640$ と仮定したとき、母平均 $m$ に対する信頼度 95% の信頼区間を $D_1\leqq m \leqq D_2$ とすると、 $\dBox{ノ}$ が成り立つ。
一方、母分散 $\sigma^2$ を $960$ と仮定したとき、母平均 $m$ に対する信頼度 95% の信頼区間を $E_1\leqq m \leqq E_2$ とする。このとき、 $D_2-D_1=E_2-E_1$ となるためには、標本の大きさを $50$ の $\myBox{ハ}\ . \ \myBox{ヒ}$ 倍にする必要がある。
$\dbox{ノ}$ の解答群
0: $D_1\lt C_1$ かつ $D_2\lt C_2$
1: $D_1\lt C_1$ かつ $D_2\gt C_2$
2: $D_1\gt C_1$ かつ $D_2\lt C_2$
3: $D_1\gt C_1$ かつ $D_2\gt C_2$
考え方
二項分布の計算、正規分布表を使った計算、信頼区間の出し方など、標準的な問題が並んでいます。単純に計算して求めるだけでなく、「この値を変化させるとどうなるか」を考えさせる問題もありますが、求め方がわかっていれば対応できるでしょう。
解答編
問題
以下の問題を解答するにあたっては、必要に応じて33ページの正規分布表を用いてもよい。
ある大学には、多くの留学生が在籍している。この大学の留学生に対して学習や生活を支援する留学生センターでは、留学生の日本語の学習状況について関心を寄せている。
(1) この大学では、留学生に対する授業として、以下に示す三つの日本語学習コースがある。
初級コース:1週間に10時間の日本語の授業を行う
中級コース:1週間に8時間の日本語の授業を行う
上級コース:1週間に6時間の日本語の授業を行うすべての留学生が三つのコースのうち、いずれか一つのコースのみに登録することになっている。留学生全体における各コースに登録した留学生の割合は、それぞれ
初級コース:20%、中級コース:35%、上級コース: $\myBox{アイ}$ %
であった。ただし、数値はすべて正確な値であり、四捨五入されていないものとする。
この留学生の集団において、一人を無作為に抽出したとき、その留学生が1週間に受講する日本語学習コースの授業の時間数を表す確率変数を $X$ とする。 $X$ の平均(期待値)は $\dfrac{\myBox{ウエ} }{2}$ であり、 $X$ の分散は $\dfrac{\myBox{オカ} }{20}$ である。
解説
全員が、三つのコースのどれか一つのみに登録するので、各コースの割合を全部足すと 100% になります。なので、上級コースは\[ 100-20-35=45 \]より、45% だとわかります。
1週間に受講する授業の時間数の期待値は、時間と割合を掛けて足して求めることができるので
\begin{eqnarray}
10\times 0.2+8\times 0.35+6\times 0.45
&=&
2+2.8+2.7 \\[5pt]
&=&
\frac{15}{2} \\[5pt]
\end{eqnarray}となります。また、時間の2乗と割合を掛けて足すと
\begin{eqnarray}
10^2\times 0.2+8^2\times 0.35+6^2\times 0.45
&=&
20+22.4+16.2 \\[5pt]
&=&
58.6 \\[5pt]
\end{eqnarray}なので、分散は
\begin{eqnarray}
58.6-7.5^2
&=&
58.6-56.25 \\[5pt]
&=&
2.35 \\[5pt]
&=&
\frac{47}{20}
\end{eqnarray}となります。
解答
アイ:45
ウエ:15
オカ:47
解答編 つづき
次に、留学生全体を母集団とし、 $a$ 人を無作為に抽出したとき、初級コースに登録した人数を表す確率変数を $Y$ とすると、 $Y$ は二項分布に従う。このとき、 $Y$ の平均 $E(Y)$ は\[ E(Y)=\dfrac{\myBox{キ} }{\myBox{ク} } \]である。
解説
$i$ 番目の人が初級コースに登録していたら $1$ 、していなければ $0$ の値をとる確率変数を $Y_i$ とすると、 $Y=Y_1+Y_2+\cdots+Y_a$ と表すことができます。なので、 $Y$ は二項分布に従います。各 $Y_i$ について、期待値は $0.2$ なので、 $E(Y)$ は\[ 0.2\times a=\frac{a}{5} \]となります。
解答
キク:a5
解答編 つづき
また、上級コースに登録した人数を表す確率変数を $Z$ とすると、 $Z$ は二項分布に従う。 $Y$, $Z$ の標準偏差をそれぞれ $\sigma(Y)$, $\sigma(Z)$ とすると\[ \dfrac{\sigma(Z)}{\sigma(Y)}=\dfrac{\myBox{ケ}\sqrt{\myBox{コサ} }}{\myBox{シ} } \]である。
解説
$Y$ の分散は、\[ a\cdot 0.2\cdot (1-0.2)=0.16a \]となります。
$Z$ も二項分布に従うため、分散は\[ a\cdot 0.45\cdot (1-0.45) \]で求めることができます。
よって、標準偏差の比は
\begin{eqnarray}
\frac{\sigma(Z)}{\sigma(Y)}
&=&
\dfrac{\sqrt{0.45\cdot 0.55 a} }{\sqrt{0.16a} } \\[5pt]
&=&
\dfrac{\sqrt{45\cdot 55} }{\sqrt{1600} } \\[5pt]
&=&
\dfrac{3\sqrt{11} }{8} \\[5pt]
\end{eqnarray}となります。
解答
ケコサシ:3118
解答編 つづき
ここで、 $a=100$ としたとき、無作為に抽出された留学生のうち、初級コースに登録した留学生が28人以上となる確率を $p$ とする。 $a=100$ は十分大きいので、 $Y$ は近似的に正規分布に従う。このことを用いて $p$ の近似値を求めると、 $p=\dBox{ス}$ である。
$\dbox{ス}$ については、最も適当なものを、次の 0 ~ 5 のうちから一つ選べ。
0: 0.002
1: 0.023
2: 0.228
3: 0.477
4: 0.480
5: 0.977
解説
問題文にある通り、 $Y$ 近似的に正規分布に従うと考えます。 $a=100$ なので、平均が $\dfrac{100}{5}=20$ であり、標準偏差は $\sqrt{0.16a}=4$ です。 $Y'$ が標準正規分布に従う確率変数とすると
\begin{eqnarray}
& &
P(Y\geqq 28) \\[5pt]
&=&
P\left(\frac{Y-20}{4}\geqq \frac{28-20}{4}\right) \\[5pt]
&=&
P(Y'\geqq 2) \\[5pt]
&=&
0.5-P(Y'\leqq 2) \\[5pt]
\end{eqnarray}が成り立ちます。ここで、正規分布表から、 $2.00$ の部分を見ると確率が $0.4772$ だとわかるので、求める確率は\[ 0.5-0.4772=0.0228 \]となり、選択肢の中では 1 が一番近いことがわかります。
解答
ス:1
解答編 つづき
(2) 40人の留学生を無作為に抽出し、ある1週間における留学生の日本語学習コース以外の日本語の学習時間(分)を調査した。ただし、日本語の学習時間は母平均 $m$ 、母分散 $\sigma^2$ の分布に従うものとする。
母分散 $\sigma^2$ を $640$ と仮定すると、標本平均の標準偏差は $\myBox{セ}$ となる。調査の結果、40人の学習時間の平均値は $120$ であった。標本平均が近似的に正規分布に従うとして、母平均 $m$ に対する信頼度 95% の信頼区間を $C_1\leqq m \leqq C_2$ とすると
\begin{eqnarray} C_1 &=& \myBox{ソタチ}\ .\ \myBox{ツテ} \\[5pt] C_2 &=& \myBox{トナニ}\ .\ \myBox{ヌネ} \\[5pt] \end{eqnarray}である。
解説
母分散が $640$ で、標本数が $40$ なので、標本平均の標準偏差は\[ \frac{\sqrt{640} }{\sqrt{40} }=4 \]となります。
問題文にある通り、標本平均が近似的に正規分布に従うとすると、この正規分布は平均が $120$ で標準偏差が $4$ です。また、正規分布表で確率が $0.475$ となっているときの $z_0$ は $1.96$ だから、母平均 $m$ に対する信頼度 95%の信頼区間の左側 $C_1$ は
\begin{eqnarray}
C_1
&=&
120-1.96\cdot 4 \\[5pt]
&=&
120-7.84 \\[5pt]
&=&
112.16 \\[5pt]
\end{eqnarray}であり、右側 $C_2$ は
\begin{eqnarray}
C_2
&=&
120+1.96\cdot 4 \\[5pt]
&=&
127.84
\end{eqnarray}と求められます。
解答
ソタチツテ:11216トナニヌネ:12784
解答編 つづき
(3) (2)の調査とは別に、日本語の学習時間を再度調査することになった。そこで、50人の留学生を無作為に抽出し、調査した結果、学習時間の平均値は $120$ であった。
母分散 $\sigma^2$ を $640$ と仮定したとき、母平均 $m$ に対する信頼度 95% の信頼区間を $D_1\leqq m \leqq D_2$ とすると、 $\dBox{ノ}$ が成り立つ。
一方、母分散 $\sigma^2$ を $960$ と仮定したとき、母平均 $m$ に対する信頼度 95% の信頼区間を $E_1\leqq m \leqq E_2$ とする。このとき、 $D_2-D_1=E_2-E_1$ となるためには、標本の大きさを $50$ の $\myBox{ハ}\ . \ \myBox{ヒ}$ 倍にする必要がある。
$\dbox{ノ}$ の解答群
0: $D_1\lt C_1$ かつ $D_2\lt C_2$
1: $D_1\lt C_1$ かつ $D_2\gt C_2$
2: $D_1\gt C_1$ かつ $D_2\lt C_2$
3: $D_1\gt C_1$ かつ $D_2\gt C_2$
解説
$C_1,C_2$ と $D_1,D_2$ の大小関係について考えます。どちらのケースでも、正規分布に従っていて、平均は $120$ 、母分散が $640$ となっています。信頼度は 95%で、これも同じです。違いは、標本数が $40$ か、 $50$ か、という点だけです。
信頼区間の両端は、平均 $\pm1.96\cdot\dfrac{\sigma}{\sqrt{n} }$ と表されるため、標本の大きさが大きいほど、信頼区間は狭まります。そのため、\[ C_1\lt D_1 \lt D_2 \lt C_2 \]が成り立ちます。選択肢の中では、 2 が正しいです。
イメージでいうと、標本数を増やしていけば、標本平均は母平均にどんどん近づいていくので、より狭い範囲でも信頼できるようになる、となります。
次に、 $D_1,D_2$ と $E_1, E_2$ について考えます。今度は、母分散を変えても信頼区間の幅が同じになるようにしたい、という内容です。母分散が $\dfrac{960}{640}=1.5$ 倍になっているので、標本数も $1.5$ 倍すれば、信頼区間の幅は同じになります。
解答
ノ:2
ハヒ:15