共通テスト 数学II・数学B 2021年度 第3問 解説
【第3問~第5問から2問選択】
問題編
問題
(正規分布表は省略しています)
以下の問題を解答するにあたっては、必要に応じて29ページの正規分布表を用いてもよい。
Q高校の校長先生は、ある日、新聞で高校生の読書に関する記事を読んだ。そこで、Q高校の生徒全員を対象に、直線の1週間の読書時間に関して、100人の生徒を無作為に抽出して調査を行った。その結果、100人の生徒のうち、この1週間に全く読書をしなかった生徒が36人であり、100人の生徒のこの1週間の読書時間(分)の平均値は $204$ であった。Q高校の生徒全員のこの1週間の読書時間の母平均を $m$、母標準偏差を $150$ とする。
(1) 全く読書をしなかった生徒の母比率を $0.5$ とする。このとき、100人の無作為標本のうちで全く読書をしなかった生徒の数を表す確率変数を $X$ とすると、 $\dBox{ア}$ に従う。また、 $X$ の平均(期待値)は $\myBox{イウ}$ 、標準偏差は $\myBox{エ}$ である。
$\dbox{ア}$ については、最も適当なものを、次の 0 ~ 5 のうちから一つ選べ。
0: 正規分布 $N(0,1)$
1: 二項分布 $B(0,1)$
2: 正規分布 $N(100,0.5)$
3: 二項分布 $B(100,0.5)$
4: 正規分布 $N(100,36)$
5: 二項分布 $B(100,36)$(2) 標本の大きさ100は十分に大きいので、100人のうち全く読書をしなかった生徒の数は近似的に正規分布に従う。
全く読書をしなかった生徒の母比率を $0.5$ とするとき、全く読書をしなかった生徒が36人以下となる確率を $p_5$ とおく。 $p_5$ の近似値を求めると、 $p_5=\dBox{オ}$ である。
また、全く読書をしなかった生徒の母比率を $0.4$ とするとき、全く読書をしなかった生徒が36人以下となる確率を $p_4$ とおくと、 $\dBox{カ}$ である。
$\dbox{オ}$ については、最も適当なものを、次の 0 ~ 5 のうちから一つ選べ。
0: 0.001
1: 0.003
2: 0.026
3: 0.050
4: 0.133
5: 0.497$\dbox{カ}$ の解答群
0: $p_4\lt p_5$
1: $p_4= p_5$
2: $p_4\gt p_5$(3) 1週間の読書時間の母平均 $m$ に対する信頼度95%の信頼区間を $C_1\leqq m \leqq C_2$ とする、標本の大きさ $100$ は十分大きいことと、1週間の読書時間の標本平均が $204$ 、母標準偏差が $150$ であることを用いると、 $C_1+C_2=\myBox{キクケ}$ 、 $C_2-C_1=\myBox{コサ}.\myBox{シ}$ であることがわかる、
また、母平均 $m$ と $C_1$, $C_2$ については、 $\dBox{ス}$ 。
$\dbox{ス}$ の解答群
0: $C_1\leqq m \leqq C_2$ が必ず成り立つ
1: $m \leqq C_2$ は必ず成り立つが、 $C_1 \leqq m$ が成り立つとは限らない
2: $C_1\leqq m$ は必ず成り立つが、 $m \leqq C_2$ が成り立つとは限らない
3: $C_1\leqq m$ も $m \leqq C_2$ も成り立つとは限らない
(4) Q高校の図書委員長も、校長先生と同じ新聞記事を読んだため、校長先生が調査をしていることを知らずに、図書委員会として校長先生と同様の調査を独自に行った。ただし、調査期間は校長先生による調査と同じ直前の1週間であり、対象をQ高校の生徒全員として100人の生徒を無作為に抽出した。その調査における、全く読書をしなかった生徒の数を $n$ とする。
校長先生の調査結果によると全く読書をしなかった生徒は36人であり、 $\dBox{セ}$ 。
$\dbox{セ}$ の解答群
0: $n$ は必ず36に等しい
1: $n$ は必ず36未満である
2: $n$ は必ず36より大きい
3: $n$ と36の大小はわからない(5) (4)の図書委員会が行った調査結果による母平均 $m$ に対する信頼度 95% の信頼区間を $D_1\leqq m \leqq D_2$ 、校長先生が行った調査結果による母平均 $m$ に対する信頼度 95% の信頼区間を (3) の $C_1\leqq m \leqq C_2$ とする。ただし、母集団は同一であり、1週間の読書時間の母標準偏差は 150 とする。
このとき、次の 0 ~ 5 のうち、正しいものは $\dBox{ソ}$ と $\dBox{タ}$ である。
$\dbox{ソ}$, $\dbox{タ}$ の解答群(解答の順序は問わない。)
0: $C_1=D_1$ と $C_2=D_2$ が必ず成り立つ。
1: $C_1\lt D_2$ または $D_1\lt C_2$ のどちらか一方のみが必ず成り立つ。
2: $D_2\lt C_1$ または $C_2\lt D_1$ となる場合もある。
3: $C_2-C_1 \gt D_2-D_1$ が必ず成り立つ。
4: $C_2-C_1 = D_2-D_1$ が必ず成り立つ。
5: $C_2-C_1 \lt D_2-D_1$ が必ず成り立つ。
考え方
センター試験に比べると計算は減りました。一方、それぞれの用語が何を表しているかをきちんと理解していないと、何を答えればいいかわからない問題があります。
計算方法だけでなく、それが何を意味しているかを普段から意識するようにしましょう。
解答編
問題
(正規分布表は省略しています)
以下の問題を解答するにあたっては、必要に応じて29ページの正規分布表を用いてもよい。
Q高校の校長先生は、ある日、新聞で高校生の読書に関する記事を読んだ。そこで、Q高校の生徒全員を対象に、直線の1週間の読書時間に関して、100人の生徒を無作為に抽出して調査を行った。その結果、100人の生徒のうち、この1週間に全く読書をしなかった生徒が36人であり、100人の生徒のこの1週間の読書時間(分)の平均値は $204$ であった。Q高校の生徒全員のこの1週間の読書時間の母平均を $m$、母標準偏差を $150$ とする。
(1) 全く読書をしなかった生徒の母比率を $0.5$ とする。このとき、100人の無作為標本のうちで全く読書をしなかった生徒の数を表す確率変数を $X$ とすると、 $\dBox{ア}$ に従う。また、 $X$ の平均(期待値)は $\myBox{イウ}$ 、標準偏差は $\myBox{エ}$ である。
$\dbox{ア}$ については、最も適当なものを、次の 0 ~ 5 のうちから一つ選べ。
0: 正規分布 $N(0,1)$
1: 二項分布 $B(0,1)$
2: 正規分布 $N(100,0.5)$
3: 二項分布 $B(100,0.5)$
4: 正規分布 $N(100,36)$
5: 二項分布 $B(100,36)$
解説
母比率が $0.5$ なので、無作為に1人を抽出したときに、その人が全く読書をしなかった確率は $0.5$ です。また、「全く読書をしなかった」かそうでないかの2通りしかありません。
100人抽出して全く読書をしなかった人数は、これを100個足したものだと考えることができます。そのため、 $X$ は二項分布 $B(100, 0.5)$ に従います。
$X$ の期待値は、\[ 100\cdot 0.5=50 \]と求めることができ、標準偏差は\[ \sqrt{100\cdot0.5\cdot(1-0.5)}=5 \]となります。
解答
ア:3
イウ:50
エ:5
解答編 つづき
(2) 標本の大きさ100は十分に大きいので、100人のうち全く読書をしなかった生徒の数は近似的に正規分布に従う。
全く読書をしなかった生徒の母比率を $0.5$ とするとき、全く読書をしなかった生徒が36人以下となる確率を $p_5$ とおく。 $p_5$ の近似値を求めると、 $p_5=\dBox{オ}$ である。
また、全く読書をしなかった生徒の母比率を $0.4$ とするとき、全く読書をしなかった生徒が36人以下となる確率を $p_4$ とおくと、 $\dBox{カ}$ である。
$\dbox{オ}$ については、最も適当なものを、次の 0 ~ 5 のうちから一つ選べ。
0: 0.001
1: 0.003
2: 0.026
3: 0.050
4: 0.133
5: 0.497$\dbox{カ}$ の解答群
0: $p_4\lt p_5$
1: $p_4= p_5$
2: $p_4\gt p_5$
解説
正規分布表が使える形に変形していきましょう。
問題文にあるように、 $X$ が近似的に正規分布に従うとします。 $X$ の期待値は $50$ で標準偏差が $5$ なので、 $\dfrac{X-50}{5}$ は標準正規分布に従います。
\begin{eqnarray}
P(X\leqq 36)
&=&
P(X-50\leqq -14) \\[5pt]
&=&
P \left(\frac{X-50}{5}\leqq -2.8\right) \\[5pt]
&=&
P \left(\frac{X-50}{5}\geqq 2.8\right) \\[5pt]
\end{eqnarray}です。正規分布表を見ると、 $z_0=2.80$ のところは $0.4974$ となっています。求めたい確率はこれより大きい部分なので、\[ 0.5-0.4974=0.0026 \]となります。なので、選択肢の中では、1 が一番近いです。
母比率が $0.4$ のときは、期待値が $40$ であり、より「36人以下」になりやすいので、\[ p_4\gt p_5 \]となることがわかります。
余談ですが、(2)の問題文に「近似的に正規分布に従う」と書いているので、(1)の答えは正規分布でないことがわかります。
解答
オ:1
カ:2
解答編 つづき
(3) 1週間の読書時間の母平均 $m$ に対する信頼度95%の信頼区間を $C_1\leqq m \leqq C_2$ とする、標本の大きさ $100$ は十分大きいことと、1週間の読書時間の標本平均が $204$ 、母標準偏差が $150$ であることを用いると、 $C_1+C_2=\myBox{キクケ}$ 、 $C_2-C_1=\myBox{コサ}.\myBox{シ}$ であることがわかる、
また、母平均 $m$ と $C_1$, $C_2$ については、 $\dBox{ス}$ 。
$\dbox{ス}$ の解答群
0: $C_1\leqq m \leqq C_2$ が必ず成り立つ
1: $m \leqq C_2$ は必ず成り立つが、 $C_1 \leqq m$ が成り立つとは限らない
2: $C_1\leqq m$ は必ず成り立つが、 $m \leqq C_2$ が成り立つとは限らない
3: $C_1\leqq m$ も $m \leqq C_2$ も成り立つとは限らない
解説
「標本の大きさ100は十分大きい」というのは、正規分布で近似できる、ということです。
正規分布表で確率が $\dfrac{0.95}{2}=0.475$ となっている部分を見ると $z_0=1.96$ だとわかります。このことから、信頼区間は
\begin{eqnarray}
204-1.96\cdot\dfrac{150}{\sqrt{100} } \leqq m \leqq 204+1.96\cdot\dfrac{150}{\sqrt{100} }
\end{eqnarray}となります。これより、 $C_1+C_2=2\cdot 204=408$ であり、
\begin{eqnarray}
C_2-C_1
&=&
2\cdot 1.96\cdot\dfrac{150}{\sqrt{100} } \\[5pt]
&=&
1.96\cdot 30 \\[5pt]
&=&
58.8
\end{eqnarray}と求められます。
また、信頼区間は $C_1\leqq m\leqq C_2$ となる確率が $0.95$ というだけなので、実際には $m$ は $C_1$ より小さいこともあるし、 $C_2$ より大きいこともあります。なので、ス には 3 が入ります。
解答
キクケ:408
コサシ:588
ス:3
解答編 つづき
(4) Q高校の図書委員長も、校長先生と同じ新聞記事を読んだため、校長先生が調査をしていることを知らずに、図書委員会として校長先生と同様の調査を独自に行った。ただし、調査期間は校長先生による調査と同じ直前の1週間であり、対象をQ高校の生徒全員として100人の生徒を無作為に抽出した。その調査における、全く読書をしなかった生徒の数を $n$ とする。
校長先生の調査結果によると全く読書をしなかった生徒は36人であり、 $\dBox{セ}$ 。
$\dbox{セ}$ の解答群
0: $n$ は必ず36に等しい
1: $n$ は必ず36未満である
2: $n$ は必ず36より大きい
3: $n$ と36の大小はわからない
解説
母集団が同じであっても、結果がぴったり同じになるとは限りません。校長先生の調査結果と図書委員会の調査結果が同じになるとは限らないので、 $n$ と 36 の大小はわかりません。
解答
セ:3
解答編 つづき
(5) (4)の図書委員会が行った調査結果による母平均 $m$ に対する信頼度 95% の信頼区間を $D_1\leqq m \leqq D_2$ 、校長先生が行った調査結果による母平均 $m$ に対する信頼度 95% の信頼区間を (3) の $C_1\leqq m \leqq C_2$ とする。ただし、母集団は同一であり、1週間の読書時間の母標準偏差は 150 とする。
このとき、次の 0 ~ 5 のうち、正しいものは $\dBox{ソ}$ と $\dBox{タ}$ である。
$\dbox{ソ}$, $\dbox{タ}$ の解答群(解答の順序は問わない。)
0: $C_1=D_1$ と $C_2=D_2$ が必ず成り立つ。
1: $C_1\lt D_2$ または $D_1\lt C_2$ のどちらか一方のみが必ず成り立つ。
2: $D_2\lt C_1$ または $C_2\lt D_1$ となる場合もある。
3: $C_2-C_1 \gt D_2-D_1$ が必ず成り立つ。
4: $C_2-C_1 = D_2-D_1$ が必ず成り立つ。
5: $C_2-C_1 \lt D_2-D_1$ が必ず成り立つ。
解説
2回の調査では、母集団が同一で、母標準偏差も同じです。標本数も同じなので、信頼区間の幅は同じになります。 4 が正しいです。
しかし、調査結果によって、標本平均は変わり得ます。信頼区間の中心はズレうる、ということです。ケースによっては、 $C_1\lt C_2 \lt D_1 \lt D_2$ となることもありえますし、 $D_1\lt D_2 \lt C_1 \lt C_2$ となることもあります。2 も正しいです。
解答
ソ・タ:2・4