共通テスト 数学II・数学B 2023年度追試 第3問 解説
【第3問~第5問から2問選択】
(正規分布表は省略しています)
問題編
問題
以下の問題を解答するにあたっては、必要に応じて51ページの正規分布表を用いてもよい。
1, 2, 3, 4 の数字がそれぞれ一つずつ書かれた4枚の白のカードが箱Aに、1, 2, 3, 4 の数字がそれぞれ一つずつ書かれた4枚の赤のカードが箱Bに入っている。箱A、Bからそれぞれ1枚ずつのカードを無作為に取り出し、取り出したカードの数字を確認してからもとに戻す試行について、次のように確率変数 $X,Y$ を定める。
「確率変数 $X$」
取り出した白のカードに書かれた数と赤のカードに書かれた数の小さい方の数(書かれた数が等しい場合はその数)を $X$ の値とする。「確率変数 $Y$」
取り出した白のカードに書かれた数と赤のカードに書かれた数の大きい方の数(書かれた数が等しい場合はその数)を $Y$ の値とする。太郎さんは、この試行を2回繰り返したときに記録された2個の数の平均値 $t_2=2.50$ と100回繰り返したときに記録された100個の数の平均値 $t_{100}=2.95$ が書いてあるメモを見つけた。メモに関する太郎さんの記憶は次のとおりである。
太郎さんの記憶
メモに書かれていた $t_2$ と $t_{100}$ は「確率変数 $X$」の平均値である。太郎さんは、このメモに書かれていた $t_2$ と $t_{100}$ が「確率変数 $X$」か「確率変数 $Y$」のうちどちらか一方の平均値であったことは覚えていたが、太郎さんの記憶における「確率変数 $X$」の部分が確かでなく、もしかしたら「確率変数 $Y$」だったかもしれないと感じている。このことについて、太郎さんが花子さんに相談したところ、花子さんは、太郎さんが見つけたメモに書かれていた二つの平均値をもとにして太郎さんの記憶が正しいかどうかがわかるのではないかと考えた。
(1) $X=1$ となるのは、白のカード、赤のカードともに1か、白のカードが1で赤のカードが2以上か、赤のカードが1で白のカードが2以上の場合であり、全部で $\myBox{ア}$ 通りある。 $X=2,3,4$ についても同様に考えることにより、 $X$ の確率分布は
$X$ 1 2 3 4 計 $P$ $\dfrac{\mybox{ア}}{16}$ $\dfrac{\myBox{イ}}{16}$ $\dfrac{\myBox{ウ}}{16}$ $\dfrac{\myBox{エ}}{16}$ $1$ となることがわかる。また、 $Y$ の確率分布は
$Y$ 1 2 3 4 計 $P$ $\dfrac{1}{16}$ $\dfrac{\myBox{オ}}{16}$ $\dfrac{\myBox{カ}}{16}$ $\dfrac{\myBox{キ}}{16}$ $1$ となる。
確率変数 $Z$ を $Z=\myBox{ク}-X$ とすると、 $Z$ の確率分布と $Y$ の確率分布は同じであることがわかる。
(2) 確率変数 $X$ の平均(期待値)と標準偏差はそれぞれ\[ E(X)=\dfrac{\myBox{ケコ}}{8},\ \sigma(X)=\dfrac{\sqrt{55}}{8} \]となる。このことと、(1)の確率変数 $Z$ に関する考察から、確率変数 $Y$ の平均は\[ E(Y)=\dfrac{\myBox{サシ}}{8} \]となり、標準偏差は $\sigma(Y)=\dBox{ス}$ となる。
$\dbox{ス}$ の解答群
0: $\{\sigma(X)\}^2$
1: $5-\sigma(X)$
2: $5\sigma(X)$
3: $\sigma(X)$(3) 確率変数 $X,Y$ の分布から太郎さんの記憶が正しいかどうかを推測しよう。
$X$ の確率分布をもつ母集団を考え、この母集団から無作為に抽出した大きさ $n$ の標本を確率変数 $X_1,X_2,\cdots,X_n$ とし、標本平均を $\bar{X}$ とする。 $Y$ の確率分布をもつ母集団を考え、この母集団から無作為に抽出した大きさ $n$ の標本を確率変数 $Y_1,Y_2,\cdots,Y_n$ とし、標本平均を $\bar{Y}$ とする。
(i) メモに書かれていた、 $t_2=2.50$ について考えよう。
花子さんは、 $\bar{X}=2.50$ となる確率 $P(\bar{X}=2.50)$ と $\bar{Y}=2.50$ となる確率 $P(\bar{Y}=2.50)$ を比較することで、太郎さんの記憶が正しいかどうかがわかるのではないかと考えた。
$\bar{X}=2.50$ となる確率は、 $X_1+X_2=5$ となる確率であり、(1)の $X$ の確率分布より\[ P(\bar{X}=2.50)=\dfrac{\myBox{セソ}}{64} \]となり、(1) の $Y$ の確率分布から、 $P(\bar{Y}=2.50)\ \dBox{タ}\ P(\bar{X}=2.50)$ が成り立つことがわかる。
このことから、花子さんは、 $t_2=2.50$ からでは太郎さんの記憶が正しいかどうかはわからないと考えた。
$\dbox{タ}$ の解答群
0: $\lt$
1: $=$
2: $\gt$(ii) メモに書かれていた、 $t_{100}=2.95$ について考えよう。
$n$ が大きいとき、 $\bar{X}$ は近似的に正規分布 $N(E(\bar{X}), \{\sigma(\bar{X})\}^2)$ に従い、 $\sigma(\bar{X})=\dBox{チ}$ である。 $n=100$ は大きいので、 $\bar{X}=2.95$ であったとすると、推定される母平均を $m_X$ として、 $m_X$ の信頼度 95% の信頼区間は\[ \dBox{ツ} \leqq m_X \leqq \dBox{テ} \quad \cdots ① \]となる。一方、 $\bar{Y}=2.95$ であったとすると、推定される母平均を $m_Y$ として、 $m_Y$ の信頼度 95% の信頼区間は\[ \dBox{ト} \leqq m_Y \leqq \dBox{ナ} \quad \cdots ② \]となることもわかる。ただし、 $\dbox{ツ}$ ~ $\dbox{ナ}$ の計算においては、 $\sqrt{55}=7.4$ とする。
$\dbox{チ}$ の解答群
0: $\{\sigma(X)\}^2$
1: $\dfrac{\sigma(X)}{n}$
2: $\dfrac{\sigma(X)}{\sqrt{n}}$
3: $\dfrac{\{\sigma(X)\}^2}{n}$
$\dbox{ツ}$ ~ $\dbox{ナ}$ については、最も適当なものを、次の 0 ~ 8 のうちから一つずつ選べ。ただし、同じものを繰り返し選んでもよい。
0: 1.693
1: 1.875
2: 2.057
3: 2.740
4: 2.769
5: 2.798
6: 3.102
7: 3.131
8: 3.160花子さんは、次の基準により太郎さんの記憶が正しいかどうかを判断することにした。ただし、基準が適用できない場合には、判断しないものとする。
基準
①の信頼区間に $E(X)$ が含まれていて、②の信頼区間に $E(Y)$ が含まれていないならば、太郎さんの記憶は正しいものとする。①の信頼区間に $E(X)$ が含まれず、②の信頼区間に $E(Y)$ が含まれているならば、太郎さんの記憶は正しくないものとする。$E(X)$ は①の信頼区間に $\dBox{ニ}$ 。 $E(Y)$ は②の信頼区間に $\dBox{ヌ}$ 。
以上より、太郎さんの記憶については、$\dBox{ネ}$ 。
$\dbox{ニ}$, $\dbox{ヌ}$ の解答群(同じものを繰り返し選んでもよい。)
0: 含まれている
1: 含まれていない$\dbox{ネ}$ については、最も適当なものを、次の 0 ~ 2 のうちから一つ選べ。
0: 正しいと判断され、メモに書かれていた $t_2$ と $t_{100}$ は「確率変数 $X$」 の平均値である
1: 正しくないと判断され、メモに書かれていた $t_2$ と $t_{100}$ は「確率変数 $Y$」 の平均値である
2: 基準が適用できないので、判断しない
考え方
100回もやってたのに、何をやっていたか忘れる太郎さんはヤバいですね。内容は例年と同じような計算が続きます。途中の計算ができていれば、最後の判定は簡単です。
【第3問~第5問から2問選択】
(正規分布表は省略しています)
解答編
問題
以下の問題を解答するにあたっては、必要に応じて51ページの正規分布表を用いてもよい。
1, 2, 3, 4 の数字がそれぞれ一つずつ書かれた4枚の白のカードが箱Aに、1, 2, 3, 4 の数字がそれぞれ一つずつ書かれた4枚の赤のカードが箱Bに入っている。箱A、Bからそれぞれ1枚ずつのカードを無作為に取り出し、取り出したカードの数字を確認してからもとに戻す試行について、次のように確率変数 $X,Y$ を定める。
「確率変数 $X$」
取り出した白のカードに書かれた数と赤のカードに書かれた数の小さい方の数(書かれた数が等しい場合はその数)を $X$ の値とする。「確率変数 $Y$」
取り出した白のカードに書かれた数と赤のカードに書かれた数の大きい方の数(書かれた数が等しい場合はその数)を $Y$ の値とする。太郎さんは、この試行を2回繰り返したときに記録された2個の数の平均値 $t_2=2.50$ と100回繰り返したときに記録された100個の数の平均値 $t_{100}=2.95$ が書いてあるメモを見つけた。メモに関する太郎さんの記憶は次のとおりである。
太郎さんの記憶
メモに書かれていた $t_2$ と $t_{100}$ は「確率変数 $X$」の平均値である。太郎さんは、このメモに書かれていた $t_2$ と $t_{100}$ が「確率変数 $X$」か「確率変数 $Y$」のうちどちらか一方の平均値であったことは覚えていたが、太郎さんの記憶における「確率変数 $X$」の部分が確かでなく、もしかしたら「確率変数 $Y$」だったかもしれないと感じている。このことについて、太郎さんが花子さんに相談したところ、花子さんは、太郎さんが見つけたメモに書かれていた二つの平均値をもとにして太郎さんの記憶が正しいかどうかがわかるのではないかと考えた。
(1) $X=1$ となるのは、白のカード、赤のカードともに1か、白のカードが1で赤のカードが2以上か、赤のカードが1で白のカードが2以上の場合であり、全部で $\myBox{ア}$ 通りある。 $X=2,3,4$ についても同様に考えることにより、 $X$ の確率分布は
$X$ 1 2 3 4 計 $P$ $\dfrac{\mybox{ア}}{16}$ $\dfrac{\myBox{イ}}{16}$ $\dfrac{\myBox{ウ}}{16}$ $\dfrac{\myBox{エ}}{16}$ $1$ となることがわかる。また、 $Y$ の確率分布は
$Y$ 1 2 3 4 計 $P$ $\dfrac{1}{16}$ $\dfrac{\myBox{オ}}{16}$ $\dfrac{\myBox{カ}}{16}$ $\dfrac{\myBox{キ}}{16}$ $1$ となる。
確率変数 $Z$ を $Z=\myBox{ク}-X$ とすると、 $Z$ の確率分布と $Y$ の確率分布は同じであることがわかる。
解説
(1)
問題文にあるように、 $X=1$ とは、白と赤の小さい方が $1$ のときなので、
・白も赤も1(1通り)
・白が1で、赤が2以上(3通り)
・白が2以上で、赤が1(3通り)
の3パターンです。なので、 $1+3+3=7$ 通りです。
$X=2$ のときは、同様に考えると
・白も赤も2(1通り)
・白が2で、赤が3以上(2通り)
・白が3以上で、赤が2(2通り)
だから、 $1+2+2=5$ 通りです。同じように計算して、 $X=3$ は $3$ 通りで、 $X=4$ となるのはどちらも 4 のときなので、 $1$ 通りです。
よって、 $X=1,2,3,4$ となる確率は、それぞれ $\dfrac{7}{16}$, $\dfrac{5}{16}$, $\dfrac{3}{16}$, $\dfrac{1}{16}$ となります。足すと、ちゃんと $1$ になります。
一方、 $Y=1$ となるのは、大きい方が $1$ のときだから、どちらも $1$ のときであり、 $1$ 通りです。また、 $Y=4$ となるのは、
・白も赤も4(1通り)
・白が4で、赤が3以下(3通り)
・白が3以下で、赤が4(3通り)
なので、 $1+3+3=7$ 通りです。つまり、 $X=1,2,3,4$ のときと $Y=4,3,2,1$ のときが順番に対応することがわかります。よって、 $Y=1,2,3,4$ となる確率は、それぞれ $\dfrac{1}{16}$, $\dfrac{3}{16}$, $\dfrac{5}{16}$, $\dfrac{7}{16}$ となります。
確率が同じになる $X,Y$ の値を足すと、いずれも $5$ になります。なので、 $Z=5-X$ とおけば、 $Z$ と $Y$ の確率分布は同じになることがわかります。
解答
ア:7 (1点)
イウエ:531 (2点)
オカキ:357 (1点)
ク:5 (1点)
解答編 つづき
問題
(2) 確率変数 $X$ の平均(期待値)と標準偏差はそれぞれ\[ E(X)=\dfrac{\myBox{ケコ}}{8},\ \sigma(X)=\dfrac{\sqrt{55}}{8} \]となる。このことと、(1)の確率変数 $Z$ に関する考察から、確率変数 $Y$ の平均は\[ E(Y)=\dfrac{\myBox{サシ}}{8} \]となり、標準偏差は $\sigma(Y)=\dBox{ス}$ となる。
$\dbox{ス}$ の解答群
0: $\{\sigma(X)\}^2$
1: $5-\sigma(X)$
2: $5\sigma(X)$
3: $\sigma(X)$
解説
(2)
$X$ の期待値は
\begin{eqnarray}
& &
1\cdot\frac{7}{16} +2\cdot\frac{5}{16} +3\cdot\frac{3}{16} +4\cdot\frac{1}{16} \\[5pt]
&=&
\frac{7+10+9+4}{16} = \frac{15}{8}
\end{eqnarray}となります。これより、
\begin{eqnarray}
E(Y)
&=&
E(Z) \\[5pt]
&=&
E(5-X) \\[5pt]
&=&
5-E(X) \\[5pt]
&=&
5-\frac{15}{8}=\frac{25}{8} \\[5pt]
\end{eqnarray}となります。
$-1$ をかけたり、定数を足しても分散は変わらないので、 $X$ と $Y$ の分散は等しく、標準偏差も等しいです。つまり、 $\sigma(Y)=\sigma(X)$ となります。
解答
ケコ:15 (2点)サシ:25 (1点)
ス:3 (2点)
解答編 つづき
問題
(3) 確率変数 $X,Y$ の分布から太郎さんの記憶が正しいかどうかを推測しよう。
$X$ の確率分布をもつ母集団を考え、この母集団から無作為に抽出した大きさ $n$ の標本を確率変数 $X_1,X_2,\cdots,X_n$ とし、標本平均を $\bar{X}$ とする。 $Y$ の確率分布をもつ母集団を考え、この母集団から無作為に抽出した大きさ $n$ の標本を確率変数 $Y_1,Y_2,\cdots,Y_n$ とし、標本平均を $\bar{Y}$ とする。
(i) メモに書かれていた、 $t_2=2.50$ について考えよう。
花子さんは、 $\bar{X}=2.50$ となる確率 $P(\bar{X}=2.50)$ と $\bar{Y}=2.50$ となる確率 $P(\bar{Y}=2.50)$ を比較することで、太郎さんの記憶が正しいかどうかがわかるのではないかと考えた。
$\bar{X}=2.50$ となる確率は、 $X_1+X_2=5$ となる確率であり、(1)の $X$ の確率分布より\[ P(\bar{X}=2.50)=\dfrac{\myBox{セソ}}{64} \]となり、(1) の $Y$ の確率分布から、 $P(\bar{Y}=2.50)\ \dBox{タ}\ P(\bar{X}=2.50)$ が成り立つことがわかる。
このことから、花子さんは、 $t_2=2.50$ からでは太郎さんの記憶が正しいかどうかはわからないと考えた。
$\dbox{タ}$ の解答群
0: $\lt$
1: $=$
2: $\gt$
解説
(3)
(i)
$X_1+X_2=5$ となるのは、 $(X_1,X_2)$ が $(1,4)$, $(2,3)$, $(3,2)$, $(4,1)$ のどれかになるときなので、
\begin{eqnarray}
& &
\frac{7}{16}\cdot \frac{1}{16} +\frac{5}{16}\cdot \frac{3}{16} +\frac{3}{16}\cdot \frac{5}{16}+\frac{1}{16}\cdot \frac{7}{16} \\[5pt]
&=&
\frac{7+15+15+7}{16^2} \\[5pt]
&=&
\frac{44}{16^2} \\[5pt]
&=&
\frac{11}{16\cdot4}=\frac{11}{64} \\[5pt]
\end{eqnarray}となります。
また、 $X$ と $5-Y$ は同じ確率分布なので、 $X_1+X_2=5$ となる確率と、 $(5-Y_1)+(5-Y_2)=5$ となる確率は等しいです。後者は、 $Y_1+Y_2=5$ と変形できるので、結局、\[ P(\bar{Y}=2.50) = P(\bar{X}=2.50) \]となることがわかります。(「どちらかわからない」と言ってるのだから、文脈から、両者は等しいと予想できますが)
解答
セソ:11 (1点)タ:1 (1点)
解答編 つづき
問題
(ii) メモに書かれていた、 $t_{100}=2.95$ について考えよう。
$n$ が大きいとき、 $\bar{X}$ は近似的に正規分布 $N(E(\bar{X}), \{\sigma(\bar{X})\}^2)$ に従い、 $\sigma(\bar{X})=\dBox{チ}$ である。 $n=100$ は大きいので、 $\bar{X}=2.95$ であったとすると、推定される母平均を $m_X$ として、 $m_X$ の信頼度 95% の信頼区間は\[ \dBox{ツ} \leqq m_X \leqq \dBox{テ} \quad \cdots ① \]となる。一方、 $\bar{Y}=2.95$ であったとすると、推定される母平均を $m_Y$ として、 $m_Y$ の信頼度 95% の信頼区間は\[ \dBox{ト} \leqq m_Y \leqq \dBox{ナ} \quad \cdots ② \]となることもわかる。ただし、 $\dbox{ツ}$ ~ $\dbox{ナ}$ の計算においては、 $\sqrt{55}=7.4$ とする。
$\dbox{チ}$ の解答群
0: $\{\sigma(X)\}^2$
1: $\dfrac{\sigma(X)}{n}$
2: $\dfrac{\sigma(X)}{\sqrt{n}}$
3: $\dfrac{\{\sigma(X)\}^2}{n}$
$\dbox{ツ}$ ~ $\dbox{ナ}$ については、最も適当なものを、次の 0 ~ 8 のうちから一つずつ選べ。ただし、同じものを繰り返し選んでもよい。
0: 1.693
1: 1.875
2: 2.057
3: 2.740
4: 2.769
5: 2.798
6: 3.102
7: 3.131
8: 3.160
解説
(ii)
$X_1,X_2,\cdots,X_n$ の和の分散は $X$ の分散の $n$ 倍です。また、 $\dfrac{X_i}{n}$ の分散は $\dfrac{1}{n^2}$ 倍になります。よって、 $\bar{X}$ の分散は $X$ の分散の $\dfrac{1}{n}$ です。このことから、標準偏差は $\dfrac{1}{\sqrt{n}}$ 倍だとわかります。つまり、\[ \sigma(\bar{X})=\dfrac{\sigma(X)}{\sqrt{n}} \]となります。今のケースで具体的に計算すると\[ \sigma(\bar{X})=\frac{\frac{\sqrt{55}}{8}}{\sqrt{100}}=\frac{\sqrt{55}}{80} \]となります
95% 信頼区間を求めるために、正規分布表で 0.475 となる場所を探すと、 $z_0=1.96$ だとわかります。
よって
\begin{eqnarray}
&&-1.96 \leqq \frac{m_X-2.95}{\frac{\sqrt{55}}{80}} \leqq 1.96 \\[5pt]
&&-1.96 \cdot \frac{\sqrt{55}}{80} \leqq m_X-2.95 \leqq 1.96\cdot \frac{\sqrt{55}}{80} \\[5pt]
&&-0.0245 \sqrt{55} +2.95 \leqq m_X \leqq 0.0245\cdot \sqrt{55}+2.95 \\[5pt]
\end{eqnarray}となります。ここで、問題文にあるように $\sqrt{55}=7.4$ を使うと\[ 0.0245\sqrt{55}=0.0245\cdot 7.4=0.1813 \]なので
\begin{eqnarray}
-0.1813+2.95 &\leqq& m_X \leqq 0.1813+2.95 \\[5pt]
2.7687 &\leqq& m_X \leqq 3.1313 \\[5pt]
\end{eqnarray}となります。
$m_Y$ も同じ式になるので、同じ結果となります。
解答
チ:2 (1点)ツテ:47 (2点)
トナ:47 (2点)
解答編 つづき
問題
花子さんは、次の基準により太郎さんの記憶が正しいかどうかを判断することにした。ただし、基準が適用できない場合には、判断しないものとする。
基準
①の信頼区間に $E(X)$ が含まれていて、②の信頼区間に $E(Y)$ が含まれていないならば、太郎さんの記憶は正しいものとする。①の信頼区間に $E(X)$ が含まれず、②の信頼区間に $E(Y)$ が含まれているならば、太郎さんの記憶は正しくないものとする。$E(X)$ は①の信頼区間に $\dBox{ニ}$ 。 $E(Y)$ は②の信頼区間に $\dBox{ヌ}$ 。
以上より、太郎さんの記憶については、$\dBox{ネ}$ 。
$\dbox{ニ}$, $\dbox{ヌ}$ の解答群(同じものを繰り返し選んでもよい。)
0: 含まれている
1: 含まれていない$\dbox{ネ}$ については、最も適当なものを、次の 0 ~ 2 のうちから一つ選べ。
0: 正しいと判断され、メモに書かれていた $t_2$ と $t_{100}$ は「確率変数 $X$」 の平均値である
1: 正しくないと判断され、メモに書かれていた $t_2$ と $t_{100}$ は「確率変数 $Y$」 の平均値である
2: 基準が適用できないので、判断しない
解説
(2)より、 $E(X)=\dfrac{15}{8}=1.875$ です。また、 $E(Y)=\dfrac{25}{8}=3.125$ です。
よって、 $E(X) は、$先ほど求めた区間、 $2.769$ 以上 $3.131$ 以下に含まれておらず、 $E(Y)$ は含まれています。
このことから、基準により、太郎さんの記憶は正しくないと判断され、メモには $Y$ の平均値が書かれていたことになります。