共通テスト 数学II・数学B 2024年度 第3問 解説
【第3問~第5問から2問選択】
問題編
問題
(正規分布表は省略しています)
以下の問題を解答するにあたっては、必要に応じて47ページの正規分布表を用いてもよい。また、ここでの晴れの定義については、気象庁の天気概況の「快晴」または「晴」とする。
(1) 太郎さんは、自分が住んでいる地域において、日曜日に晴れとなる確率を考えている。
晴れの場合は $1$、晴れ以外の場合は $0$ の値をとる確率変数を $X$ と定義する。また、 $X=1$ である確率を $p$ とすると、その確率分布は表1のようになる。
表1 $X$ $0$ $1$ 計 確率 $1-p$ $p$ $1$ この確率変数 $X$ の平均(期待値)を $m$ とすると\[ m=\dBox{ア} \]となる。
太郎さんは、ある期間における連続した $n$ 週の日曜日の天気を、表1の確率分布をもつ母集団から無作為に抽出した大きさ $n$ の標本とみなし、それらの $X$ を確率変数 $X_1,X_2,\cdots,X_n$ で表すことにした。そして、その標本平均 $\bar{X}$ を利用して、母平均 $m$ を推定しようと考えた。実際に $n=300$ として晴れの日数を調べたところ、表2のようになった。
表2 天気 日数 晴れ $75$ 晴れ以外 $225$ 計 $300$ 母標準偏差を $\sigma$ とすると、 $n=300$ は十分に大きいので、標本平均 $\bar{X}$ は近似的に正規分布 $N\left(\dBox{イ}\right)$ に従う。
一般に、母標準偏差 $\sigma$ がわからないとき、標本の大きさ $n$ が大きければ、 $\sigma$ の代わりに標本の標準偏差 $S$ を用いてもよいことが知られている。 $S$ は
\begin{eqnarray} S &=& \sqrt{\frac{1}{n}\{(X_1-\bar{X})^2+(X_2-\bar{X})^2+\cdots+(X_n-\bar{X})^2\}} \\[5pt] &=& \sqrt{\frac{1}{n}(X_1^2+X_2^2+\cdots+X_n^2)-\dBox{ウ}} \\[5pt] \end{eqnarray}で計算できる。ここで、 $X_1^2=X_1$, $X_2^2=X_2$, $\cdots$, $X_n^2=X_n$ であることに着目し、右辺を整理すると、 $S=\sqrt{\dBox{エ}}$ と表されることがわかる。よって、表2より、大きさ $n=300$ の標本から求められる母平均 $m$ に対する信頼度95% の信頼区間は $\dBox{オ}$ となる。
$\dBox{ア}$ の解答群
0: $p$
1: $p^2$
2: $1-p$
3: $(1-p)^2$$\dBox{イ}$ の解答群
0: $\sigma$
1: $\sigma^2$2: $\dfrac{\sigma}{n}$
3: $\dfrac{\sigma^2}{n}$
4: $\dfrac{\sigma}{\sqrt{n}}$
$\dBox{ウ}$, $\dBox{エ}$ の解答群(同じものを繰り返し選んでもよい。)
0: $\bar{X}$
1: $(\bar{X})^2$
2: $\bar{X}(1-\bar{X})$
3: $1-\bar{X}$$\dBox{オ}$ については、最も適当なものを、次の 0 ~ 5 のうちから一つ選べ。
0: $0.201\leqq m \leqq 0.299$
1: $0.209\leqq m \leqq 0.291$
2: $0.225\leqq m \leqq 0.250$
3: $0.225\leqq m \leqq 0.275$
4: $0.247\leqq m \leqq 0.253$
5: $0.250\leqq m \leqq 0.275$(2) ある期間において、「ちょうど3週続けて日曜日の天気が晴れになること」がどのくらいの頻度で起こり得るのかを考察しよう。以下では、連続する $k$ 週の日曜日の天気について、(1)の太郎さんが考えた確率変数のうち $X_1,X_2,\cdots,X_k$ を用いて調べる。ただし、 $k$ は $3$ 以上 $300$ 以下の自然数とする。
$X_1,X_2,\cdots,X_k$ の値を順に並べたときの $0$ と $1$ からなる列において、「ちょうど三つ続けて $1$ が現れる部分」を $\mathrm{A}$ とし、 $\mathrm{A}$ の個数を確率変数 $U_k$ で表す。例えば、 $k=20$ とし、 $X_1,X_2,\cdots,X_{20}$ の値を順に並べたとき\[ 1,1,1,1,0, \underset{\mathrm{A}}{\underline{1,1,1}} ,0,0,1,1,1,1,1,0,0, \underset{\mathrm{A}}{\underline{1,1,1}} \]であったとする。この例では、下線部分は $\mathrm{A}$ を示しており、$1$ が四つ以上続く部分は $\mathrm{A}$ とはみなさないので、 $U_{20}=2$ となる。
$k=4$ のとき、 $X_1,X_2,X_3,X_4$ のとり得る値と、それに対応した $U_4$ の値を書き出すと、表3のようになる。
$X_1$ $X_2$ $X_3$ $X_4$ $U_4$ 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 1 1 0 0 0 1 0 1 0 0 1 0 0 1 0 0 1 1 0 0 0 1 0 1 0 0 0 1 1 0 1 1 1 0 1 1 1 0 1 0 1 0 1 1 0 0 1 1 1 1 1 1 1 1 0 ここで、 $U_k$ の期待値を求めてみよう。(1)における $p$ の値を $p=\dfrac{1}{4}$ とする。 $k=4$ のとき、 $U_4$ の期待値は\[ E(U_4)=\dfrac{\myBox{カ}}{128} \]となる。 $k=5$ のとき、 $U_5$ の期待値は\[ E(U_5)=\dfrac{\myBox{キク}}{1024} \]となる。
$4$ 以上の $k$ について、 $k$ と $E(U_k)$ の関係を詳しく調べると、座標平面上の点 $(4,E(U_4))$, $(5,E(U_5))$, $\cdots$, $(300,E(U_{300}))$ は一つの直線上にあることがわかる。この事実によって\[ E(U_{300})=\dfrac{\myBox{ケコ}}{\myBox{サ}} \]となる。
考え方
(1)は平均、標準偏差、信頼区間を求めるといった、定番の問題です。
(2)は、統計というよりは確率の問題です。最後は、問題文に書いてあるヒントを使えば、答えを出すだけならそれほど難しくはないでしょう。なぜそのヒントが成り立つかをちゃんと考えるのは難しいです。
【第3問~第5問から2問選択】
解答編
問題
(正規分布表は省略しています)
以下の問題を解答するにあたっては、必要に応じて47ページの正規分布表を用いてもよい。また、ここでの晴れの定義については、気象庁の天気概況の「快晴」または「晴」とする。
(1) 太郎さんは、自分が住んでいる地域において、日曜日に晴れとなる確率を考えている。
晴れの場合は $1$、晴れ以外の場合は $0$ の値をとる確率変数を $X$ と定義する。また、 $X=1$ である確率を $p$ とすると、その確率分布は表1のようになる。
表1 $X$ $0$ $1$ 計 確率 $1-p$ $p$ $1$ この確率変数 $X$ の平均(期待値)を $m$ とすると\[ m=\dBox{ア} \]となる。
$\dBox{ア}$ の解答群
0: $p$
1: $p^2$
2: $1-p$
3: $(1-p)^2$
解説
(1) $X$ の平均 $m$ は
\begin{eqnarray}
m = 1\cdot p+0\cdot(1-p)=p
\end{eqnarray}となります。
解答
ア:0 (2点)
解答編 つづき
問題
太郎さんは、ある期間における連続した $n$ 週の日曜日の天気を、表1の確率分布をもつ母集団から無作為に抽出した大きさ $n$ の標本とみなし、それらの $X$ を確率変数 $X_1,X_2,\cdots,X_n$ で表すことにした。そして、その標本平均 $\bar{X}$ を利用して、母平均 $m$ を推定しようと考えた。実際に $n=300$ として晴れの日数を調べたところ、表2のようになった。
表2 天気 日数 晴れ $75$ 晴れ以外 $225$ 計 $300$ 母標準偏差を $\sigma$ とすると、 $n=300$ は十分に大きいので、標本平均 $\bar{X}$ は近似的に正規分布 $N\left(\dBox{イ}\right)$ に従う。
$\dBox{イ}$ の解答群
0: $\sigma$
1: $\sigma^2$2: $\dfrac{\sigma}{n}$
3: $\dfrac{\sigma^2}{n}$
4: $\dfrac{\sigma}{\sqrt{n}}$
解説
$n=300$ は十分に大きいので、標本平均 $\bar{X}$ は近似的に正規分布 $N\left(m,\dfrac{\sigma^2}{n}\right)$ に従います(参考:【基本】標本平均の分布と正規分布)。
解答
イ:3 (2点)
解答編 つづき
問題
一般に、母標準偏差 $\sigma$ がわからないとき、標本の大きさ $n$ が大きければ、 $\sigma$ の代わりに標本の標準偏差 $S$ を用いてもよいことが知られている。 $S$ は
\begin{eqnarray} S &=& \sqrt{\frac{1}{n}\{(X_1-\bar{X})^2+(X_2-\bar{X})^2+\cdots+(X_n-\bar{X})^2\}} \\[5pt] &=& \sqrt{\frac{1}{n}(X_1^2+X_2^2+\cdots+X_n^2)-\dBox{ウ}} \\[5pt] \end{eqnarray}で計算できる。ここで、 $X_1^2=X_1$, $X_2^2=X_2$, $\cdots$, $X_n^2=X_n$ であることに着目し、右辺を整理すると、 $S=\sqrt{\dBox{エ}}$ と表されることがわかる。よって、表2より、大きさ $n=300$ の標本から求められる母平均 $m$ に対する信頼度95% の信頼区間は $\dBox{オ}$ となる。
$\dBox{ウ}$, $\dBox{エ}$ の解答群(同じものを繰り返し選んでもよい。)
0: $\bar{X}$
1: $(\bar{X})^2$
2: $\bar{X}(1-\bar{X})$
3: $1-\bar{X}$$\dBox{オ}$ については、最も適当なものを、次の 0 ~ 5 のうちから一つ選べ。
0: $0.201\leqq m \leqq 0.299$
1: $0.209\leqq m \leqq 0.291$
2: $0.225\leqq m \leqq 0.250$
3: $0.225\leqq m \leqq 0.275$
4: $0.247\leqq m \leqq 0.253$
5: $0.250\leqq m \leqq 0.275$
解説
標本の標準偏差 $S$ を求めるために、これを2乗したものを考えると
\begin{eqnarray}
S^2
&=&
\frac{1}{n} \{ (X_1-\bar{X})^2+(X_2-\bar{X})^2+\cdots +(X_n-\bar{X})^2 \} \\[5pt]
&=&
\frac{X_1^2+X_2^2+\cdots+X_n^2}{n} \\[5pt]
& & -\frac{2(X_1+X_2+\cdots+X_n)\bar{X}}{n} \\[5pt]
& & +\frac{n(\bar{X})^2}{n} \\[5pt]
&=&
\frac{X_1^2+X_2^2+\cdots+X_n^2}{n} \\[5pt]
& & -\frac{2(n\bar{X})\bar{X}}{n} +\frac{n(\bar{X})^2}{n} \\[5pt]
&=&
\frac{X_1^2+X_2^2+\cdots+X_n^2}{n}-(\bar{X})^2 \\[5pt]
\end{eqnarray}となります。ここで、 $\bar{X}=\dfrac{X_1+X_2+\cdots+X_n}{n}$ であることを使っています。この式から
\begin{eqnarray}
S
&=&
\sqrt{ \frac{X_1^2+X_2^2+\cdots+X_n^2}{n}-(\bar{X})^2 }
\end{eqnarray}となります。
さらに、 $X_i^2=X_i$ であることを使うと
\begin{eqnarray}
S
&=&
\sqrt{\frac{X_1^2+X_2^2+\cdots+X_n^2}{n}-(\bar{X})^2} \\[5pt]
&=&
\sqrt{\frac{X_1+X_2+\cdots+X_n}{n}-(\bar{X})^2} \\[5pt]
&=&
\sqrt{\bar{X}-(\bar{X})^2} \\[5pt]
&=&
\sqrt{\bar{X}(1-\bar{X})} \\[5pt]
\end{eqnarray}と表すことができます。
表2より、 $\bar{X}=\dfrac{75}{300}=\dfrac{1}{4}$ だから、標本の標準偏差 $S$ は、上の式に代入して $\dfrac{\sqrt{3}}{4}$ と求められます。0.4975 の値を正規分布表から探すと、 $z_0=1.96$ とわかるので、信頼度95% の信頼区間は
\begin{eqnarray}
& & \bar{X} -1.96\cdot \frac{S}{\sqrt{n}} \leqq m \leqq \bar{X} +1.96\cdot \frac{S}{\sqrt{n}} \\[5pt]
& & \frac{1}{4} -1.96\cdot \frac{\frac{\sqrt{3}}{4}}{\sqrt{300}} \leqq m \leqq \frac{1}{4} +1.96\cdot \frac{\frac{\sqrt{3}}{4}}{\sqrt{300}} \\[5pt]
& & 0.25 -1.96\cdot \frac{1}{40} \leqq m \leqq 0.25 +1.96\cdot \frac{1}{40} \\[5pt]
& & 0.25 -0.049 \leqq m \leqq 0.25 +0.049 \\[5pt]
& & 0.201 \leqq m \leqq 0.299 \\[5pt]
\end{eqnarray}と求められます。
解答
ウエ:12 (3点)
オ:0 (3点)
解答編 つづき
問題
(2) ある期間において、「ちょうど3週続けて日曜日の天気が晴れになること」がどのくらいの頻度で起こり得るのかを考察しよう。以下では、連続する $k$ 週の日曜日の天気について、(1)の太郎さんが考えた確率変数のうち $X_1,X_2,\cdots,X_k$ を用いて調べる。ただし、 $k$ は $3$ 以上 $300$ 以下の自然数とする。
$X_1,X_2,\cdots,X_k$ の値を順に並べたときの $0$ と $1$ からなる列において、「ちょうど三つ続けて $1$ が現れる部分」を $\mathrm{A}$ とし、 $\mathrm{A}$ の個数を確率変数 $U_k$ で表す。例えば、 $k=20$ とし、 $X_1,X_2,\cdots,X_{20}$ の値を順に並べたとき\[ 1,1,1,1,0, \underset{\mathrm{A}}{\underline{1,1,1}} ,0,0,1,1,1,1,1,0,0, \underset{\mathrm{A}}{\underline{1,1,1}} \]であったとする。この例では、下線部分は $\mathrm{A}$ を示しており、$1$ が四つ以上続く部分は $\mathrm{A}$ とはみなさないので、 $U_{20}=2$ となる。
$k=4$ のとき、 $X_1,X_2,X_3,X_4$ のとり得る値と、それに対応した $U_4$ の値を書き出すと、表3のようになる。
$X_1$ $X_2$ $X_3$ $X_4$ $U_4$ 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 1 1 0 0 0 1 0 1 0 0 1 0 0 1 0 0 1 1 0 0 0 1 0 1 0 0 0 1 1 0 1 1 1 0 1 1 1 0 1 0 1 0 1 1 0 0 1 1 1 1 1 1 1 1 0 ここで、 $U_k$ の期待値を求めてみよう。(1)における $p$ の値を $p=\dfrac{1}{4}$ とする。 $k=4$ のとき、 $U_4$ の期待値は\[ E(U_4)=\dfrac{\myBox{カ}}{128} \]となる。 $k=5$ のとき、 $U_5$ の期待値は\[ E(U_5)=\dfrac{\myBox{キク}}{1024} \]となる。
解説
(2)
$k=4$ のとき、$U_4$ が $1$ となるのは、「1110」か「0111」の2通りなので、こうなる確率は
\begin{eqnarray}
2\cdot\frac{1}{4^3}\cdot\frac{3}{4} &=& \frac{3}{128}
\end{eqnarray}となります。これ以外は $U_4=0$ なので、 $U_4$ の期待値は $\dfrac{3}{128}$ となります。
$k=5$ のとき、$U_5$ が $1$ となるのは、「1110x」か「01110」か「x0111」です。ここで、xは0でも1でもいいことをあらわします。これより、$U_5=1$ となる確率は
\begin{eqnarray}
& &
\frac{1}{4^3}\cdot\frac{3}{4}+\frac{3}{4}\cdot\frac{1}{4^3}\cdot\frac{3}{4}+\frac{1}{4^3}\cdot\frac{3}{4} \\[5pt]
&=&
\frac{12+9+12}{4^5} \\[5pt]
&=&
\frac{33}{1024} \\[5pt]
\end{eqnarray}となります。これ以外は $U_5=0$ なので、 $U_5$ の期待値は $\dfrac{33}{1024}$ となります。
解答
カ:3 (3点)
キク:33 (3点)
解答編 つづき
問題
$4$ 以上の $k$ について、 $k$ と $E(U_k)$ の関係を詳しく調べると、座標平面上の点 $(4,E(U_4))$, $(5,E(U_5))$, $\cdots$, $(300,E(U_{300}))$ は一つの直線上にあることがわかる。この事実によって\[ E(U_{300})=\dfrac{\myBox{ケコ}}{\myBox{サ}} \]となる。
解説
問題文に書いてあるヒントを使うと(これがなぜ正しいかは後で書きます)、直線 $y=ax+b$ 上に $(k,E(U_k))$ があるとして $\dfrac{3}{128}=4a+b$ と $\dfrac{33}{1024}=5a+b$ から考えればいいです。これを解くと、 $a=\dfrac{9}{1024}$, $b=-\dfrac{12}{1024}$ なので、
\begin{eqnarray}
E(U_{300})
&=&
\frac{9}{1024}\cdot 300-\dfrac{12}{1024} \\[5pt]
&=&
\frac{2688}{1024} \\[5pt]
&=&
\frac{336}{128} \\[5pt]
&=&
\frac{21}{8} \\[5pt]
\end{eqnarray}と求められます。
では、問題文に書いてあるように、なぜ一つの直線上にあることがわかるかを考えます(ここは難しいので飛ばしてもかまいません)。
$k$ を $4$ 以上の整数として、$k$ のときと $k+1$ のときで、Aの個数(ちょうど三つ続けて1が現れる部分の個数)がどう変わるかを考えます。
$X_1,X_2,\cdots,X_k$ と並べたとき、最後が 0 で終わるか、1 で終わるかのどちらかです。さらに 1 で終わるものは、01 で終わるものと、11 で終わるものがあります。11 で終わるものは、011 と 111 で終わる可能性があり、 111 で終わるものは、 0111 と 1111 の可能性があります。
まとめると、最後の終わり方は、次の5つのパターンがあり、これらには重複はなく、これら以外のパターンはありません。
・0 で終わる
・01 で終わる
・011 で終わる
・0111 で終わる
・1111 で終わる
0 で終わる場合、 $X_{k+1}$ が 0 でも 1 でも、Aの個数は変わりません。同様に、01 で終わる場合、1111 で終わる場合も同様です。 $X_{k+1}$ が 0 でも 1 でも、Aの個数は変わりません。
一方、 011 で終わる場合、 $X_{k+1}$ が 0 でも Aの個数は変わりませんが、 1 なら、どのケースでもAの個数は1個増えます。
0111 で終わる場合、 $X_{k+1}$ が 0 でも Aの個数は変わりませんが、 1 なら、どのケースでもAの個数は1個減ります。
つまり、 $k$ までの場合と $k+1$ までの場合とを比較すると、次のことがいえます。
・$k$ までが 011 で終わり、$k+1$ が 1 の場合、Aの個数は1増える
・$k$ までが 0111 で終わり、$k+1$ が 1 の場合、Aの個数は1減る
・他のケースではAの個数は変わらない
つまり、$k$ までを基準に考えると、 $k+1$ までの場合は、 $\dfrac{3}{4^4}$ の確率で Aの個数は1増え、 $\dfrac{3}{4^5}$ の確率で Aの個数が1減るので、期待値は
\begin{eqnarray}
E(U_{k+1})
&=&
E(U_{k})+\frac{3}{4^4}-\dfrac{3}{4^5} \\[5pt]
&=&
E(U_{k})+\frac{12-3}{4^5} \\[5pt]
&=&
E(U_{k})+\frac{9}{1024} \\[5pt]
\end{eqnarray}となり、差が一定なので、 $(k,E(U_k))$ ($k=4,5,6,\cdots$) は一つの直線上にあることがわかります。
解答
ケコサ:218 (4点)