【基本】仮説検定の考え方
ここでは、仮説を統計学的に検証する手法である、仮説検定について見ていきます。
仮説検定
昔、ドイツにサッカーの試合結果を当てるタコがいる、と話題になったことがあります。
このタコは、2008年にドイツが出場した6試合中4試合の勝敗を当てました。また、2010年のワールドカップでは、ドイツが出場した7試合と決勝戦、合計8試合すべての勝敗を当てました。
14試合中12試合を的中させたことになります。この結果を見て、「このタコはすごい」と思う人もいれば、「ただの偶然でしょ」と思う人もいるでしょう。
こうしたときに、結果を統計的に検証する方法として、仮説検定(hypothesis testing) があります。
仮説検定は、以下のようなステップで行います。
- STEP.1仮説を設定する導きたい結論を否定する仮説を立てる
- STEP.2有意水準を設定する通常は、5%や1%を設定する
- STEP.3確率を求める仮説が正しいとして、起こる確率を求める
- STEP.4検証する計算した確率と有意水準とを比較する
1つ目の仮説設定では、導きたい結論を否定する仮説を立てます。冒頭の例で「このタコの予想はよく当たる」をいう場合は、「このタコはでたらめに予想している」という仮説を立てます。
このような、価値のない仮説、何の関係もないという仮説のことを帰無仮説(きむかせつ、null hypothesis) といいます。一方、導きたい結論の方を、対立仮説(alternative hypothesis) といいます。今の例だと「でたらめだ」が帰無仮説、「よく当たる」が対立仮説です。
そして、この帰無仮説が正しいとして、統計結果をどう判断するかを考えます。
今の例であれば、14試合中12試合が当たっています。これとこれより極端な結果を合わせた「14試合中12試合以上で結果が当たる」確率を考えます。でたらめに勝敗を予想していた場合、投げたコインの表裏を当てるのと変わりません。コインを14回投げて12回以上表になる確率は、次のように計算できます。(参考:【基本】反復試行の確率)
\begin{eqnarray} & & {}_{14}\mathrm{C}_{12} \left(\frac{1}{2}\right)^{14} +{}_{14}\mathrm{C}_{13} \left(\frac{1}{2}\right)^{14} +{}_{14}\mathrm{C}_{14} \left(\frac{1}{2}\right)^{14 }\\[5pt] &=& \frac{91+14+1}{2^{14}} \\[5pt] &=& 0.00646\cdots \end{eqnarray}つまり、「でたらめに予想している」としたら、0.6%くらいの確率でしか起こないことが起きたことになる、というわけです。これはさすがに小さすぎるので「でたらめだ」と考えるのは無理があるよね、と判断します。確率が小さすぎるかどうか判定する水準のことを、有意水準と言います。この水準は事前に決めておくのが普通ですが、多くの場合、5%や1%と設定されます。
こうして、有意水準を下回っていた場合は、もともと設定していた仮説(帰無仮説)を否定します。このことを棄却するといいます。
帰無仮説が棄却された場合、通常は、対立仮説が正しいと判断します。
示したいことを否定すると、すごく確率の低いことが起こったことになるので、はじめに否定したのは間違ってたね、という流れです。結論を否定して話を始めるのは、背理法に似ていますね。(参考:【基本】背理法)
仮説検定の注意点
先ほど見た通り、仮説検定で求めた確率が有意水準を下回っている場合は、帰無仮説は棄却されます。このとき、厳密にいえば、示した内容は「対立仮説が正しいこと」ではなく、「帰無仮説が正しくなさそうだということ」です。
タコの例でいえば、示したことは「でたらめに予想しているとはいえない」ですが、そこですぐに「よく当たる」まで言えるかというと、少し乖離があるでしょう。
例えば、(上のウィキペディア内でも指摘がありますが)タコを誘導した人がいたのではないか、とか、一般的なタコが持っている習性を利用したのではないか、などという可能性もあります。具体的には、タコの好きな色がドイツ国旗に使われているためタコはドイツを選びやすく、サッカーではドイツがほとんど勝ったため、結果として予想が当たっているように見えただけではないか、といった指摘があります。
帰無仮説の棄却は、「対立仮説が正しいこと」を補強する手段の一つであり、すぐさま対立仮説の証明になるわけではありません。データのとり方に問題がなかったか、なども調べる必要があるでしょう。
確率を計算した結果、有意水準を上回らないケースもありえます。
タコの例で、14試合中9試合しか当ててなかったとしましょう。このとき、でたらめに予想して9試合以上当たる確率は計算すると21%もあることがわかるので、帰無仮説は棄却できません。この場合は、「帰無仮説は正しい」ではなく、「帰無仮説が間違っているとはいえない」ことが示されることになります。この結果からは、「でたらめ」とも言えないし、「予想が当たる」とも言えません。
おわりに
ここでは、仮説検定について見てきました。否定がいろんなところに出てくるので何をやっているのかわかりづらいかもしれませんが、やっていることは「データから言えない内容を消していくこと」だと意識しましょう。