連載
» 2015年12月01日 07時00分 公開

山浦恒央の“くみこみ”な話(80):統計の食わず嫌いを直そう(その8)、統計的に「王様の耳はロバの耳」と言うために (3/4)

[山浦恒央 東海大学 大学院 組込み技術研究科 准教授(工学博士),MONOist]

2.2 データを整理する

 次に統計式に合わせたデータを収集、整理します。

 その前に、統計学でよく使う「対応あり」「対応なし」について解説します。「対応なし」とは「比較するデータが異なる固体となる」ことを意味します。「対応あり」は、同じデータを前後で比較するときに使用します。学校のテストで考えると、同じ人が異なるテストを2回受ける場合は「対応あり」、別々の人間がテストを受ける場合は「対応無し」と考えれば分かりやすいでしょう。

 今回のデータでは、対応のない母平均の差の検定(Z検定)を用います。母平均の差の検定には、データ数、対応有・無、標準偏差が有・無、データの分布によって、必要なデータと計算式が異なります。詳しい話は次回紹介します。

 今回使用するデータは次のようになり、これを収集しておきます(Excelで容易に計算できます)。

  • 標本の大きさ
  • 標本平均
  • 標本標準偏差

2.3 検定統計量を計算する

 検定統計量を計算します。この「検定統計量」という五文字熟語は、日本語では難解に見えますが、英語では「test statistic」と簡単な言葉に化けます(海外の専門用語を日本語に翻訳する場合、シリアスな字面の漢字だらけの熟語を選ぶのは、日本の学者の悪いクセです)。

 要は仮説が正しいかどうかを検定するための値であり、この大小によって、仮設、例えば、「導入ツールに効果があった」「王様の耳はロバの耳である」と判定できたり、できなかったりします。「検定統計量」は、標本のデータから、決まったアルゴリズムで計算します。この「計算式」は非常に複雑で、例えば、Z検定では次のような計算式になります。

検定統計量の計算式例 検定統計量の計算式例

 式は、手計算ではなく、Excelが自動計算してくれますので、複雑さを気にする必要はありません。重要なのはどの式を選ぶかです。

2.4 有意水準を決定し、検証する

 有意水準αを決め、臨界値を求めます。

 なにやら難しい四文字熟語が出てきました。「有意水準」とは、仮説が正しいどうかを判断する基準となる確率のことです。簡単に言うと何%が信頼できるかを表したものです。これは分析者が決定しますが、通常は5%、厳しくしたい場合は1%で考えます。5%の場合は「95%以上信頼できそうだ」、1%の場合は「99%以上信頼できそうだ」となるのです。

 「臨界値」とは、例えば「95%以上信頼できる」ために、上記で求めた「検定統計量」がどの範囲内でなければならないかの上限値、下限値です。

 求めた臨界値と2.3で求めた検定統計量が採択域と棄却域のどちらに入るか判断します。これは正規分布で表します。正規分布とは図.2のようにデータの分布が平均値を頂点とした左右対称の山形で表すものです。採択域と棄却域は、2.1で示した対立仮説の種類によって異なります。ちなみに臨界値は、両側の場合5%の場合1.96、片側の場合1.645となります。以下にそれぞれのパターンを示します。

Copyright © ITmedia, Inc. All Rights Reserved.