その前に、統計学でよく使う「対応あり」「対応なし」について解説します。「対応なし」とは「比較するデータが異なる固体となる」ことを意味します。「対応あり」は、同じデータを前後で比較するときに使用します。学校のテストで考えると、同じ人が異なるテストを2回受ける場合は「対応あり」、別々の人間がテストを受ける場合は「対応無し」と考えれば分かりやすいでしょう。

　今回のデータでは、対応のない母平均の差の検定（Z検定）を用います。母平均の差の検定には、データ数、対応有・無、標準偏差が有・無、データの分布によって、必要なデータと計算式が異なります。詳しい話は次回紹介します。

　今回使用するデータは次のようになり、これを収集しておきます（Excelで容易に計算できます）。

標本の大きさ
標本平均
標本標準偏差

2.3　検定統計量を計算する

　検定統計量を計算します。この「検定統計量」という五文字熟語は、日本語では難解に見えますが、英語では「test statistic」と簡単な言葉に化けます（海外の専門用語を日本語に翻訳する場合、シリアスな字面の漢字だらけの熟語を選ぶのは、日本の学者の悪いクセです）。

　要は仮説が正しいかどうかを検定するための値であり、この大小によって、仮設、例えば、「導入ツールに効果があった」「王様の耳はロバの耳である」と判定できたり、できなかったりします。「検定統計量」は、標本のデータから、決まったアルゴリズムで計算します。この「計算式」は非常に複雑で、例えば、Z検定では次のような計算式になります。

検定統計量の計算式例

　式は、手計算ではなく、Excelが自動計算してくれますので、複雑さを気にする必要はありません。重要なのはどの式を選ぶかです。

2.4　有意水準を決定し、検証する

　有意水準αを決め、臨界値を求めます。

　なにやら難しい四文字熟語が出てきました。「有意水準」とは、仮説が正しいどうかを判断する基準となる確率のことです。簡単に言うと何％が信頼できるかを表したものです。これは分析者が決定しますが、通常は5％、厳しくしたい場合は1％で考えます。5％の場合は「95％以上信頼できそうだ」、1％の場合は「99％以上信頼できそうだ」となるのです。

　「臨界値」とは、例えば「95％以上信頼できる」ために、上記で求めた「検定統計量」がどの範囲内でなければならないかの上限値、下限値です。

　求めた臨界値と2.3で求めた検定統計量が採択域と棄却域のどちらに入るか判断します。これは正規分布で表します。正規分布とは図.2のようにデータの分布が平均値を頂点とした左右対称の山形で表すものです。採択域と棄却域は、2.1で示した対立仮説の種類によって異なります。ちなみに臨界値は、両側の場合5％の場合1.96、片側の場合1.645となります。以下にそれぞれのパターンを示します。

組み込み開発の記事ランキング

よく読まれている編集記者コラム

RSSフィード

MONOistについて

会員メニュー

公式SNS

Facebook
X

ITmediaはアイティメディア株式会社の登録商標です。

統計の食わず嫌いを直そう（その8）、統計的に「王様の耳はロバの耳」と言うために：山浦恒央の“くみこみ”な話（80）（3/4 ページ）

2.2　データを整理する

2.3　検定統計量を計算する

2.4　有意水準を決定し、検証する

関連キーワード

リスクマネジメント | 組み込み | プロジェクトマネジメント | ソフトウェアテスト | 山浦恒央の“くみこみ”な話

組み込み開発の記事ランキング

よく読まれている編集記者コラム

ラズパイの電源を入れてみた

「東京ばな奈」の無人店舗　実は“屋外”への第一歩

アップルに見る環境対策の次の技術トレンド

RSSフィード

MONOistについて

会員メニュー

公式SNS

統計の食わず嫌いを直そう（その8）、統計的に「王様の耳はロバの耳」と言うために：山浦恒央の“くみこみ”な話（80）（3/4 ページ）

2.2 データを整理する

2.3 検定統計量を計算する

2.4 有意水準を決定し、検証する

関連キーワード

リスクマネジメント | 組み込み | プロジェクトマネジメント | ソフトウェアテスト | 山浦恒央の“くみこみ”な話

組み込み開発の記事ランキング

よく読まれている編集記者コラム

ラズパイの電源を入れてみた

「東京ばな奈」の無人店舗 実は“屋外”への第一歩

アップルに見る環境対策の次の技術トレンド

RSSフィード

MONOistについて

会員メニュー

公式SNS

2.2　データを整理する

2.3　検定統計量を計算する

2.4　有意水準を決定し、検証する

「東京ばな奈」の無人店舗　実は“屋外”への第一歩