連載
» 2016年01月13日 13時00分 UPDATE

山浦恒央の“くみこみ”な話(81):統計の食わず嫌いを直そう(その9)、昼休みにタダで統計分析をする方法 (1/3)

「統計分析」と聞くと面倒な感じですが、何を証明するか明確ならExcelで簡単にこなせます。Excelさえあれば追加費用はかからず、しかもランチタイムに終わるほどカンタンなのです。

[山浦恒央 東海大学 大学院 組込み技術研究科 准教授(工学博士),MONOist]

 ソフトウェア開発で生産性や品質を向上させるため、プロジェクトに新プロセスを導入する会社は多いと思います。上層部から改善効果を聞かれ、「まあまあいい感じで生産性が上がっていますよ」とテキトーに答えるのではエンジニア失格。統計的な分析手法を使い、具体的な数字をあげてカッコよく答えましょう。

 統計的分析と聞くと「なんだか面倒だな……」と萎縮しそうですが、「どんなことを証明したいか」が明確なら、Excelのツールを使えば超簡単。タダで、しかも、ランチの時間内に完了します。

ピザランチ ランチタイムに処理をExcelへ任せましょう

 前回(統計的に「王様の耳はロバの耳」と言うために)では、裏付け手法の「平均値の差の検定」の理論部分を紹介しました。今回は、お金も時間もかけず、簡単に統計分析するやり方を実際に1ステップずつ紹介します。

1.まずはツールの準備

 膨大なデータを人力で統計解析するのは、500人に電話でアンケート調査するほど面倒で、間違いも増えます。なにがなんでも、PC上のツールを使いましょう。筆者が学生のころ(注1)は統計計算を電卓をたたいて実施していました。今は、Excelに組み込まれた統計分析ツールを利用すればよいのです。電卓を使った手計算での統計分析が「自転車による移動」としたら、Excelのツールでの計算は「ボーイング767による世界旅行」ほどで、大きな進歩を実感します。

 通常必要な10種類程度の統計的分析法は、Excelで網羅しています。これさえあれば、後は歯ブラシ1本をポケットに入れれば、日本全国統計分析縦断ツアーに行けます。今回は、Excelの分析ツール(注2)を使って統計分析をしてみましょう。この分析ツールでは足りない超上級者は、「R」(注3)の統計ツールを使ってください。

(注1)カシオが、日本で最初に四則演算ができる(四則演算しかできない?)ポケット電卓、「カシオミニ」を1万2800円で発売して爆発的に売れたころ。同社が新聞に掲載した全面広告には、まな板ほど大きい電卓の写真が載っていたことを今でも覚えています。現在のコンピュータの劇的な進化に比べると、当時は「石器時代」でした。
(注2) 筆者のバージョンはExcel 2007です。その他のバージョンを考慮していませんのでご注意ください。
(注3)Rとはフリーの統計解析ツールです(正確にはオープンソースの統計処理言語/環境)。コマンドプロンプトやMATLABのようなコマンドベースでの操作ですので、一般の人にはとっつきにくいのが難点。

 Excel 2007では、「Excelオプション」→「アドイン」内の「データ分析」の項目にチェックマークを付け、アドインを有効にします。アドインが有効になると、画面上部の「データ」内に「データ分析」という部分が表示されます。

 今回は「データ分析」内の「一対の標本による平均の検定」を使用します。この分析手法はt検定と呼び、あらゆる分野のデータ分析で使います。詳細は割愛しますが、大枠の考え方は前回のコラムの内容と同じです。

 次に、データを整理します。「一対の標本による平均の検定」には、「対応有りのデータ」が必要です(「対応有り」の詳細は、前回のコラムを参照)。準備が整ったら、分析を開始します。

       1|2|3 次のページへ

Copyright© 2017 ITmedia, Inc. All Rights Reserved.