統計の食わず嫌いを直そう(その11)、5分で残存バグ数を予測する方法山浦恒央の“くみこみ”な話(83)(3/4 ページ)

» 2016年03月24日 07時00分 公開

 今回は、表.1のデータを使用します。

表.1 プロジェクトデータ 表.1 プロジェクトデータ

 表.1は筆者がでたらめに作成した開発データ(ステップ数、バグ数)を表したものです。今回求める予測式は、ソースコード行数からバグ数を算出する式とします。具体的な計算は、全てツールが実施してくれます。実行方法は、Excelの上部にあるタブを「データ」→「データ分析」→「回帰分析」の順に選択すると、図.2のように、回帰分析用の画面が現れます(「データ分析」タブがない場合は、「Excelのオプション」から「アドイン」を選んで、「分析ツール」を導入してください。

図.2 Excel画面の例 図.2 Excel画面の例

 図.2の回帰分析用の画面で、以下のように「バグ数」を入力します。

  • 「入力Y範囲」にカーソルをセットする(求めるのはバグ数でY)。
  • 十字カーソルをプロジェクト1のバグ数である「145(C3)」へ動かしクリックする。
  • 同様に、十字のカーソルをプロジェクト10のバグ数である「187(C12)」へ移動し、「shiftキー」を押しながらクリックする(範囲指定)。
  • 「入力Y範囲」に、「$C$3:$C$12」が表示される(図.3参照)。

 同様に、以下のステップで「ソースコード行数」を入力します。

  • 「入力X範囲」にカーソルをセットする。
  • 十字のカーソルをプロジェクト1のソースコード行数である「1340(D3)」へ動かし、クリックする。
  • 同様に、十字のカーソルをプロジェクト10のソースコード行数である「1930(D12)」へ移動し、「shiftキー」を押しながらクリックする(範囲指定)。
  • 「入力X範囲」に、「$D$3:$D$12」が表示される(図.3参照)。
図.3 Excel画面の入力例 図.3 Excel画面の入力例

 上記の操作の後、回帰分析画面の右上にある「OK」をクリックすると、新しいシート(例えば、sheet4)に、図.4のような分析結果が出ます(結果を出力する場所は、任意に指定できます)。

図.4 Excelでの回帰分析結果の例 図.4 Excelでの回帰分析結果の例

 図.4ではたくさんの数字が出てきますが、最も注目すべきところは、赤で囲んだ部分です(*3)。結果として、残存バグ数を求める予測式はy = 0.08x + 29.34となります。つまり、コード行数が1000行の場合、残存バグ数 = 0.08 * 1000 + 29.34となり、80+29 = 109個と予測できます。

 上記の結果を用いれば、テストの開始時にソースコード行数を代入し、テスト終了条件が統計的に決定できます。

(*3) その他に注目するべき項目はありますが、誌面の関係上、結果だけとしました。

Copyright © ITmedia, Inc. All Rights Reserved.