Upload
garima
View
38
Download
0
Embed Size (px)
DESCRIPTION
データ白書の見方・使い方(1). データ白書の見方・使い方. 『 ソフトウェア開発定量データ白書 』 について、以下の点を ご理解いただき、データ白書のご活用と定量データの 普及・展開を推進いただけるようお願いいたします。 白書利用の効果、目指す先を共有するため、 必要性と目的 を理解する。 白書を正しく利用するため、 収集方針を含むデータ概要 を理解する。 分析結果を正しく認識するため、 参照時の留意点 を理解する。 実践的に利用できるようになるため、 データの活用方法 を理解する。. 内容:データ白書の見方・使い方. 1章 背景と本書の目的 - PowerPoint PPT Presentation
Citation preview
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
1Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
データ白書の見方・使い方(1)
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
2Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
データ白書の見方・使い方
『ソフトウェア開発定量データ白書』について、以下の点をご理解いただき、データ白書のご活用と定量データの普及・展開を推進いただけるようお願いいたします。
白書利用の効果、目指す先を共有するため、必要性と目的を理解する。
白書を正しく利用するため、収集方針を含むデータ概要を理解する。
分析結果を正しく認識するため、参照時の留意点を理解する。
実践的に利用できるようになるため、データの活用方法を理解する。
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
3Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
内容:データ白書の見方・使い方
1章 背景と本書の目的 2章 収集データについて 3章 分析について 4章 収集データのプロファイル 5章 プロジェクトの主要要素の統計(6章~10章)
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
4Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
1.1 IT産業を取り巻く環境(1)
近年のIT産業を取り巻く環境について
市場競争の激化
トラブルの多発
・低コスト、短期開発・多機能、高性能
安全・安心の確保要請が増大
・信頼のおけるマネジメント・トラブル発生未然抑止
人海戦術的な対処方法での対応
不適切な見積、生産性の見誤り
システムへの要求が増大
KKD (勘、経験、度胸)
ネットワークの普及
ビジネスモデルの転換
リスクの増大
期待・ニー
ズ理 想理 想理 想理 想
現 実現 実現 実現 実
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
5Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
1.1 IT産業を取り巻く環境(2)
社会的な動向への対応工事進行基準の適用:
プロジェクトの進捗部分について「成果の確実性」が認められる 場合に適用される。
高い見積り精度と確実性、客観性が求められる。
「成果の確実性」とは、以下の3つの要素について、 信頼性をもって見積ることができること。
工事収益総額: 工事契約の対価(受注額)。工事完成能力が必要。
工事原価総額: 完成までの原価総額。実原価との比較と見直しが必要。
工事進捗度: 決算日における開発の進捗率。客観的把握が必要。
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
6Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
1.1 IT産業を取り巻く環境(3)
ユーザ・ベンダ間の納得感の欠如
「やりたいこと」と「できること」の整合が必要だが…共有しやすい見積り手法がない初期の仕様は固めにくく、早期契約時の適切な見積りが困難
要件決定の遅れ、プロジェクト途中での仕様変更の発生 など
ユーザ ベンダ
【事業計画】・事業目的・事業領域/規模
・投資/回収・事業スケジュ
ール
【プロジェクト計画】
・開発目的・スコープ/規模
・予算・開発スケジュ
ール
要件
実現性
整合
定量データに裏付けられたマネジメントが必要
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
7Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
1.2 データ白書の目的(1)
定量データの必要性定量データが十分集まれば ・・・ こんな活用ができる
ユーザ ユーザ
ベンダ ベンダ
経営層業務・情報システム部
門組織長・スタッフ
プロジェクト管理者
・ IT投資、概略計画の妥当性、実現性の目安・予算数値、根拠の制御・ベンダからの見積の比較と評価、強み/弱みの認識・計画策定、目標値の制定、 QCD の妥当性評価・予実差異の分析、完了評価、開発能力の評価
経営層
プロジェクトマネージャ
プロジェクトリーダ
・自社の強み・弱み、生産性などの開発力の認識
・規模、工数、工期、品質の見積り、計画策定、制御・オフショア等、外部委託先評価
PMO品質保証部門
・定量データベースの構築・自社プロジェクトのベンチマーキング、モニタリング
ユーザ、ベンダ間の合意形成ユーザ、ベンダ間の合意形成
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
8Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
1.2 データ白書の目的(2)
SECの取組みとデータ白書の目的定量的アプローチによる科学的マネジメントの普及拡大
メーカー系、ユーザ系、独立系の複数のベンダからデータを収集「ソフトウェア開発データ白書」として公開
( 2010 年度は 23企業、 2584 プロジェクトのデータ)
2010 年 11月
発行
2010-2011
1774942 1418 2056
2005 2006 20082007
25842327
2009
モノサシとしての精度を高めていく新たなモノサシや課題抽出の切り口を提案
する
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
9Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
1.3 データ白書利用の際の留意点
データ白書の記載概要と利用の際の留意点ソフトウェアの定量的なモノサシとして基本的なものを収録
しており、以下の要素間の関係などを図表で記載している。
プロジェクトデータは様々な特性や環境により異なるため、必ずしもこのメトリクスをそのまま自プロジェクトに適用できない場合がある。それぞれのプロジェクトや現場で、何らかの判断や予測を行う場合の参考として、活用するとよい。
プロジェクトの 特性例 プロジェクトの 特性例
開発種別 アーキテクチャ 業 種
開発言語 開発ライフサイクルモデル
プラットフォーム
代表的な要素 代表的な要素
生産性 信頼性
工 期規 模 工 数
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
10Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
1.4 データ白書で提供する基礎情報
ソフトウェア開発データ白書の構成 ( 2010-2011版) 1章 背景と本書の目的
2章 収集データについて 3章 分析について 4章 収集データのプロファイル 5章 プロジェクトの主要要素の統
計 6章 工数、工期、規模の
関係の分析 7章 信頼性の分析 8章 工程別の分析 9章 生産性の分析 10 章 予実分析等 付録 A ~ G
データ項目の定義や 収集データ年別プロファイル 等々
1章 背景と本書の目的 2章 収集データについて 3章 分析について 4章 収集データのプロファイル 5章 プロジェクトの主要要素の統
計 6章 工数、工期、規模の
関係の分析 7章 信頼性の分析 8章 工程別の分析 9章 生産性の分析 10 章 予実分析等 付録 A ~ G
データ項目の定義や 収集データ年別プロファイル 等々
データ全体のプロファイル
方針に基づく分析結果
データ収集方針分析の方針、データの基準
予実、生産性の差の特徴をミニテーマ分析
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
11Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
1.5 データ白書の対象読者
データ白書の活用イメージを考慮した対象読者教育部門の方々
企業内での定量データ活用の普及・展開を、社内教育などにより推進される際、活用いただきたい。
品質保証部門、プロジェクトマネジメントオフィスの方々企業内での定量データベース構築や、プロジェクトのベンチマーキングを推進する際、現場の方々への説明やご指導など対応される際、活用いただきたい。
業務部門、情報システム部門の責任者の方々 ソフトウェア開発現場で、データ収集・定量的管理・精度向上等の
取り組みの啓発の際に、活用いただきたい。プロジェクトマネージャ、プロジェクトリーダの方々
定量データを用いた見積り、プロジェクト管理の推進(制御、予測等)を行う際、実践的な利用のためのノウハウとして、活用いただきたい。
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
12Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
内容:データ白書の見方・使い方
1章 背景と本書の目的 2章 収集データについて 3章 分析について 4章 収集データのプロファイル 5章 プロジェクトの主要要素の統計(6章~10章)
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
13Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
2.収集データについて
データ収集方針と収集状況ソフトウェア開発データ白書で利用しているデータは、国
内企業複数社から収集したプロジェクトデータである。
データの項目は主に実績に関する項目 主な要素では計画データについても収集項目対象
(規模、工期、工数など) 対象プロジェクトはアプリケーションソフトウェ
アやシステムを開発するプロジェクトが中心
対象時期は直近 3年を優先
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
14Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
2.1 データ収集のポイント
重点収集したデータについて次に示す重点データ項目について、欠損が極力少ない
プロジェクトを対象にデータ収集している。
項 目 詳 細 開発種別 新規開発、改修・保守、拡張
アーキテクチャ
イントラネット /インターネット、 2 階層 C/S 、 3 階層C/S
業 種 金融・保険業、情報通信業、製造業、卸売・小売業、公務など
開発言語 Java 、 VB 、 C 、 COBOL 、 C++ など
規模の指標 FP 、 SLOC のいずれかで計測されているものFP 計測手法名が明確、 SLOC言語名が明確なもの
プラットフォーム
Windows系、 Unix系
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
15Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
0
50
100
150
200
250
300
350
400
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
開始年(西暦)
件数
2009年2008年2007年2006年2005年2004年
0
50
100
150
200
250
300
350
400
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
終了年(西暦)
件数
2009年2008年2007年2006年2005年2004年
2.2 データ提供状況
プロジェクトデータの更新年・終了年別クロス集計
データ白書 2010-2011
P17 、図表 2-2-4 、 5
【全体】 ( 2010-2011版での状況)・開始年では2003年以降のデータが78%を占める・終了年では2003年以降のデータが84%を占める( 2009 年度データ開始・終了プロジェクトは期中のためすべて収集されていない)
比較的直近年のデータが多く集まっている
開始年ごとのデータ件数
終了年ごとのデータ件数
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
16Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
内容
1章 背景と本書の目的 2章 収集データについて 3章 分析について 4章 収集データのプロファイル 5章 プロジェクトの主要要素の統計(6章~10章)
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
17Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
3.分析について
分析の対応方針についてデータ白書では、以下のように分析方針を定めて対応して
いる。
年度毎に定点観測を行っているため、継続的な分析と新たに行う分析の対応方針を明確にしている。
分析の進め方分析の目的、分析の観点、対象要素、分析する要素間の関係、分析の手順
分析に関する事前の取り決め データの選定基準などのデータ抽出に関する取り決め、 データ項目の取り扱い
分析結果の取り扱い 分析結果の掲載基準や単位の表記、掲載・表現方式など。
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
18Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
3.1 分析の進め方(1)
分析の観点及び方針共通認識を形成するための代表的な要素に着目し、
要素間の関係を明らかにするアプローチを取っている。
主要要素として分析の柱にしたも
の
データ白書 2010-2011
P19 、図表 3-1-1
代表的な要素と、
要素間の主な関係
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
19Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
3.1 分析の進め方(2)
分析の手順データ白書における分析の手順の概要を以下に示す。
(1)収集データの精査 (1)収集データの精査
(2)全データの分布分析 (2)全データの分布分析
(3)主要要素の データの分布分析
(3)主要要素の データの分布分析
(4)主要要素の関係分析 (4)主要要素の関係分析
(5)層別の設定と分析 (5)層別の設定と分析
不良データの除外 データ提供側との確認、見直し
ばらつき、偏りをヒストグラムや 散布図より、自然な傾向を確認
規模、工期、工数、生産性、信頼性の分布の明確化
代表的な要素について、要素相互の関係を分析 データの干渉を廃し、極力独立性を出す、または特徴を出すために層別を設定し、細分化した分析を実施
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
20Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
3.2 分析に関する事前の取り決め(1)
データ抽出に関する取り決め分析対象データを抽出する際に、以下の取り決めを行って
いる。 データ抽出対象の工程について規模データなどのデータ抽出、計測手法について複数選択がある収集データについての取り扱いについて
データ項目の取り扱いに関する取り決め以下のデータ項目ごとに必要な取り決めを行っている。
開発プロジェクトの種別 FP規模、 SLOC規模 工数、工期、月あたりの要員数外れ値の取り扱い
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
21Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
3.2 分析に関する事前の取り決め(2)
収集データの前提 (データ定義と留意点)データ白書で扱う基本的な対象工程は、基本設計開始から
総合テスト終了までの「開発5工程」としている。 工数は、「社内工数」及び「外部委託工数」の合計値を使用。 「社内工数」には、「開発」、「管理」、「その他」及び「作業配
分不可」の全ての工数を含む。
「開発5工程」では、「該当する5工程」の工数と「工数配分不可」の工数の合計値を使用。
← 開発5工程 →
工程内訳 システム化計画
要件定義
基本設計
詳細設計
制作 結合テスト
総合テスト(ベンダ確
認)
総合テスト(ユーザ確
認)
工数配分不可
社内実績工数
開発
管理
その他
作業配分不可
外部委託工数 開発工数
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
22Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
3.3 分析結果の取り扱い
分析結果の取り扱いについてデータ白書では分析結果の取り扱いとして、掲載基準や評価の目安、基本的な見方などを取り決めている。以下について個別に示す。
3.3.1 共通事項 3.3.2 基本統計量 3.3.3 回帰分析 3.3.4 箱ひげ図
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
23Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
3.3. 1 共通事項
分析結果の取り扱いにおける共通事項データ白書では分析結果の取り扱いにおける共通事項とし
て以下について取り決めている。
分析結果の掲載基準 分析対象の標本数偏りが起きないための前提条件(データ収集元の偏り、占有率など)
基準を満たさない場合でも掲載する例外基準単位の表記分析結果の掲載方式
使用データの掲載方式導出指標の例 分析結果の表現方式
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
24Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
3.3.2 基本統計量(1)
基本統計量について散布図や箱ひげ図など視覚的に傾向を捉える図表と共に、基
本統計量も認識することで、的確なデータ値を把握することができる。
基本統計量の表記次に示すいずれかの形式で掲載している。
各項目は以下のように表記 「項目」:データ名称、 「 N 」:件数 「最小」:最小値、 「 P25 」: 25 パーセンタイル 「中央」:中央値、 「 P75 」: 75 パーセンタイル 「最大」:最大値、 「平均」:平均値、 「標準偏差」:標準偏差
項目 N 最小 P25
中央 P75
最大 平均 標準偏差
N 最小 P25
中央 P75
最大 平均 標準偏差
N 中央 平均 標準偏差
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
25Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
3.3.2 基本統計量(2)
基本統計量の評価の目安データ数nの量
データ数は層別あたり、最低でもn≧ 10 、望ましいのはn≧ 30 。データ白書では標本数が 10件以上であることが掲載基準。
統計量の代表値の採択一般に|歪度|> 2の場合、平均値より中央値を採択する。
(分布の非対象性が大きいと見られるため)
「平均値」と「中央値」について:ソフトウェア開発プロジェクトのデータは正規分布をして
いない場合が多い。(例えば規模や工数の分布など)中央値の方が平均値よりも全体のプロファイルを表す数値として適切であることが多い。
代表的な値や許容の幅、偏りやばらつきを評価し、より的確なデータ値を把握する。
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
26Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
0
20
40
60
80
100
120
140
160
180
200
220
~10
0
~30
0
~50
0
~70
0
~90
0
~1,
100
~1,
300
~1,
500
~1,
700
~1,
900
~2,
100
~2,
300
2,40
0超
FP実績値(調整前)[FP]
件数
3.3.2 基本統計量(3)
基本統計量の見方と留意点
例) FP実績値の見方 ・FPによる規模では、
500FP までのプロジェクト が5割強を占める。
・一方で、 2000FP 以上の プロジェクトも、一割強ある。
2000FP 以上の大きな値に 引きづられ、平均値が大きく なっているが、非対象系の分布など 考慮すると、中央値の方が全体のプロファイルとして適切だと見て取れる。
[FP]N 最小 P25 中央 P75 最大 平均 標準偏差1, 130 5 194 440 995 284, 900 1, 225 8, 617
FP 実績値の基本統計量
データ白書 2010-2011
P48 、図表 4-8-4 、 5FP 実績値の分布(ヒストグラム)
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
27Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
3.3.3 回帰分析(1)
回帰分析の結果を散布図上で示すデータ白書ではプロジェクトの代表的な要素間の関係につ
いて、その多くは散布図により表わしている。
基本的には2つの要素間の関係を表わしている。何らかの傾向があるか見ることができる。2つの要素間に相関関係がないか見ることができる。相関関係が見て取れる場合、2つの要素(2変量)の関係
を回帰分析により、定式化する。(近似式として表わす。)
定式化が可能な場合、信頼幅の線を表わす。
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
28Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
3.3.3 回帰分析(2)
回帰分析結果の掲載基準回帰分析結果について掲載するのは、下記図表に示す
3項目の目安をすべて満たす場合としている。回帰式は、相関係数が高くデータの件数も十分ある。 2つのデータ項目間に強い関係が見出せると判断される。回帰直線又は曲線を示す条件も同様。傾向を単に視覚的に示す場合や説明の必要性から係数を用いるなど
のケースはこの限りではない。
回帰分析を使用した場合の評価の目安:
項目 判断の目安
1 データ数 n の量 データ数は層別あたり、 n≧30 とする
2 相関の見方 |相関係数 R |≧ 0.85 :強い関係0.85>|相関係数 R |≧ 0.70 :やや強い関係|相関係数 R |< 0.70 :強い関係は認められないが要継続観察
3 相関の有意性 P値< 0.05 とする(危険率 5 %で相関が有意と判断できる)
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
29Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
3.3.3 回帰分析(3):白書の表記と見方の留意点①
対数変換による分析ソフトウェア開発プロジェクトのデータは正規分布していな
いことが多い。(例えば規模の分布:規模の大きい方に裾野が長い分布)
対数に変換するとほぼ正規分布と見なせることが多く、裾野を含めた全体の状況が見やすい。
「正規分布」であることを前提としている相関係数の有意性や回帰式の予測値の信頼区間推定を求めることができる。
FP ( ) N=211実績値 調整前
0
10
20
30
40
100
~
300
~
500
~
700
~
900
~ 1100
~
1300
~
1500
~
1700
~
1900
~
2100
~
2300
~ 2401
~
FP ( )実績値 調整前
件数
Log (FP ( ) ) N=211実績値 調整前
0
5
10
15
20
25
30
35
40
45
1.11
1.32
1.52
1.72
1.93
2.13
2.33
2.54
2.74
2.94
3.15
3.35
3.55
3.76
3.96
次の級
Log (FP ( ) )実績値 調整前件数
詳細は次の文献を参照のこと ※ 「プロジェクトデータ分析の指針と分析事例」:古山恒夫、 SEC journal No3 、 pp6~pp13 、 2005
対数スケール化
正規分布
裾野の分布が分かり易い
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
30Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
FP ( IFPUG ) N=188規模と工数 新規開発、 グループ
0
50,000
100,000
150,000
200,000
250,000
300,000
0 2,000 4,000 6,000 8,000 10,000 12,000 14,000 16,000
FP ( )実績値 調整前
(5
) [
]実績
工数
開発
工程
人時
y(50%) y(- 50%)実績値
Copyright IPA SEC
FP ( IFPUG ) N=188規模と工数 新規開発、 グループ
0
1
2
3
4
5
6
0 1 2 3 4 5
FP ( )実績値 調整前
(5
) [
]実績
工数
開発
工程
人時
log(y)(50%) log(y)(- 50%)実績値
10 100 1,000 10,000 100,0001
1,000,000
100,000
10,000
1,000
100
10
1Copyright IPA SEC
3.3.3 回帰分析(3):白書の表記と見方の留意点②
もとのデータと対数変換後のデータの見方データを対数スケールに変換すると相関が明確になる場合
がある。散布図の表記において、必要に応じ対数スケール表示を取り入れて
いる。元のスケールに戻すと有効範囲(誤差)は右上方向に開く。 もとのデータに戻し、50%の信頼幅を示すと・・・
規模や工数が大きくなるに伴い信頼幅が広がるため、規模と工数の 関係など、妥当性の検証時はそれを考慮して判断する必要がある。
50%信頼幅もとのスケールに戻す
対数表示
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
31Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
3.3.4 箱ひげ図(1)
データの分布を視覚的に捉えることができるグラフ
外境界点
外境界点
内境界点
内境界点
箱の高さ×1.5
外れ値を除いた最大値
外れ値を除いた最小値
中央値
上ヒンジ
下ヒンジ
箱の高さ ×3.0
箱の高さ×1.5
箱の高さ×3.0
* 極値
外れ値
ひげ
箱の上端は、「上ヒンジ」と呼ばれ、上から 全体の25%に相当するデータの位置である。
箱の下端は、「下ヒンジ」と呼ばれ、下から 全体の25%に相当するデータの位置である。
上下50%の境目は「中央値」であり、 太線で表す。
箱の高さの3倍の位置を「外境界点」と呼び、 そこから外れた点を「極値」という。
箱の高さの 1.5倍の位置を「内境界点」と呼び、 外境界点内で外れた点を「外れ値」という。
外れ値、極値の除いた点の最大値、最小値 までを「ひげ」として表現する。
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
32Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
3.3.4 箱ひげ図(2)
白書の表記と見方の留意点(箱ひげ図事例)例) FP規模あたりの検出バグ数(新規開発、 IFPUGグルー
プ)
データ白書 2010-2011
P214 、図表 8-4-7
幅は狭いほうが、ばらつきが小さい。正規分布に近いデータの集団では、
上下のひげが同じ大きさで、 中央値が箱の真ん中にある。
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
33Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
内容:データ白書の見方・使い方
1章 背景と本書の目的 2章 収集データについて 3章 分析について 4章 収集データのプロファイル 5章 プロジェクトの主要要素の統計(6章~10章)
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
34Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
4.収集データのプロファイル(1)
収集データのプロファイルについてこれまで収集したプロジェクトデータについて、どのような特徴があるか、プロファイルとして明示している。
ある特徴について、ある種別で分類するとどのような分布になっているか
全データ件数に対してどのような割合になるかある特徴の大小によって、件数がどのように分布しているか
上記のような分析結果を、円グラフや棒グラフ、ヒストグラムなどの図表で表示している。例) 開発プロジェクトの種別で見た際の特徴:
種別を「新規開発」、「改修・保守」、「再開発」、「拡張」とする。 この種別の割合をプロファイルとして見ることで、データの特徴を捉えることができる。(新規開発が約55%で、改良・保守開発が約29%など)
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
35Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
4.収集データのプロファイル(2)
データ白書掲載のプロファイル一覧掲載事項 内容、備考
1 開発プロジェクトの全般的な特徴
開発プロジェクトの種別、形態、作業概要、新規顧客か、新規業種・業務か、新技術利用か
2 利用局面 業種、業務、利用形態3 システム特性 システム種別、業務パッケージ利用、処理形態、
アーキテクチャ、開発対象プラットフォーム、Web技術の利用、開発言語、 DBMS の利用
4 開発の進め方 開発ライフサイクルモデル、類似プロジェクトの参照、開発方法論の利用、開発フレームワークの利用、ツールの利用
5 ユーザ要求管理 ユーザ要求と関与、要求レベル6 要員などの
経験とスキルPM 経験とスキル、要員の経験
7 規模 規模の尺度の種別、 FP 計測手法、純度、 FP 実績値、SLOC 実績値
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
36Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
4.収集データのプロファイル(3)
掲載事項 内容、備考
8 工期 プロジェクト全体の月数実績値、開発5工程の月数実績値
9 工数 プロジェクト全体、開発5工程の工数の実績値(人時、人月)、工数の単位、人月-人時の換算係数
10 体制 外部委託工数比率、外部委託金額比率
11 信頼性 稼動後の不具合数(全体、現象数、原因数)、品質保証の体制、品質基準、レビューの有無
12 実施工程の組み合わせパターン
開発プロジェクトにおける実施工程の有無が同じものをグルーピングしたパターン
13 プロジェクト成否 計画の評価及び実績の評価は、 QCD の三つの観点についての評価を段階的に表す。計画の評価( QCD )、実績の評価( QCD )、プロジェクト成否の自己評価、顧客満足度に対するベンダ側の主観評価
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
37Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
0 100 200 300 400 500 600 700 800
A:農業C:漁業D:鉱業
E:建設業F:製造業
G:電気・ガス・熱供給・水道業H:情報通信業
I:運輸業J :卸売・小売業K:金融・保険業
L:不動産業M:飲食店,宿泊業
N:医療,福祉O:教育,学習支援業P:複合サービス事業
Q:サービス業(他に分類されなR:公務(他に分類されないもの)
S:分類不能の産業
件数
1第 回答2第 回答3第 回答
4.収集データのプロファイル(4)
収集データのプロファイル例(1)
業種(大分類 )業種(大分類 ) アーキテクチャアーキテクチャ
(件数の多い順)
①金融・保険業②製造業③情報通信業
0 100 200 300 400 500 600 700 800 900
a:スタンドアロン
b:メインフレーム
c /:2階層クライアントサーバ
d /:3階層クライアントサーバ
e /:イントラネットインターネット
f:その他
件数
1第 回答2第 回答3第 回答
データ白書 2010-2011
P36 、図表 4-4-5
データ白書 2010-2011
P33 、図表 4-3-1
①イントラネット /インターネット②2階層クライアント /サーバ③3階層クライアント /サーバ
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
38Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
4.収集データのプロファイル(5)
収集データのプロファイル例(2)例えば図表から以下なども読み取ることができる。(図表
は割愛)プラットフォームプラットフォーム
① Windows系② Unix系
開発言語開発言語
① Java② VB③ COBOL④ C
主開発言語グループとなる主要 4言語
開発種別開発種別開発ライフサイクルモデル
開発ライフサイクルモデル
新規開発が約 6割を占める改良開発は4割弱を占める
ウォーターフォール型が 9割強を占める
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
39Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
内容:データ白書の見方・使い方
1章 背景と本書の目的 2章 収集データについて 3章 分析について 4章 収集データのプロファイル 5章 プロジェクトの主要要素の統計(6章~10章)
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
40Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
5.プロジェクトの主要要素の統計(1)
プロジェクトの主要要素の統計について収集データのプロファイルはデータの特徴を様々な観点の
分布状況から明らかにしたものである。 さらに主要な要素について層別を行い、分布をまとめている 要素間の関係を見るための対象プロジェクトデータと同じ切り口で層別
基本条件によるデータ抽出により明示収集データの全体を俯瞰するため、規模、工期、工数、月あたりの要員数について、開発プロジェクト種別、業種、アーキテクチャ、業務別にその件数と分布をまとめている。
分析結果の確認や利用に際して、基となる基本的なデータ分布を認識することができる。
SECSoftware Engineeringfor Mo ・ No ・ Zu ・ Ku ・Ri
41Software Engineering CenterCopyright© 2011 IPA , All rights reserved.データ白書の見方と定量データ活用ポイント
5.プロジェクトの主要要素の統計(2)
プロジェクトの主要要素の統計例
項 目 分析結果事例(一部抜粋)
FP規模 1000FP 以下のプロジェクトが7割弱(但し、 3000FP超もある)「改修・保守」の中央値が 264FP 、「新規開発」が710FP
SLOC規模 50KSLOC 以下のプロジェクトが多く、「新規開発」での内訳 10 ~ 20KSLOC が、「改良開発」では 10KSLOC 以下が多い
工期 14ヶ月以下が9割程度を占めている業種別において、「製造行」、「情報通信業」の工期がやや短い
工数 工数が 5000 人時(約 31 人月)以下が4割程度を占めている 「改修・保守」の中央値が 4800 人時、「新規開発」が9600 人時
月あたりの 要員数
2~ 4人が一番多く、 10 人以下が 6割程度を占めている「金融・保険業」の新規開発では、 20 人超が3割強ある