Download pdf - Vol．36No．2 Feb．2013 基于马尔可夫模型的软件错误定位方法cjc.ict.ac.cn/quanwenjiansuo/2013-2/zyq.pdf · 统计错误定位技术[3]通过建立启发式模型来描

书书书

第３６卷　第２期２０１３年２月

计　　算　　机　　学　　报ＣＨＩＮＥＳＥＪＯＵＲＮＡＬＯＦＣＯＭＰＵＴＥＲＳ

Ｖｏｌ．３６Ｎｏ．２Ｆｅｂ．２０１３

　

收稿日期：２０１２０６３０；最终修改稿收到日期：２０１２０８０９．本课题得到国家自然科学基金项目“持续集成中的回归测试和错误定位”（６１００３０２７）资助．张云乾，男，１９８８年生，硕士研究生，主要研究方向为计算机应用．Ｅｍａｉｌ：ｚｈａｎｇｙｑ８１４＠ｇｍａｉｌ．ｃｏｍ．郑　征，男，１９８０年生，博士，副教授，主要研究方向为机器学习、软件测试．季晓慧，女，１９７７年生，博士，讲师，主要研究方向为软件分析与约束求解．张文博，男，１９７６年生，博士，副研究员，主要研究方向为网络分布计算、软件工程．张震宇（通信作者），男，１９７９年生，博士，副研究员，主要研究方向为软件测试、软件调试．Ｅｍａｉｌ：ｚｈａｎｇｚｙ＠ｉｏｓ．ａｃ．ｃｎ．

基于马尔可夫模型的软件错误定位方法张云乾１），２）　郑　征３）　季晓慧２）　张文博４）　张震宇１）

１）（中国科学院软件研究所计算机科学理论国家重点实验室　北京　１００１９０）２）（中国地质大学计算机科学与技术系　北京　１０００８３）

３）（北京航空航天大学自动化科学与电气工程学院　北京　１００１９１）４）（中国科学院软件研究所软件工程技术研究开发中心　北京　１００１９０）

摘　要　软件调试是软件开发的重要环节．统计错误定位技术通过分析程序执行频谱来估计程序中错误所在的位置．针对不同类型的程序频谱，此类技术建立不同的启发式模型描述程序行为．已有研究表明，其准确度同目标错误和程序类型相关，且不存在某种普遍有效的技术．文中从单元测试的特性出发，探讨预测错误类型的可行性，并采用马尔可夫过程对错误类型进行预测，从错误定位技术备选集中选择适合的技术来实施．实验表明文中方法能够更快地定位程序错误．

关键词　软件错误定位；软件错误类型；错误类型预测；马尔可夫模型中图法分类号ＴＰ３１１　　　犇犗犐号　１０．３７２４／ＳＰ．Ｊ．１０１６．２０１３．００４４５

犕犪狉犽狅狏犕狅犱犲犾犅犪狊犲犱犈犳犳犲犮狋犻狏犲狀犲狊狊犘狉犲犱犻犮狋犻狀犵犳狅狉犛狅犳狋狑犪狉犲犉犪狌犾狋犔狅犮犪犾犻狕犪狋犻狅狀ＺＨＡＮＧＹｕｎＱｉａｎ１），２）　ＺＨＥＮＧＺｈｅｎｇ３）　ＪＩＸｉａｏＨｕｉ２）　ＺＨＡＮＧＷｅｎＢｏ４）　ＺＨＡＮＧＺｈｅｎＹｕ１）

１）（犛狋犪狋犲犓犲狔犔犪犫狅狉犪狋狅狉狔狅犳犆狅犿狆狌狋犲狉犛犮犻犲狀犮犲，犐狀狊狋犻狋狌狋犲狅犳犛狅犳狋狑犪狉犲，犆犺犻狀犲狊犲犃犮犪犱犲犿狔狅犳犛犮犻犲狀犮犲狊，犅犲犻犼犻狀犵　１００１９０）２）（犇犲狆犪狉狋犿犲狀狋狅犳犆狅犿狆狌狋犲狉犛犮犻犲狀犮犲犪狀犱犜犲犮犺狀狅犾狅犵狔，犆犺犻狀犪犝狀犻狏犲狉狊犻狋狔狅犳犌犲狅狊犮犻犲狀犮犲狊，犅犲犻犼犻狀犵　１０００８３）

３）（犛犮犺狅狅犾狅犳犃狌狋狅犿犪狋犻狅狀犛犮犻犲狀犮犲犪狀犱犈犾犲犮狋狉犻犮犪犾犈狀犵犻狀犲犲狉犻狀犵，犅犲犻犺犪狀犵犝狀犻狏犲狉狊犻狋狔，犅犲犻犼犻狀犵　１００１９１）４）（犜犲犮犺狀狅犾狅犵狔犆犲狀狋犲狉狅犳犛狅犳狋狑犪狉犲犈狀犵犻狀犲犲狉犻狀犵，犐狀狊狋犻狋狌狋犲狅犳犛狅犳狋狑犪狉犲，犆犺犻狀犲狊犲犃犮犪犱犲犿狔狅犳犛犮犻犲狀犮犲狊，犅犲犻犼犻狀犵　１００１９０）

犃犫狊狋狉犪犮狋　Ｄｅｂｕｇｇｉｎｇｉｓａｎｅｃｅｓｓａｒｙｐｈａｓｅｉｎｓｏｆｔｗａｒｅｄｅｖｅｌｏｐｍｅｎｔ．Ｓｔａｔｉｓｔｉｃａｌｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎｔｅｃｈｎｉｑｕｅｓｅｓｔｉｍａｔｅｆａｕｌｔｌｏｃａｔｉｏｎｓｂｙａｎａｌｙｚｉｎｇｄｙｎａｍｉｃｐｒｏｇｒａｍｓｐｅｃｔｒａ．Ｔｈｅｙｂｕｉｌｄｄｉｆｆｅｒｅｎｔｈｅｕｒｉｓｔｉｃａｎａｌｙｔｉｃａｌｍｏｄｅｌｓｆｏｒｄｉｆｆｅｒｅｎｔｐｒｏｇｒａｍｓｐｅｃｔｒａｔｏｄｅｓｃｒｉｂｅｔｈｅｐｒｏｇｒａｍｂｅｈａｖｉｏｒ．Ｐｒｅｖｉｏｕｓｓｔｕｄｉｅｓｓｈｏｗｔｈａｔｔｈｅｉｒｅｆｆｅｃｔｉｖｅｎｅｓｓｉｓｒｅｌａｔｅｄｔｏｔｈｅｔａｒｇｅｔｆａｕｌｔｓａｎｄｐｒｏｇｒａｍｔｙｐｅｓ；ａｎｄｔｈｅｒｅｉｓｎｏｕｎｉｖｅｒｓａｌｌｙｅｆｆｅｃｔｉｖｅｔｅｃｈｎｉｑｕｅ．Ｂｙｅｖａｌｕａｔｉｎｇｔｈｅｆｅａｓｉｂｉｌｉｔｙｏｆｐｒｅｄｉｃｔｉｎｇｆａｕｌｔｃｌａｓｓｉｎａｕｎｉｔｔｅｓｔｐｒｏｃｅｓｓ，ｔｈｉｓｐａｐｅｒｅｍｐｌｏｙｓａＭａｒｋｏｖｍｏｄｅｌｔｏｓｅｌｅｃｔａｐｒｏｐｅｒｓｕｃｈｔｅｃｈｎｉｑｕｅｔｏａｐｐｌｙ，ｆｒｏｍａｃａｎｄｉｄａｔｅｓｅｔ．Ｅｍｐｉｒｉｃａｌｓｔｕｄｙｓｈｏｗｓｉｔｉｓｍｏｒｅｅｆｆｅｃｔｉｖｅｔｏｌｏｃａｔｅｆａｕｌｔｓ．

犓犲狔狑狅狉犱狊　ｓｏｆｔｗａｒｅｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎ；ｆａｕｌｔｃｌａｓｓｉｆｉｃａｔｉｏｎ；ｆａｕｌｔｃｌａｓｓｐｒｅｄｉｃｔｉｏｎ；Ｍａｒｋｏｖｍｏｄｅｌ

１　引　言计算机的应用越来越多地深入到人们的日常生

活中，然而计算机软件还远没有达到零错误的要求．提高软件质量已经成为软件工程领域亟待解决的重要问题．软件调试，作为一种提高软件质量的重要手段而备受重视．在软件的开发生命周期中，软件调试

是一个耗时耗力的过程，已成为软件开发的瓶颈之一［１］．因此，改进、改善软件调试技术变得十分迫切与重要．调试一个软件错误通常包括两个步骤：对错误进行定位和对错误进行修复．为修复一个软件错误，开发者必须先要对其进行定位，因此，针对软件错误定位技术的研究具有十分重要的现实意义与作用［２］．

统计错误定位技术［３］通过建立启发式模型来描述程序特征频谱上的动态程序行为，例如程序的覆盖信息［１］、语句的执行次数［４］等，并使用启发式算法预测程序中错误所在的位置．近年来，人们用不同规模、不同语言及不同领域的程序对此类技术的错误定位准确度进行实验，取得了令人满意的成果［１，３，５１０］．

统计错误定位技术往往是针对不同的错误类型或程序特征而设计的．例如，Ｙｕ等人［８］提出了用于定位分支错误的统计错误定位技术．Ｍｉｎｕｓ技术针对的是Ｊａｖａ程序的Ｊｉｍｐｌｅ代码中的错误．我们之前的研究［１１］是针对谓词进行动态程序频谱分析，进而准确定位软件错误．已有的研究结果表明，应用错误定位技术对软件错误进行定位的准确度与错误模式［７］、测试用例集分布［８］以及其它很多影响因素都相关．举例来说，Ｗａｎｇ等人［７］对巧合一致性问题进行了研究，就常见错误类型的数据及控制流模式进行分析，对程序覆盖信息进行调整以有效地定位程序错误．文献［９］提出了ＦＯｎｌｙ技术，该技术适用于仅有失败测试用例的情况（例如用户反馈的错误报告）；在同时可以参考成功测试用例的情况下，优势相比同类技术并不明显．大部分此类实验研究都表明，一项错误定位技术在针对特定类型的错误时，有可能比其它技术更有效；然而，任何一项技术都未被证实在任意目标错误类型和程序特征下都具有比其它技术更高的定位准确性（或是在一般意义上比其它技术更有效）［４６，８，１１］．

在现代软件研制过程中，由于新的开发技术、开发过程以及编程环境等的影响，程序特征及错误类型愈来愈多，进而增加了选择错误定位技术的难度．在这种情况下，如果随机挑选，可能导致定位错误的效果很差，而选择所有的技术进行尝试则代价过大也不可行．因此，如何根据不同的错误类型或者程序特征选择适合的自动化软件错误定位技术是值得研究的．据了解，相关工作还没有系统地展开．

本文提出一种应用马尔可夫模型的辅助错误定位的新方法．我们对错误进行分类，评价备选集中的

各个错误定位技术对于各类错误的定位准确度，使用马尔可夫模型预测目标错误的类型，从而从备选集中选择最佳的错误定位技术来实施．

本文的创新点及贡献包括：（１）分析了单元测试过程中对错误类型进行预测的可行性，设计实现了基于马尔可夫模型的错误类型预测模型；（２）提出使用错误定位技术备选集进行错误定位的方法，并实现了原型系统；（３）使用通用的Ｓｉｅｍｅｎｓ数据集和真实的Ｕｎｉｘ工具程序对本文提出的方法进行实验验证，结果表明，相比６种典型的错误定位技术的单独使用，本文的方法能够更快地定位到软件错误；（４）分析了本文方法应用在不同类型、不同粒度级别错误定位技术及应用在混合类型、混合粒度级别错误定位技术时的效果．结果表明，本文方法在应用于相同类型、相同粒度级别的错误定位技术时有效；更适用于较粗粒度的错误定位技术，且在基于语句的错误定位技术上显示出最佳的错误定位效果．

本文第２节对单元测试中的错误类型预测进行可行性分析，解释本文错误定位方法的动机；第３节介绍基于马尔可夫模型的错误定位方法；第４节使用Ｓｉｅｍｅｎｓ数据集和Ｕｎｉｘ工具程序进行实验验证；第５节总结并探讨未来的方向．

２　研究动机实践经验告诉我们，单元测试中发现的错误的

类型和属性往往是相关的．首先，单元测试专注于某一个待测程序，同一程

序中存在的错误会继承类似的属性．例如，科学计算库的程序实现包括大量的浮点计算语句和函数调用．高可靠性应用领域的程序往往具有更多的条件语句、分支语句和边界检查．此类程序中的错误更可能存在于谓词上．

其次，同一待测程序中存在的多个错误可能是由同一程序员注入的．程序员固有的编程习惯有可能导致其编码的错误具有相似的语义结构或逻辑结构．

第三，由于单元测试专注于某一个待测程序，在单元测试中发现的多个程序错误很大程度上来自于同一函数或程序模块．受到相同程序结构的影响，程序中存在的错误也将具有相似的类型．

最后，程序员常常针对特定类型的错误而设计测试用例集．例如，程序员会为定位内存泄露错误而专门设计测试用例集．为专有目的服务的测试用例

６４４计　　算　　机　　学　　报２０１３年

集的使用，使得在测试中发现同类错误的可能性被提高．

通过以上原因的分析，我们认为，在单元测试的实践过程中发现的多个错误更有可能具有同样或类似的类型．因此，当某种错误定位技术能够准确定位某个错误时，对于同一待测程序中存在的其它错误往往也具有较好的定位效果．如果我们把单元测试中出现的错误看作是一个随机事件序列，那么各个事件并不彼此独立，而是具有很大程度的相关性．我们由此得知单元测试过程中出现的错误类型具有相关的属性．因此，对其进行预测是可行的．

本节分析了在单元测试中预测错误类型的可行性．各个错误间因具有类似的属性而（在使用某个特定技术对其定位时）呈现相近的定位难度．因此，可以通过对错误类型的预测来选择最有效的错误定位技术．然而，这样的初步解决方法仍存在具体的操作问题和不详尽之处．例如，如何科学地描述错误类型？使用何种机制来预测错误类型？如何选择适合的技术来实施？在本文的下一节中，我们将对这些问题进行解释，给出本文提出的基于马尔可夫模型的错误定位方法的步骤及其复杂度分析．

３　基于马尔可夫模型的错误定位方法本节首先阐述问题设定，然后提出错误定位模

型，并进行复杂度分析．３１　问题设定

统计错误定位问题通常使用如下的问题设定．假设犡是错误程序的语句集，犉∪犛是测试用例集，犉表示失败的测试用例集，犛表示成功的测试用例集．当程序运行一个测试用例狋（狋∈犉∪犛）时，语句狓（狓∈犡）被执行的次数表示为犈（狋，狓）．错误定位的目标是得到一个可疑语句列表犔（即犡的一个排列），犔中的语句按照其错误可疑度进行降序排列［９］．

假定有犿个此类技术作为备选集供使用，表示为犜１，犜２，…，犜犿，其中犜犻代表第犻个此类技术．犅０，犅１，…，犅狀－１表示最后狀个被定位和修复的错误，其中犅犼代表第犼个错误．在前狀个（最后狀个）错误被定位到后，基于这样的先验知识我们可以知道每个技术犜犻在定位每个错误犅犼时的定位准确度（用犢犼犻表示）．犢犼犻的值越小，表示技术犜犻在定位错误犅犼时的准确度越高．在本文中，利用错误类型预测技术来对下一个错误犅狀进行定位的目标是找到一个犜犻，使得犜犽，犢狀犻犢狀犽成立．

３２　本文提出的错误定位方法基于对错误类型的预测，本文提出的错误定位

方法具有如下的步骤：（１）利用历史中已定位到的错误类型序列建立一步转移概率矩阵；（２）预测下一个错误类型并选择最佳的错误定位技术；（３）依据所选用技术的输出进行错误定位，根据定位到的错误进一步更新历史信息．下面我们对每个步骤进行详细阐述．

步骤１．错误定位技术在对程序运行进行分析后，输出

犔表示可疑的语句列表．已有的研究工作（例如文献［３４，７９，１１１２］）常使用错误在犔中的位置来计算评价指标犢犼犻．之前的研究［１２］指出，这样的可疑语句列表能够有效地辅助定位错误．鉴于不同技术在定位不同类型错误时的准确度不同，且目前尚无通用的错误类型描述手段，本文不失一般性地使用错误定位技术的种类对错误进行分类．错误犅犼的类型标示为定位错误犅犼的最佳技术犆犼．

犆犼＝ａｒｇｍｉｎ犻｛犢犼犻｝．

　　我们将软件开发过程中出现错误的类型视作一个离散时间随机过程，并选用通用的马尔可夫模型［１３］来对错误类型进行预测．这里，犙是软件开发过程中发现的错误类型的观测序列．

犙＝〈犆０，犆１，…，犆狀－１〉．　　根据观测序列犙，可以建立用于预测错误类型的一步转移概率矩阵［１３］．该一步转移概率矩阵用犘表示如下．

犘＝狆１，１狆１，２ …狆１，犿狆２，１狆２，２ …狆２，犿狆犿，１狆犿，２ …狆犿，

熿

燀

燄

燅犿

，

其中，狆狌，狏表示在观察到出现类型狌错误后紧接着出现类型狏错误的条件概率．特别地，狆狌，狌表示连续两次出现类型狌的错误的条件概率．按照一步转移概率矩阵的计算方法，狆狌，狏计算如下．

狆狌，狏＝

狀狌，狏∑犿

犻＝１狀狌，犻，∑

犿

犻＝１狀狌，犻≠０

１犿， ∑

犿

犻＝１狀狌，犻＝

烅

烄

烆０

，

狀狌，狏＝ｓｉｚｅｏｆ犆犼狘犆犼＝狌，犆犼＋１＝｛｝狏．当无法从历史信息估计转移概率时，分配相同的转移概率．

７４４２期张云乾等：基于马尔可夫模型的软件错误定位方法

步骤２．根据建立的一步转移概率矩阵和上次错误的类

型，预测当前的错误类型，并选用适当的错误定位技术．当前错误的类型珟犆狀计算如下：

珟犆狀＝ａｒｇｍａｘ犻犘犆狀－１，｛｝犻．

　　按照预测的错误类型珟犆狀，我们选择错误定位技术犜珟犆狀来实施．特别地，当珟犆狀不唯一时，我们选择编号最小的技术来实施．这时，我们采用如下的方式计算：

珟犆狀＝ｍｉｎａｒｇｍａｘ犻犘犆狀－１，｛｝｛｝犻．

步骤３．在程序员使用选定的错误定位技术犜犆狀对错误

进行定位后，即确定了程序中错误所在的语句．这时，我们根据错误所在的语句来计算各个错误定位技术犜犻在定位该错误犅狀时的定位准确度犢狀犻，从而确定错误的真实类型：

犆狀＝ａｒｇｍｉｎ犻犢狀｛｝犻，

类似地，当犆狀不唯一时，我们选择编号最小的类型标注．这时，采用如下的方式计算犆狀：

犆狀＝ｍｉｎａｒｇｍｉｎ犻犢狀｛｝｛｝犻．

在求得错误犅狀的类型犆狀后，我们将观测序列犙更新为犙＝〈犆０，犆１，…，犆狀－１〉，并相应地更新一步转移概率矩阵犘．３３　复杂度分析

本文提出的错误定位方法的复杂度是同其使用的错误定位技术的复杂度相关的，表示为犗（｜犡｜·犿·狀·犗１）．｜犡｜代表语句的数目，犿是技术的数目，狀是已定位到的错误的数目，犗１是使用的错误定位技术的复杂度．

由于在历史记录的积累过程中犘可以被增量更新，模型的复杂度可以进一步减少到犗（｜犡｜·犿·犗１）．受到篇幅限制，这里不叙述具体的推导过程．

４　实验验证本节采用Ｓｉｅｍｅｎｓ程序包和Ｕｎｉｘ工具程序对

本文的算法进行验证和比较．４１　实验对象

Ｓｉｅｍｅｎｓ程序包［１４］由西门子公司开发，专用于评价软件测试技术的准确度，在之前的研究工作中被广泛使用［１，３４，６，１１，１５１６］．Ｓｉｅｍｅｎｓ程序包共包含７个程序，为了充分验证本文的错误定位方法，我们选用其中错误版本数目最多的程序包ｔｃａｓ．程序包ｔｃａｓ共有４１个错误版本，每个错误版本中均含有一个人工注入的错误语句．由于每个错误版本存在微小差异，ｔｃａｓ的程序中大约包括１３５行左右的可执行代码．程序包ｔｃａｓ共有１６０８个测试用例．

Ｕｎｉｘ工具程序是演化中的真实程序，在前期工作中被广泛用于评价错误定位技术的效果［１１，１７］．举例来说，ｓｅｄ包括从１．１８～３．０２等５个演化版本，共包括１６个错误版本，每个错误版本中均包含一个错误．其程序规模从４７５６～９２８９不等，共有３７０个测试用例．使用这样中等规模的程序进行试验，能够反映本文方法在真实程序上的应用效果．

用于实验的错误定位技术有６种，分别为Ｔａｒａｎｔｕｌａ［３］、ＦＯｎｌｙ［９］、ＣＢＩ［１６］、ＳＯＢＥＲ［６］以及ＤＥＳＣＢＩ［１１］和ＤＥＳＳＯＢＥＲ［１１］．这６项技术均为代表性的统计错误定位技术，其中Ｔａｒａｎｔｕｌａ和ＦＯｎｌｙ为基于语句的错误定位技术，ＣＢＩ和ＳＯＢＥＲ为复合表达式粒度级别的基于谓词的错误定位技术，ＤＥＳＣＢＩ和ＤＥＳＳＯＢＥＲ为原子表达式粒度级别的基于谓词的错误定位技术．表１中列出了这些实验技术的作者、发表年代、出处、类型和粒度级别．

表１　用于实验的错误定位技术（名称、作者、年代、出处、类型、粒度级别）错误定位技术作者年份出处类型粒度Ｔａｒａｎｔｕｌａ［３］Ｊｏｎｅｓ等２００２ＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｆＳｏｆｔｗａｒｅＥｎｇｉｎｅｅｒｉｎｇ基于语句语句ＦＯｎｌｙ［９］Ｚｈａｎｇ等２０１２ＩＥＥＥＣｏｍｐｕｔｅｒ基于语句语句ＣＢＩ［１６］Ｌｉｂｌｉｔ等２００５ＡＣＭＳＩＧＰＬＡＮＣｏｎｆｅｒｅｎｃｅｏｎＰｒｏｇｒａｍｍｉｎｇＬａｎｇｕａｇｅＤｅｓｉｇｎ

ａｎｄＩｍｐｌｅｍｅｎｔａｔｉｏｎ基于谓词复合表达式ＳＯＢＥＲ［６］Ｌｉｕ等２００６ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＳｏｆｔｗａｒｅＥｎｇｉｎｅｅｒｉｎｇ基于谓词复合表达式ＤＥＳＣＢＩ［１１］Ｚｈａｎｇ等２０１０ＪｏｕｒｎａｌｏｆＳｙｓｔｅｍｓａｎｄＳｏｆｔｗａｒｅ基于谓词原子表达式ＤＥＳＳＯＢＥＲ［１１］Ｚｈａｎｇ等２０１０ＪｏｕｒｎａｌｏｆＳｙｓｔｅｍｓａｎｄＳｏｆｔｗａｒｅ基于谓词原子表达式

４２　实验设计我们按照错误版本的顺序对其进行排列，使用

排列生成的错误序列来模拟软件测试的过程．为评价本文方法预测错误犅犼类型的准确度和定位错误

犅犼的准确度，实验中使用前犼个错误作为错误定位的历史记录．进而，按照第３节中方法的实施步骤预测错误类型，实施相应的错误定位技术．

由于用于实验的６项技术分别属于２种不同类

８４４计　　算　　机　　学　　报２０１３年

型和３种不同粒度级别的错误定位技术，我们设计了１０个实验来对本文方法进行多维评估．

实验１．　使用实验程序（Ｓｉｅｍｅｎｓ程序），将基于语句的错误定位技术Ｔａｒａｎｔｕｌａ与ＦＯｎｌｙ作为实验对象对本文提出的错误定位方法进行评估．

实验２．　使用实验程序（Ｓｉｅｍｅｎｓ程序）复合表达式粒度级别的基于谓词的错误定位技术ＣＢＩ与ＳＯＢＥＲ作为实验对象对本文提出的错误定位方法进行评估．

实验３．　使用实验程序（Ｓｉｅｍｅｎｓ程序），将原子表达式粒度级别的基于谓词错误定位技术ＤＥＳＣＢＩ与ＤＥＳＳＯＢＥＲ作为实验对象对本文提出的错误定位方法进行评估．

实验４．　使用实验程序（Ｓｉｅｍｅｎｓ程序），将基于语句的错误定位技术Ｔａｒａｎｔｕｌａ与ＦＯｎｌｙ以及复合表达式粒度级别的基于谓词的错误定位技术ＣＢＩ与ＳＯＢＥＲ作为实验对象对本文提出的错误定位方法进行评估．

实验５．　使用实验程序（Ｓｉｅｍｅｎｓ程序），将复合表达式粒度级别的谓词错误定位技术ＣＢＩ与ＳＯＢＥＲ以及原子表达式粒度级别的谓词错误定位技术ＤＥＳＣＢＩ与ＤＥＳＳＯＢＥＲ作为实验对象对本文提出的错误定位方法进行评估．

实验６．　使用真实程序（Ｕｎｉｘ程序），将基于语句的错误定位技术Ｔａｒａｎｔｕｌａ与ＦＯｎｌｙ作为实验对象对本文提出的错误定位方法进行评估．

实验７．　使用真实程序（Ｕｎｉｘ程序），将复合表达式粒度级别的基于谓词的错误定位技术ＣＢＩ与ＳＯＢＥＲ作为实验对象对本文提出的错误定位方法进行评估．

实验８．　使用真实程序（Ｕｎｉｘ程序），将原子表达式粒度级别的基于谓词错误定位技术ＤＥＳＣＢＩ与ＤＥＳＳＯＢＥＲ作为实验对象对本文提出的错误定位方法进行评估．

实验９．　使用真实程序（Ｕｎｉｘ程序），将基于语句的错误定位技术Ｔａｒａｎｔｕｌａ与ＦＯｎｌｙ以及复合表达式粒度级别的基于谓词的错误定位技术ＣＢＩ与ＳＯＢＥＲ作为实验对象对本文提出的错误定位方法进行评估．

实验１０．　使用真实程序（Ｕｎｉｘ程序），将复合表达式粒度级别的谓词错误定位技术ＣＢＩ与ＳＯＢＥＲ以及原子表达式粒度级别的谓词错误定位技术ＤＥＳＣＢＩ与ＤＥＳＳＯＢＥＲ作为实验对象对本文提出的错误定位方法进行评估．

实验１、６的目的在于分析本文错误定位方法用于基于语句的错误定位方法上的可行性和准确度；实验２、７的目的在于分析本文错误定位方法用于复合表达式的基于谓词的错误定位方法上的效果；实验３、８的目的是分析本文方法用于原子表达式上的基于谓词的错误定位方法的有效性；实验４、９的目的在于分析本文错误定位方法用于混合类型错误定位技术的可行性与效果；实验５、１０的目的在于分析本文错误定位方法用于混合粒度错误定位技术的效果．４３　评价指标

我们使用预测正确率（犆狅狉狉犲犮狋狀犲狊狊）、查准率（犘狉犲犮犻狊犻狅狀）和查全率（犚犲犮犪犾犾）来评估错误类型预测的准确度．预测正确率定义为对狀个程序错误进行类型预测的平均正确率．利用如下公式计算．

犆狅狉狉犲犮狋狀犲狊狊＝犘狉狅犆犼＝珟犆（）犼．　　某类型犆的查准率定义为错误被预测为类型犆时正确预测的比例，某类型犆的查全率定义为类型犆的错误被预测为类型犆的比例．

本文方法的查准率为各个类型查准率的平均值，本文方法的查全率为各个类型查全率的平均值．查准率和查全率使用如下的公式进行计算．犘狉犲犮犻狊犻狅狀＝１犿∑

犿

犻＝１犘狉狅犆犼＝犿狘珟犆犼＝（）犿，

犚犲犮犪犾犾＝１犿∑犿

犻＝１犘狉狅珟犆犼＝犿狘犆犼＝（）犿．

　　我们用定位代价（犈狓狆犲狀狊犲［３，９］）来评估错误定位的准确度．某个错误犅犼的定位代价定义为：使用选定的错误定位技术定位该错误时，错误存在于该错误定位技术输出可疑语句列表犔中的位置．本文方法的定位代价为定位各错误的定位代价的平均值，用如下公式进行计算．

犈狓狆犲狀狊犲＝１狀∑狀

犼＝１犢犼珟犆狀．

４４　实验结果分析我们依据实验步骤进行实验验证，并使用评价

指标对实验结果进行分析．为了更直观地观察实验结果，我们将各技术及本文方法的定位准确度用图形方式表示并进行比较和结果分析．

实验１．图１表示了Ｔａｒａｎｔｕｌａ、ＦＯｎｌｙ及本文方法在定

位实验程序中的４１个错误时的定位代价．在图１中，狓轴表示错误序列，共包括４１个错误，狔轴表示不同技术定位错误的准确度，用犈狓狆犲狀狊犲评价指标

９４４２期张云乾等：基于马尔可夫模型的软件错误定位方法

度量．图中的三角形表示Ｔａｒａｎｔｕｌａ定位各个错误时的准确度，圆形表示ＦＯｎｌｙ定位各个错误时的准确度．连线表示本文方法对错误类型的预测以及对相应的方法（Ｔａｒａｎｔｕｌａ或ＦＯｎｌｙ）的选用．

图１　错误定位方法的预测准确度与定位准确度分析（Ｔａｒａｎｔｕｌａ和ＦＯｎｌｙ技术用于实验程序）

以连线的前５段为例进行说明，在定位第一个错误时，由于没有历史数据供参考（错误类型观测序列犙为空集），一步转移概率矩阵中的概率均为０．５０，此时的一步转移概率矩阵如下所示：

犘＝０．５００．５０［］０．５００．５０．在此情况下选用了Ｔａｒａｎｔｕｌａ技术来实施错误定位，Ｔａｒａｎｔｕｌａ技术使用１．７３％的定位代价定位到了这个错误．我们后验地检查ＦＯｎｌｙ对此错误的定位效果，发现ＦＯｎｌｙ技术使用了８．０９％的定位代价定位到了这个错误．因此判定此错误为０型错误，并更新错误类型观测序列为犙＝〈０〉．在对第２个错误进行定位时，情况类似，依然选择了Ｔａｒａｎｔｕｌａ技术来实施．同时，定位到的错误依然为０型错误，错误类型观测序列被更新为犙＝〈０，０〉．这时，由于前两次连续出现了０型错误，此时的一步转移概率矩阵如下式所示：

犘＝１．０００．００［］０．５００．５０．在对第３个错误进行定位时，依照一步转移概率矩阵的建议选用Ｔａｒａｎｔｕｌａ技术，预测正确．在对第４个错误进行定位时选用了Ｔａｒａｎｔｕｌａ技术．然而结果表明ＦＯｎｌｙ技术能够更有效地定位该错误，该错误为１型错误；因此对第４个错误进行的类型预测失败．第５个错误被预测为１型错误，预测失败．第６个错误被预测为０型，预测正确．

总体来看，用本文方法在４１次预测中，２６次预测正确，１５次预测错误，正确率为６３．７％，查准率为

６１．３％，查全率为６１．３％．Ｔａｒａｎｔｕｌａ的定位代价为１４．９％，ＦＯｎｌｙ的定位代价为１６．４％，本文方法的定位代价为１４．１％．通过比较以上数据得知，本文方法比单独使用Ｔａｒａｎｔｕｌａ或ＦＯｎｌｙ技术的定位代价小．结果表明，将本文方法用于基于语句的错误定位技术能够有效预测实验程序中的错误类型，并能以较高的准确度定位程序错误．

实验２．图２表示了ＣＢＩ、ＳＯＢＥＲ及本文方法在定位实

验程序中的４１个错误时的定位代价．图中的三角形表示ＣＢＩ定位各个错误时的准确度，圆形表示ＳＯＢＥＲ定位各个错误时的准确度．连线表示本文方法对错误类型的预测以及对相应的方法（ＣＢＩ或ＳＯＢＥＲ）的选用．图２的结构和图例与图１相同，限于篇幅限制不再赘述．

图２　错误定位方法的预测准确度与定位准确度分析（ＣＢＩ和ＳＯＢＥＲ技术技术用于实验程序）

图２表明，用本文方法在４１次预测中，２４次预测正确，１７次预测错误，正确率为５８．５％，查准率为５６．０％，查全率为５５．９％．查准率和查全率相比使用基于语句的错误定位技术时有所下降．ＣＢＩ的定位代价为２６．５％，ＳＯＢＥＲ的定位代价为２９．３％，本文方法的定位代价为２６．０％．通过以上数据得知，本文方法比单独使用ＣＢＩ或ＳＯＢＥＲ的定位代价小．结果表明，将本文方法用于基于谓词的错误定位技术能较有效地预测实验程序中的错误类型，并能够相对准确地定位程序错误．

实验３．图３表示了ＤＥＳＣＢＩ、ＤＥＳＳＯＢＥＲ及本文方

法在定位实验程序中的４１个错误时的定位代价．图中的三角形表示ＤＥＳＣＢＩ定位各个错误时的准确度，圆形表示ＤＥＳＳＯＢＥＲ定位各个错误时的准确度．连线表示本文方法对错误类型的预测以及对相应的方法（ＤＥＳＣＢＩ或ＤＥＳＳＯＢＥＲ）的选用．图３

０５４计　　算　　机　　学　　报２０１３年

的结构和图例与图１和图２相同，限于篇幅限制不再赘述．

图３　错误定位方法的预测准确度与定位准确度分析（ＤＥＳＣＢＩ和ＤＥＳＳＯＢＥＲ技术技术用于实验程序）图３表明，用本文方法在４１次预测中，２３次

预测正确，１８次预测错误，正确率为５６．１％，查准率为４５．２％，查全率为４７．１％，查准率和查全率低于５０％．ＤＥＳＣＢＩ的定位代价为２６．４％，ＤＥＳＳＯＢＥＲ的定位代价为２２．０％，本文方法的定位代价为２４．６％．比较得知，本文方法比单独使用ＤＥＳＣＢＩ的定位代价小，但是比单独使用ＤＥＳＳＯＢＥＲ的定位代价大．结果表明，将本文方法用于原子表达式粒度级别的错误定位技术效预测实验程序中的错误类型效果不明显，且定位错误的准确度不高．

实验４．

图４　错误定位方法的预测准确度与定位准确度分析（Ｔａｒａｎｔｕｌａ、ＦＯｎｌｙ、ＣＢＩ和ＳＯＢＥＲ技术技术用于实验程序）

图４表示了Ｔａｒａｎｔｕｌａ、ＦＯｎｌｙ、ＣＢＩ、ＳＯＢＥＲ及本文方法在定位实验程序中的４１个错误时的定位代价．图中的三角形表示Ｔａｒａｎｔｕｌａ定位各个错误时的准确度，圆形表示ＦＯｎｌｙ定位各个错误时的准确度，方形表示ＣＢＩ定位各个错误时的准确度，叉表示ＳＯＢＥＲ定位各个错误时的准确度．连线表示

本文方法对错误类型的预测以及对相应的方法（Ｔａｒａｎｔｕｌａ、ＦＯｎｌｙ、ＣＢＩ或ＳＯＢＥＲ）的选用．图４的结构和图例与图１、图２、图３相同，限于篇幅限制不再赘述．

图４表明，用本文方法在４１次预测中，１３次预测正确，２８次预测错误，正确率为２２．０％，查准率为２１．１％，查全率为１９．２％．查准率和查全率有明显下降．Ｔａｒａｎｔｕｌａ的定位代价为１４．９％，ＦＯｎｌｙ的定位代价为１６．４％，ＣＢＩ的定位代价为２６．５％，ＳＯＢＥＲ的定位代价为２９．３％，本文方法的定位代价为２３．５％．通过比较以上数据得知，本文方法比单独使用ＣＢＩ或ＳＯＢＥＲ的定位代价小，但是比单独使用Ｔａｒａｎｔｕｌａ、ＦＯｎｌｙ技术的定位代价大．

结果表明，将本文方法用于混合类型的错误定位技术不能有效预测实验程序中的错误类型，且定位程序错误的准确度较低．

实验５．图５表示了ＣＢＩ、ＳＯＢＥＲ、ＤＥＳＣＢＩ、ＤＥＳ

ＳＯＢＥＲ及本文方法在定位实验程序中的４１个错误时的定位代价．图中的三角形表示ＣＢＩ定位各个错误时的准确度，圆形表示ＳＯＢＥＲ定位各个错误时的准确度，方形表示ＤＥＳＣＢＩ定位各个错误时的准确度，叉表示ＤＥＳＳＯＢＥＲ定位各个错误时的准确度．连线表示本文方法对错误类型的预测以及对相应的方法（ＣＢＩ、ＳＯＢＥＲ、ＤＥＳＣＢＩ或ＤＥＳＳＯＢＥＲ）的选用．图５的结构与图１、图２、图３、图４相同，限于篇幅限制不再赘述．

图５　错误定位方法的预测准确度与定位准确度分析（ＣＢＩ、ＳＯＢＥＲ、ＤＥＳＣＢＩ和ＤＥＳＳＯＢＥＲ技术技术用于实验程序）

图５表明，用本文方法在４１次预测中，１３次预测正确，２８次预测错误，正确率为３１．７％，查准率为２２．６％，查全率为１４．３％．查准率和查全率明显偏低．ＣＢＩ的定位代价为２６．５％，ＳＯＢＥＲ的定位代价

１５４２期张云乾等：基于马尔可夫模型的软件错误定位方法

为２９．３％，ＤＥＳＣＢＩ的定位代价为２６．４％，ＤＥＳＳＯＢＥＲ的定位代价为２２．０％，本文方法的定位代价为２４．７％．通过比较以上数据得知，本文方法比单独使用ＣＢＩ、ＳＯＢＥＲ、ＤＥＳＣＢＩ的定位代价小，但是比单独使用ＤＥＳＳＯＢＥＲ技术的定位代价大．结果表明，将本文方法用于混合粒度的错误定位技术不能有效预测实验程序中的错误类型，且定位程序错误的准确度不高．

实验６．图６表示了Ｔａｒａｎｔｕｌａ、ＦＯｎｌｙ及本文方法在定

位真实程序中的１６个错误时的定位代价．图中的三角形表示Ｔａｒａｎｔｕｌａ定位各个错误时的准确度，圆形表示ＦＯｎｌｙ定位各个错误时的准确度．连线表示本文方法对错误类型的预测以及对相应的方法（Ｔａｒａｎｔｕｌａ或ＦＯｎｌｙ）的选用．图６的结构与图１相同，限于篇幅限制不再赘述．

图６　错误定位方法的预测准确度与定位准确度分析（Ｔａｒａｎｔｕｌａ和ＦＯｎｌｙ技术用于真实程序）

图６表明，用本文方法在１６次预测中，１３次预测正确，３次预测错误，正确率为８１．２５％，查准率为７５．５％，查全率为７９．２％．Ｔａｒａｎｔｕｌａ的定位错误的平均代价是１３．６％，ＦＯｎｌｙ的定位代价为３．４３％，本方法的定位代价为２．４４％．通过比较以上数据得知，本文方法比单独使用Ｔａｒａｎｔｕｌａ或ＦＯｎｌｙ技术的定位代价小．结果表明，将本文方法用于基于语句的错误定位技术能够有效预测真实程序中的错误类型，并能够准确定位程序中的错误．

实验７．图７表示了ＣＢＩ、ＳＯＢＥＲ及本文方法在定位真

实程序中的１６个错误时的定位代价．图中的三角形表示ＣＢＩ定位各个错误时的准确度，圆形表示ＳＯＢＥＲ定位各个错误时的准确度．连线表示本文方法对错误类型的预测以及对相应的方法（ＣＢＩ或

ＳＯＢＥＲ）的选用．图７的结构与图２相同，限于篇幅限制不再赘述．

图７　错误定位方法的预测准确度与定位准确度分析（ＣＢＩ和ＳＯＢＥＲ技术用于真实程序）

图７表明，用本文方法在１６次预测中，１１次预测正确，５次预测错误，正确率为６８．７５％，查准率为３６．７％，查全率为４５．８％．查准率和查全率均低于５０％．ＣＢＩ的定位代价是１７．８％，ＳＯＢＥＲ的定位代价为２２．９％，本方法的定位代价为１８．３％．通过比较以上数据得知，本文方法比单独使用ＣＢＩ定位代价大，但比单独使用ＳＯＢＥＲ技术的定位代价小．结果表明，将本文方法用于复合表达式粒度级别的基于谓词的错误定位技术能够预测真实程序中的错误类型，然而定位程序错误的准确度受到影响．

实验８．图８表示了ＤＥＳＣＢＩ、ＤＥＳＳＯＢＥＲ及本文方

法在定位真实程序中的１６个错误时的定位代价．图中的三角形表示ＤＥＳＣＢＩ定位各个错误时的准确度，圆形表示ＤＥＳＳＯＢＥＲ定位各个错误时的准确度．连线表示本文方法对错误类型的预测以及对相应的方法（ＤＥＳＣＢＩ或ＤＥＳＳＯＢＥＲ）的选用．图８的结构与图３相同，这里不再介绍．

图８　错误定位方法的预测准确度与定位准确度分析　　　　　（ＤＥＳＣＢＩ和ＤＥＳＳＯＢＥＲ技术用于真实程序）

２５４计　　算　　机　　学　　报２０１３年

图８表明，用本文方法在１６次预测中，９次预测正确，７次预测错误，正确率为５６．２５％，查准率为３０％，查全率为４４．４％．查准率和查全率进一步降低．ＤＥＳＣＢＩ的定位代价是１９．６％，ＤＥＳＳＯＢＥＲ的定位代价为２０．４％，本方法的定位代价为２０．６％．通过比较以上数据得知，本文方法比单独使用ＤＥＳＣＢＩ或ＤＥＳＳＯＢＥＲ技术的定位代价大．结果表明，将本文方法用于原子表达式粒度级别的错误定位技术预测真实程序中的错误类型的效果不明显，且定位程序错误准确度受到影响．

实验９．图９表示了Ｔａｒａｎｔｕｌａ、ＦＯｎｌｙ、ＣＢＩ、ＳＯＢＥＲ及

本文方法在定位真实程序中的１６个错误时的定位代价．图中的三角形表示Ｔａｒａｎｔｕｌａ定位各个错误时的准确度，圆形表示ＦＯｎｌｙ定位各个错误时的准确度，方形表示ＣＢＩ定位各个错误时的准确度，叉表示ＳＯＢＥＲ定位各个错误时的准确度．连线表示本文方法对错误类型的预测以及对相应的方法（Ｔａｒａｎｔｕｌａ、ＦＯｎｌｙ、ＣＢＩ或ＳＯＢＥＲ）的选用．图９的结构和图例与图４相同，限于篇幅限制不再赘述．

图９　错误定位方法的预测准确度与定位准确度分析（Ｔａｒａｎｔｕｌａ、ＦＯｎｌｙ、ＣＢＩ和ＳＯＢＥＲ技术用于真实程序）

图９表明，用本文方法在１６次预测中，３次预测正确，１３次预测错误，正确率为１８．７５％，查准率为１０．８％，查全率为１２．３％．查准率和查全率明显偏低．Ｔａｒａｎｔｕｌａ的定位代价为１３．６％，ＦＯｎｌｙ的定位代价为３．４％，ＣＢＩ的定位代价为１７．８％，ＳＯＢＥＲ的定位代价为２２．９％，本文方法的定位代价为１４．６％．通过比较以上数据得知，本文方法比单独使用ＣＢＩ或ＳＯＢＥＲ的定位代价小，但是比单独使用Ｔａｒａｎｔｕｌａ或ＦＯｎｌｙ技术的定位代价大．结

果表明，将本文方法用于混合类型的错误定位技术不能准确预测真实程序中的错误类型，且定位程序错误的准确度不高．

实验１０．图１０表示了ＣＢＩ、ＳＯＢＥＲ、ＤＥＳＣＢＩ、ＤＥＳ

ＳＯＢＥＲ及本文方法在定位真实程序中的１６个错误时的定位代价．图中的三角形表示ＣＢＩ定位各个错误时的准确度，圆形表示ＳＯＢＥＲ定位各个错误时的准确度，方形表示ＤＥＳＣＢＩ定位各个错误时的准确度，叉表示ＤＥＳＳＯＢＥＲ定位各个错误时的准确度．连线表示本文方法对错误类型的预测以及对相应的方法（ＣＢＩ、ＳＯＢＥＲ、ＤＥＳＣＢＩ或ＤＥＳＳＯＢＥＲ）的选用．图１０的结构与图５相同，限于篇幅限制不再赘述．

图１０　错误定位方法的预测准确度与定位准确度分析（ＣＢＩ、ＳＯＢＥＲ、ＤＥＳＣＢＩ和ＤＥＳＳＯＢＥＲ技术用于真实程序）

图１０表明，用本文方法在１６次预测中，５次预测正确，１６次预测错误，正确率为３１．２５％，查准率为２０．８％，查全率为１２．５％．查准率和查全率明显偏低．ＣＢＩ的定位代价为１７．８％，ＳＯＢＥＲ的定位代价为２２．９％，ＤＥＳＣＢＩ的定位代价为１９．６％，ＤＥＳＳＯＢＥＲ的定位代价为２０．４％，本文方法的定位代价为２０．５％．通过比较以上数据得知，本文方法比单独使用ＳＯＢＥＲ技术定位代价小，比单独使用ＣＢＩ、ＤＥＳＣＢＩ或ＤＥＳＳＯＢＥＲ技术的定位代价大．结果表明，将本文方法用于混合粒度的错误定位技术不能准确预测真实程序中的错误类型，且定位错误准确度不高．４５　实验结论

表２总结了实验１～实验１０的观察结果，通过４．４节中对实验结果的观察与分析，结合表２，我们得到４点初步结论．

３５４２期张云乾等：基于马尔可夫模型的软件错误定位方法

表２　错误定位方法效果总结定位效果

实验１、６（语句级别）实验２、７（复合表达式）实验３、８（原子表达式）实验４、９（混合类型）实验５、１０（混合级别）小型程序

（Ｓｉｅｍｅｎｓ实验程序）有效有效弱效无效无效中型程序

（Ｕｎｉｘ真实程序）有效弱效弱效无效无效综合结果有效中效弱效无效无效

结论１．　结合实验１和实验６的分析，我们观察到，在应用基于语句的错误定位技术时，本文方法的错误预测准确度和错误定位准确度优于单独使用某个基于语句的错误定位技术．因此得出结论：本文方法适用于基于语句的错误定位技术．

结论２．　结合实验２、实验３、实验７和实验８的分析，我们观察到，在应用基于谓词错误定位技术时，本文方法在应用基于复合表达式的错误定位技术时能够有效预测错误，且错误定位准确度有所提高，但在应用基于原子表达式的错误定位技术时效果不佳．因此得出结论：本文方法用于基于谓词的错误定位技术时有效，但更适用于粗粒度的错误定位技术．

结论３．　结合实验４和实验９的分析，我们观察到，在应用相同类型错误定位技术时，本文方法的错误预测准确度和错误定位准确度表现优于应用混合类型的错误定位技术．因此得出结论：本文方法更适用于应用于相同类型的错误定位技术．

结论４．　结合实验５和实验１０的分析，我们观察到，在应用相同粒度级别错误定位技术时，本文方法的错误预测准确度和错误定位准确度优于应用混合粒度级别错误定位技术的情况．因此得出结论：本文方法更适用于应用相同粒度级别的错误定位技术．４６　实验有效性分析

实验有效性分析主要从以下几个方面进行：首先，本文评价了文中提出的错误类型预测模

型的预测准确性．为了科学地评价错误类型，本文提出使用错误定位方法来甄别错误的类型．这样的好处在于：（１）能够无偏差地断定错误类型；（２）在对错误进行分类时，不需要考虑错误的内在逻辑和语言特性；（３）更便于备选错误定位技术的选择．我们依据软件开发实践和错误定位技术的研究提出这样的方法，其前提假设是大多数错误定位技术只对定位某类或某几类错误有效．对这一点的实验研究与分析能够更好地为本实验结论提供有效性保障．

其次，本文提出的错误定位方法可将其它错误

定位技术组成备选集，通过评价备选集中的各个备选技术对不同类型错误的定位准确度，结合对错误类型的预测结果，选择适合的错误定位技术来实施．对备选集中的错误定位技术会影响到实验结论的有效性．为了验证本文提出的错误定位方法，我们采用了同原理错误定位技术（包括不同粒度的错误定位技术和基于不同类型频谱的错误定位技术）对本文提出的错误定位方法进行评估．在采用不同原理错误定位技术（例如将基于频谱的错误定位技术与结合静态分析技术的切片错误定位技术混用）时，我们预期有可能得到不同的实验结果．

另外，本文采用公认的Ｓｉｅｍｅｎｓ数据集和中型的真实ＵＮＩＸ工具程序对本文方法进行了实验验证．使用其它类型的程序、其它语言的程序及其它领域的程序作为实验程序将有可能得到不同的实验结果．

此外，将本文的错误定位方法与其它错误定位方法结合．举例来说，Ａｇｒａｗａｌ等人［１８］确定可疑区域并利用切片技术分析错误位置．本文方法可与类似的错误定位技术相结合，用以确定可疑区域，并利用切片技术跟踪分析错误位置．将本文的错误定位方法与其它错误定位方法结合时有可能得出不同的实验有效性结论．

最后，本文通过对各个实验的分析，得出定性的结论．这样更便于理解和对本文提出的错误定位方法的使用给出指导．在未来工作中，我们计划使用更大型的受控实验来评价本文提出的方法，并汇报定量的分析结果来提供客观评价．

５　总结与展望为了对软件错误进行自动化定位，人们提出了

统计错误定位技术．此类技术的错误定位准确度同目标错误类型和程序特征紧密相关，如何选择适合的技术并将其实施于错误定位中，是需要解决的实际问题．

本文分析了单元测试的特性及对软件错误类型进行预测的可行性，采用马尔可夫过程建立预测模

４５４计　　算　　机　　学　　报２０１３年

型，根据判定的错误类型从错误定位技术备选集中选择合适的错误定位技术来实施．实验表明，相比使用单一技术的错误定位方法，本文提出的方法能够更快地定位到程序中存在的软件错误．同时，在实验验证中，我们发现本文方法更适用于应用相同类型或相同粒度级别的错误定位技术，在应用粗粒度级别的错误定位技术时效果更好，且在基于语句的错误定位技术上效果最佳．我们相信这一发现能够有效地指导本文方法在实际中的应用．

在未来的工作中，我们将研究如何有效地对本文方法进行改进，使其能够工作在不同粒度级别的错误定位技术上，并研究如何有效地对程序中存在的多个错误进行同时定位．

参考文献

［１］ＹｕＫａｉ，ＬｉｎＭｅｎｇＸｉａｎｇ．Ａｄｖａｎｃｅｓｉｎａｕｔｏｍａｔｉｃｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎｔｅｃｈｎｉｑｕｅｓ．ＣｈｉｎｅｓｅＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒｓ，２０１１，３４（８）：１４１１１４２２（ｉｎＣｈｉｎｅｓｅ）（虞凯，林梦香．自动化软件错误定位技术研究进展．计算机学报，２０１１，３４（８）：１４１１１４２２）

［２］ＪｕＸｉａｏＬｉｎ，ＪｉａｎｇＳｈｕＪｕａｎ，ＺｈａｎｇＹａｎＭｅｉ，ＤｏｎｇＧｕｏＷｅｉ．Ａｄｖａｎｃｅｓｉｎｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎｔｅｃｈｎｉｑｕｅｓ．ＪｏｕｒｎａｌｏｆＦｒｏｎｔｉｅｒｓｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，２０１２，６（６）：０４８１０４９４（ｉｎＣｈｉｎｅｓｅ）（鞠小林，姜淑娟，张艳梅，董国伟．软件故障定位技术进展．计算机科学与探索，２０１２，６（６）：０４８１０４９４）

［３］ＪｏｎｅｓＪＡ，ＨａｒｒｏｌｄＭＪ，ＳｔａｓｋｏＪ．Ｖｉｓｕａｌｉｚａｔｉｏｎｏｆｔｅｓｔｉｎｆｏｒｍａｔｉｏｎｔｏａｓｓｉｓｔｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２４ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＳｏｆｔｗａｒｅＥｎｇｉｎｅｅｒｉｎｇ（ＩＣＳＥ２００２）．Ｏｒｌａｎｄｏ，Ｆｌｏｒｉｄａ，ＵＳＡ，２００２：４６７４７７

［４］ＷｏｎｇＷＥ，ＤｅｂｒｏｙＶ，ＣｈｏｉＢ．Ａｆａｍｉｌｙｏｆｃｏｄｅｃｏｖｅｒａｇｅｂａｓｅｄｈｅｕｒｉｓｔｉｃｓｆｏｒｅｆｆｅｃｔｉｖｅｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎ．ＪｏｕｒｎａｌｏｆＳｙｓｔｅｍｓａｎｄＳｏｆｔｗａｒｅ，２０１０，８３（２）：１８８２０８

［５］ＡｒｕｍｕｇａＮａｉｎａｒＰ，ＣｈｅｎＴ，ＲｏｓｉｎＪ，ＬｉｂｌｉｔＢ．Ｓｔａｔｉｓｔｉｃａｌｄｅｂｕｇｇｉｎｇｕｓｉｎｇｃｏｍｐｏｕｎｄｂｏｏｌｅａｎｐｒｅｄｉｃａｔｅｓ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２００７ＩｎｔｅｒｎａｔｉｏｎａｌＳｙｍｐｏｓｉｕｍｏｎＳｏｆｔｗａｒｅＴｅｓｔｉｎｇａｎｄＡｎａｌｙｓｉｓ（ＩＳＳＴＡ２００７）．Ｌｏｎｄｏｎ，Ｅｎｇｌａｎｄ，２００７：５１５

［６］ＬｉｕＣ，ＦｅｉＬ，ＹａｎＸ，ＭｉｄｋｉｆｆＳＰ，ＨａｎＪ．Ｓｔａｔｉｓｔｉｃａｌｄｅｂｕｇｇｉｎｇ：Ａｈｙｐｏｔｈｅｓｉｓｔｅｓｔｉｎｇｂａｓｅｄａｐｐｒｏａｃｈ．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＳｏｆｔｗａｒｅＥｎｇｉｎｅｅｒｉｎｇ，２００６，３２（１０）：８３１８４８

［７］ＷａｎｇＸ，ＣｈｅｕｎｇＳＣ，ＣｈａｎＷＫ，ＺｈａｎｇＺ．Ｔａｍｉｎｇｃｏｉｎｃｉｄｅｎｔａｌｃｏｒｒｅｃｔｎｅｓｓ：Ｃｏｖｅｒａｇｅｒｅｆｉｎｅｍｅｎｔｗｉｔｈｃｏｎｔｅｘｔｐａｔｔｅｒｎｓｔｏｉｍｐｒｏｖｅｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ３１ｓｔＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＳｏｆｔｗａｒｅＥｎｇｉｎｅｅｒｉｎｇ（ＩＣＳＥ２００９）．Ｖａｎｃｏｕｖｅｒ，Ｃａｎａｄａ，２００９：４５５５

［８］ＹｕＹ，ＪｏｎｅｓＪＡ，ＨａｒｒｏｌｄＭＪ．Ａｎｅｍｐｉｒｉｃａｌｓｔｕｄｙｏｆｔｈｅｅｆｆｅｃｔｓｏｆｔｅｓｔｓｕｉｔｅｒｅｄｕｃｔｉｏｎｏｎｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ３０ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＳｏｆｔｗａｒｅＥｎｇｉｎｅｅｒｉｎｇ（ＩＣＳＥ２００８）．Ｌｅｉｐｚｉｇ，Ｇｅｒｍａｎｙ，２００８：２０１２１０

［９］ＺｈａｎｇＺ，ＣｈａｎＷＫ，ＴｓｅＴＨ．Ｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎｂａｓｅｄｏｎｌｙｏｎｆａｉｌｅｄｒｕｎｓ．ＩＥＥＥＣｏｍｐｕｔｅｒ，２０１２，４５（６）：６４７１

［１０］ＳａｎｔｅｌｉｃｅｓＲ，ＪｏｎｅｓＪＡ，ＹｕＹ，ＨａｒｒｏｌｄＭＪ．Ｌｉｇｈｔｗｅｉｇｈｔｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎｕｓｉｎｇｍｕｌｔｉｐｌｅｃｏｖｅｒａｇｅｔｙｐｅｓ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ３１ｓｔＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＳｏｆｔｗａｒｅＥｎｇｉｎｅｅｒｉｎｇ（ＩＣＳＥ２００９）．Ｗａｓｈｉｎｇｔｏｎ，ＤＣ，ＵＳＡ，２００９：５６６６

［１１］ＺｈａｎｇＺ，ＪｉａｎｇＢ，ＣｈａｎＷＫ，ＴｓｅＴＨ，ＷａｎｇＸ．Ｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎｔｈｒｏｕｇｈｅｖａｌｕａｔｉｏｎｓｅｑｕｅｎｃｅｓ．ＪｏｕｒｎａｌｏｆＳｙｓｔｅｍｓａｎｄＳｏｆｔｗａｒｅ，２０１０，８３（２）：１７４１８７

［１２］ＴａｎＤｅＧｕｉ，ＣｈｅｎＬｉｎ，ＷａｎｇＺｉＹｕａｎ，ＤｉｎｇＨｕｉ，ＺｈｏｕＹｕＭｉｎｇ，ＸｕＢａｏＷｅｎ．Ｓｐｅｃｔｒａｂａｓｅｄｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎｂｙｉｎｃｒｅａｓｉｎｇｍａｒｇｉｎａｌｗｅｉｇｈｔ．ＣｈｉｎｅｓｅＪｏｕｒｎａｌｏｆＣｏｍｐｕｔｅｒｓ，２０１０，３３（１２）：２３３５２３４２（ｉｎＣｈｉｎｅｓｅ）（谭德贵，陈林，王子元，丁晖，周毓明，徐宝文．通过增大边际权重提高基于频谱的错误定位效率．计算机学报，２０１０，３３（１２）：２３３５２３４２）

［１３］ＳｔｒｏｏｃｋＤＷ．ＡｎＩｎｔｒｏｄｕｃｔｉｏｎｔｏＭａｒｋｏｖＰｒｏｃｅｓｓｅｓ．Ｂｅｒｌｉｎ：Ｓｐｒｉｎｇｅｒ，２００５

［１４］ＤｏＨ，ＥｌｂａｕｍＳＧ，ＲｏｔｈｅｍｅｌＧ．Ｓｕｐｐｏｒｔｉｎｇｃｏｎｔｒｏｌｌｅｄｅｘｐｅｒｉｍｅｎｔａｔｉｏｎｗｉｔｈｔｅｓｔｉｎｇｔｅｃｈｎｉｑｕｅｓ：ａｎｉｎｆｒａｓｔｒｕｃｔｕｒｅａｎｄｉｔｓｐｏｔｅｎｔｉａｌｉｍｐａｃｔ．ＥｍｐｉｒｉｃａｌＳｏｆｔｗａｒｅＥｎｇｉｎｅｅｒｉｎｇ，２００５，１０（４）：４０５４３５

［１５］ＲｅｎｉｅｒｉｓＭ，ＲｅｉｓｓＳＰ．Ｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎｗｉｔｈｎｅａｒｅｓｔｎｅｉｇｈｂｏｒｑｕｅｒｉｅｓ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１８ｔｈＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｕｔｏｍａｔｅｄＳｏｆｔｗａｒｅＥｎｇｉｎｅｅｒｉｎｇ（ＡＳＥ２００３）．ＬｏｓＡｌａｍｉｔｏｓ，ＵＳＡ，２００３：３０３９

［１６］ＬｉｂｌｉｔＢ，ＮａｉｋＭ，ＺｈｅｎｇＡＸ，ＡｉｋｅｎＡ，ＪｏｒｄａｎＭＩ．Ｓｃａｌａｂｌｅｓｔａｔｉｓｔｉｃａｌｂｕｇｉｓｏｌａｔｉｏｎ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２００５ＡＣＭＳＩＧＰＬＡＮＣｏｎｆｅｒｅｎｃｅｏｎＰｒｏｇｒａｍｍｉｎｇＬａｎｇｕａｇｅＤｅｓｉｇｎａｎｄＩｍｐｌｅｍｅｎｔａｔｉｏｎ（ＰＬＤＩ２００５）．Ｃｈｉｃａｇｏ，Ｉｌｌｉｎｏｉｓ，ＵＳＡ，２００５：１５２６

［１７］ＺｈａｎｇＺ，ＣｈａｎＷＫ，ＴｓｅＴＨ，ＪｉａｎｇＢ，ＷａｎｇＸ．Ｃａｐｔｕｒｉｎｇｐｒｏｐａｇａｔｉｏｎｏｆｉｎｆｅｃｔｅｄｐｒｏｇｒａｍｓｔａｔｅｓ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ７ｔｈＪｏｉｎｔＭｅｅｔｉｎｇｏｆｔｈｅＥｕｒｏｐｅａｎＳｏｆｔｗａｒｅＥｎｇｉｎｅｅｒｉｎｇＣｏｎｆｅｒｅｎｃｅａｎｄｔｈｅＡＣＭＳＩＧＳＯＦＴＳｙｍｐｏｓｉｕｍｏｎｔｈｅＦｏｕｎｄａｔｉｏｎｓｏｆＳｏｆｔｗａｒｅＥｎｇｉｎｅｅｒｉｎｇ（ＥＳＥＣ／ＦＳＥ２００９）．Ａｍｓｔｅｒｄａｍ，ＴｈｅＮｅｔｈｅｒｌａｎｄｓ，２００９：４３５２

［１８］ＡｇｒａｗａｌＨ，ＨｏｒｇａｎＪＲ，ＬｏｎｄｏｎＳ，ＷｏｎｇＷＥ．Ｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎｕｓｉｎｇｅｘｅｃｕｔｉｏｎｓｌｉｃｅｓａｎｄｄａｔａｆｌｏｗｔｅｓｔｓ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ６ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＳｙｍｐｏｓｉｕｍｏｎＳｏｆｔｗａｒｅＲｅｌｉａｂｉｌｉｔｙＥｎｇｉｎｅｅｒｉｎｇ（ＩＳＳＲＥ１９９５）．Ｔｏｕｌｏｕｓｅ，Ｆｒａｎｃｅ，１９９５：１４３１５１

［１９］ＣａｉＸ，ＬｙｕＭＲ，ＶｏｕｋＭＡ．Ａｎｅｘｐｅｒｉｍｅｎｔａｌｅｖａｌｕａｔｉｏｎｏｎｒｅｌｉａｂｉｌｉｔｙｆｅａｔｕｒｅｓｏｆ狀ｖｅｒｓｉｏｎｐｒｏｇｒａｍｍｉｎｇ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１６ｔｈＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＳｙｍｐｏｓｉｕｍｏｎＳｏｆｔｗａｒｅＲｅｌｉａｂｉｌｉｔｙＥｎｇｉｎｅｅｒｉｎｇ（ＩＳＳＲＥ２００５）．Ｗａｓｈｉｎｇｔｏｎ，ＤＣ，ＵＳＡ，２００５：１６１１７０

［２０］ＴａｎｇＱｉＦｅｎｇ，ＸｕＬｅｉ，ＱｉａｎＪｕ，ＣｈｅｎＬｉｎ，ＺｈａｎｇＺｈｅｎＹｕ．Ａｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎｍｅｔｈｏｄｂａｓｅｄｏｎｍｏｄｅｌｃｏｍｂｉｎａｔｉｏｎ．Ｓｃｉｅｎｃｅｐａｐｅｒ，２０１２，７（１）：１９２７（ｉｎＣｈｉｎｅｓｅ）（唐启锋，许蕾，钱巨，陈林，张震宇．一种基于模型结合的错误定位方法．中国科技论文，２０１２，７（１）：１９２７）

５５４２期张云乾等：基于马尔可夫模型的软件错误定位方法

［２１］ＷｅｉｓｅｒＭ．Ｐｒｏｇｒａｍｍｅｒｓｕｓｅｓｌｉｃｅｓｗｈｅｎｄｅｂｕｇｇｉｎｇ．ＣｏｍｍｕｎｉｃａｔｉｏｎｓｏｆｔｈｅＡＣＭ，１９８２，２５（７）：４４６４５２

［２２］ＺｈａｎｇＸ，ＧｕｐｔａＲ，ＺｈａｎｇＹ．Ｅｆｆｉｃｉｅｎｔｆｏｒｗａｒｄｃｏｍｐｕｔａｔｉｏｎｏｆｄｙｎａｍｉｃｓｌｉｃｅｓｕｓｉｎｇｒｅｄｕｃｅｄｏｒｄｅｒｅｄｂｉｎａｒｙｄｅｃｉｓｉｏｎｄｉａｇｒａｍｓ／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２６ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎ

ＳｏｆｔｗａｒｅＥｎｇｉｎｅｅｒｉｎｇ（ＩＣＳＥ２００４）．Ｅｄｉｎｂｕｒｇｈ，ＵＫ，２００４：５０２５１１

［２３］ＡｌＫｈａｎｊａｒｉＺＡ，ＷｏｏｄｗａｒｄＭＲ，ＲａｍａｄｈａｎＨ，ＫｕｔｔｉＮＳ．Ｔｈｅｅｆｆｉｃｉｅｎｃｙｏｆｃｒｉｔｉｃａｌｓｌｉｃｉｎｇｉｎｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎ．ＳｏｆｔｗａｒｅＱｕａｌｉｔｙＪｏｕｒｎａｌ，２００５，１３（２）：１２９１５３

犣犎犃犖犌犢狌狀犙犻犪狀，ｂｏｒｎｉｎ１９８８，Ｍ．Ｓ．ｃａｎｄｉｄａｔｅ．Ｈｉｓｒｅｓｅａｒｃｈｉｎｔｅｒｅｓｔｓｉｎｃｌｕｄｅｔｈｅａｐｐｌｉｃａｔｉｏｎｏｆｃｏｍｐｕｔｅｒ．

犣犎犈犖犌犣犺犲狀犵，ｂｏｒｎｉｎ１９８０，Ｐｈ．Ｄ．，ａｓｓｏｃｉａｔｅｐｒｏｆｅｓｓｏｒ．Ｈｉｓｒｅｓｅａｒｃｈｉｎｔｅｒｅｓｔｓｉｎｃｌｕｄｅｍａｃｈｉｎｅｌｅａｒｎｉｎｇａｎｄｓｏｆｔｗａｒｅｔｅｓｔｉｎｇ．

犑犐犡犻犪狅犎狌犻，ｂｏｒｎｉｎ１９７７，Ｐｈ．Ｄ．，ｌｅｃｔｕｒｅｒ．Ｈｅｒｒｅｓｅａｒｃｈｉｎｔｅｒｅｓｔｓｉｎｃｌｕｄｅｓｏｆｔｗａｒｅａｎａｌｙｓｉｓａｎｄｃｏｎｓｔｒａｉｎｔｓｏｌｖｉｎｇ．

犣犎犃犖犌犠犲狀犅狅，ｂｏｒｎｉｎ１９７６，Ｐｈ．Ｄ．，ａｓｓｏｃｉａｔｅｐｒｏｆｅｓｓｏｒ．Ｈｉｓｒｅｓｅａｒｃｈｉｎｔｅｒｅｓｔｓｉｎｃｌｕｄｅｎｅｔｗｏｒｋｄｉｓｔｒｉｂｕｔｅｄｃｏｍｐｕｔｉｎｇａｎｄｓｏｆｔｗａｒｅｅｎｇｉｎｅｅｒｉｎｇ．

犣犎犃犖犌犣犺犲狀犢狌，ｂｏｒｎｉｎ１９７９，Ｐｈ．Ｄ．，ａｓｓｏｃｉａｔｅｐｒｏｆｅｓｓｏｒ．Ｈｉｓｃｕｒｒｅｎｔｒｅｓｅａｒｃｈｔｏｐｉｃｓｉｎｃｌｕｄｅｓｏｆｔｗａｒｅｔｅｓｔｉｎｇａｎｄｓｏｆｔｗａｒｅｄｅｂｕｇｇｉｎｇ．

犅犪犮犽犵狉狅狌狀犱　　Ｍｏｄｅｒｎｓｏｆｔｗａｒｅｐｒｏｇｒａｍｓａｒｅｓｔｉｌｌｆａｒｆｒｏｍｂｅｉｎｇｂｕｇｆｒｅｅ．Ａｓａｒｅｓｕｌｔ，ｓｏｆｔｗａｒｅｄｅｂｕｇｇｉｎｇｉｓａｎｅｃｅｓｓａｒｙｐｈａｓｅｉｎｔｈｅｌｉｆｅｃｙｃｌｅｏｆｓｏｆｔｗａｒｅｄｅｖｅｌｏｐｍｅｎｔ．Ｄｅｂｕｇｇｉｎｇｇｅｎｅｒａｌｌｙｃｏｎｓｉｓｔｓｏｆｔｗｏｓｔｅｐｓ，犳犪狌犾狋犾狅犮犪犾犻狕犪狋犻狅狀ａｎｄ犳犪狌犾狋狉犲狆犪犻狉犻狀犵．Ｐｒｏｇｒａｍｍｅｒｓｉｔｅｒａｔｉｖｅｌｙｌｏｃａｔｅｆａｕｌｔ，ｆｉｘｔｈｅｆａｕｌｔ，ｖｅｒｉｆｙｔｈｅｆｉｘｉｎｇｗｏｒｋ，ａｎｄｔｈｅｎｍｏｖｅｔｏｔｈｅｎｅｘｔｆａｕｌｔ．Ｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎｔｅｃｈｎｉｑｕｅｓｆａｃｉｌｉｔａｔｅｔｈｅｆｉｒｓｔｓｔｅｐ，ｗｈｉｃｈｉｓａｎｉｍｐｏｒｔａｎｔｂｕｔａｌｓｏａｔｉｍｅｃｏｎｓｕｍｉｎｇｔａｓｋ．Ｓｔａｔｉｓｔｉｃａｌｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎｔｅｃｈｎｉｑｕｅｓａｃｃｏｍｐｌｉｓｈｔｈｅｔａｓｋｏｆｆａｕｌｔｌｏｃａｔｉｎｇｂｙａｎａｌｙｚｉｎｇｔｈｅｄｙｎａｍｉｃｐｒｏｇｒａｍｂｅｈａｖｉｏｒｓ．Ｖｉａｉｎｖｅｓｔｉｇａｔｉｎｇｔｈｅｓｐｅｃｔｒａｃａｐｔｕｒｅｄｉｎｐｒｏｇｒａｍｅｘｅｃｕｔｉｏｎ，ｔｈｅｓｅｔｅｃｈｎｉｑｕｅｓｆｉｎａｌｌｙｐｒｏｄｕｃｅａｌｉｓｔｏｆｓｕｓｐｉｃｉｏｕｓｓｔａｔｅｍｅｎｔｓ，ｉｎｏｒｄｅｒｏｆｈｏｗｍｕｃｈｔｈｅｙａｒｅｄｅｅｍｅｄｔｏｂｅｆａｕｌｔｙｏｒｈｏｗｍｕｃｈｔｈｅｙａｒｅｄｅｅｍｅｄｔｏｂｅｒｅｌａｔｅｄｔｏｆａｕｌｔｓ．

Ｈｏｗｅｖｅｒ，ｄｉｆｆｅｒｅｎｔｔｅｃｈｎｉｑｕｅｓｃａｎｂｅｅｆｆｅｃｔｉｖｅｉｎｌｏｃａｔｉｎｇｓｐｅｃｉｆｉｃｋｉｎｄｓｏｆｆａｕｌｔｓａｎｄｐｒｅｖｉｏｕｓｓｔｕｄｉｅｓｓｈｏｗｎｏｅｖｉｄｅｎｃｅｔｈａｔａｎｙｏｆｓｕｃｈｔｅｃｈｎｉｑｕｅｓｃａｎｂｅｕｎｉｖｅｒｓａｌｌｙｍｏｒｅｅｆｆｅｃｔｉｖｅｔｈａｎｔｈｅｏｔｈｅｒｓｉｎｌｏｃａｔｉｎｇｆａｕｌｔｓｏｆｄｉｆｆｅｒｅｎｔｆａｕｌｔ

ｐａｔｔｅｒｎｓｏｒｆｒｏｍｄｉｆｆｅｒｅｎｔａｐｐｌｉｃａｔｉｏｎｄｏｍａｉｎｓ．Ｉｎｐｒａｃｔｉｃｅ，ｈｏｗｔｏｐｒｅｄｉｃｔｔｈｅｃｈａｒａｃｔｅｒｉｓｔｉｃｓｏｆｔｈｅｎｅｘｔｆａｕｌｔｈａｓｎｏｓｃｉｅｎｔｉｆｉｃｂａｓｉｃ，ａｎｄｔｈｅｒｅｉｓｙｅｔｎｏｇｕｉｄｅｔｏｃｈｏｏｓｅａｐｒｏｐｅｒｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎｔｅｃｈｎｉｑｕｅｔｏａｐｐｌｙ，ｗｈｅｎｆａｃｉｎｇａｐｒｏｇｒａｍｗｈｉｃｈｆａｕｌｔｉｎｅｓｓｈａｓｂｅｅｎｄｉｓｃｌｏｓｅｄｂｙｔｈｅｅｘｉｓｔｅｎｃｅｏｆｆａｉｌｅｄｒｕｎｓ．

Ｉｎｔｈｉｓｐａｐｅｒ，ｗｅｄｉｓｃｕｓｓｔｈｅｆｅａｓｉｂｉｌｉｔｙｏｆｐｒｅｄｉｃｔｉｎｇｆａｕｌｔｃｌａｓｓｉｎａｕｎｉｔｔｅｓｔｐｒｏｃｅｓｓ．Ｗｅａｐｐｌｙａｃｌａｓｓｉｆｉｃａｔｉｏｎｍｅｃｈａｎｉｓｍｔｏｃａｔｅｇｏｒｙｐｒｅｖｉｏｕｓｆａｕｌｔｓ，ｅｖａｌｕａｔｅｔｈｅｅｆｆｅｃｔｉｖｅｎｅｓｓｏｆｍａｎｙｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎｔｅｃｈｎｉｑｕｅｓｉｎｌｏｃａｔｉｎｇｔｈｅｆａｕｌｔｓ，ｅｍｐｌｏｙａＭａｒｋｏｖｐｒｏｃｅｓｓｍｏｄｅｌｔｏｐｒｅｄｉｃｔｔｈｅｎｅｘｔｆａｕｌｔｃｌａｓｓ，ａｎｄｐｉｃｋｏｕｔｔｈｅｍｏｓｔｐｒｏｍｉｓｉｎｇｏｎｅｆｒｏｍｔｈｅｔｅｃｈｎｉｑｕｅｃａｎｄｉｄａｔｅｓｅｔｔｏａｐｐｌｙ．ＴｈｅｅｍｐｉｒｉｃａｌｓｔｕｄｙｓｈｏｗｓｔｈａｔｏｕｒｍｅｔｈｏｄｏｌｏｇｙｉｓｅｆｆｅｃｔｉｖｅｉｎｌｏｃａｔｉｎｇｆａｕｌｔｓｉｎｔｈｅＳｉｅｍｅｎｓｓｕｉｔｅｐｒｏｇｒａｍｓａｎｄｒｅａｌｉｓｔｉｃＵＮＩＸｕｔｉｌｉｔｙｐｒｏｇｒａｍｓ．

ＴｈｉｓｗｏｒｋｉｓｓｕｐｐｏｒｔｅｄｂｙｔｈｅＮＳＦＣｐｒｏｊｅｃｔ“Ｒｅｇｒｅｓｓｉｏｎｔｅｓｔｉｎｇａｎｄｆａｕｌｔｌｏｃａｌｉｚａｔｉｏｎｉｎａｃｏｎｔｉｎｕｏｕｓｉｎｔｅｇｒａｔｉｏｎｅｎｖｉｒｏｎｍｅｎｔ”（Ｎｏ．６１００３０２７）．

６５４计　　算　　机　　学　　报２０１３年