发明名称 一种基于文本词性和程序调用关系的软件缺陷定位方法
摘要 本发明公开了一种基于文本词性和程序调用关系的软件缺陷定位方法,包括:1)提取缺陷报告里小结和描述的文本信息,根据词性标记提高缺陷报告中名词词项的权重以及小结模块所有词项的权重;2)根据开发者的需求参数ran滤除源代码文件不需要的成分,对缺陷报告文本信息和滤除后的源代码文件进行预处理;3)生成可疑缺陷源代码文件列表;4)通过字符串检索找到调用源文件,提高其相似度值校正原有排名;5)根据开发者的需求参数ran输出缺陷报告对应的缺陷源代码文件或者缺陷源代码文件列表。本发明利用文本词性调整词项权值,程序间的调用关系校正相似度值,以及根据程序员需求进行源代码文件滤除和最终结果输出,达到提高缺陷定位准确度的目的。
申请公布号 CN105159822A 申请公布日期 2015.12.16
申请号 CN201510492477.0 申请日期 2015.08.12
申请人 南京航空航天大学 发明人 周宇;童燕翔;王立松
分类号 G06F11/36(2006.01)I 主分类号 G06F11/36(2006.01)I
代理机构 江苏圣典律师事务所 32237 代理人 贺翔
主权项 一种基于文本词性和程序调用关系的软件缺陷定位方法,其特征在于,包括步骤如下:1)提取缺陷报告里小结和描述的文本信息,并标记文本词项的词性,然后根据词性标记提高缺陷报告文本信息中名词词项的权重并且整体提高小结模块所有词项的权重;2)根据开发者的需求参数ran滤除源代码文件不需要的成分,同时对缺陷报告文本信息和滤除后的源代码文件进行预处理,得到特征词集合;3)利用信息检索技术建立模型,计算缺陷报告与源代码文件的相似度,并根据相似度的大小生成可疑缺陷文件列表;4)提取缺陷报告文本信息里所含的类名并找到其对应的源代码文件,找出这些源代码文件在列表中排名最高的源代码文件,通过字符串检索找到排名最高源代码文件调用的所有源代码文件,即调用源文件,适当提高调用源文件的相似度值来校正原有排名;5)根据开发者的需求参数ran输出缺陷报告对应的缺陷源代码文件或者缺陷源代码文件列表。
地址 210016 江苏省南京市秦淮区御道街29号