发明名称 基于LDA模型和PageRank算法建立特征接口有向图的方法
摘要 本发明公开了软件工程领域内的基于LDA模型和PageRank算法建立特征接口有向图的方法,包括如下步骤:1)选取适当的开源软件库作为代码支持;2)通过LDA主题模型提取出项目对应的主题作为该项目的特征集合;3)检索各项目中的接口信息,与各项目对应的特征集合建立联系,构成由项目特征集合指向项目接口集合的特征‑接口有向图,利用PageRank算法计算接口在项目内部的调用次数作为特征‑接口有向图中边的权值;4)在构成特征‑接口有向图后,程序开发人员根据待开发项目的特征与所述特征‑接口有向图中的特征进行匹配,根据有向图边的指向关系推荐可能的最优接口列表供开发人员选择使用,本发明提高了软件开发的效率,可用于软件开发中。
申请公布号 CN103927177B 申请公布日期 2017.01.25
申请号 CN201410156746.1 申请日期 2014.04.18
申请人 扬州大学 发明人 孙小兵;施伟;李斌;李云
分类号 G06F9/44(2006.01)I 主分类号 G06F9/44(2006.01)I
代理机构 南京苏科专利代理有限责任公司 32102 代理人 董旭东
主权项 一种基于LDA模型和PageRank算法建立特征接口有向图的方法,其特征在于,包括如下步骤:步骤1) 选取适当的开源软件库作为代码支持;步骤2) 对选取的开源软件库中的项目,通过LDA主题模型提取出项目对应的主题作为该项目的特征集合,具体方法如下:LDA模型对开源软件库中的项目提取主题时,通过对于LDA参数设置,实现每次只提取一个项目,以该项目为一个文档库,通过LDA模型提取出该项目的主题,然后,依次对开源软件库中的其他开源项目使用同样的方法提取主题;在当前需要提取主题的项目中使用LDA模型提取主题时,将分布值最高的前两个主题作为最佳特征集合BestF<sub>i</sub>,最佳特征集合BestF<sub>i</sub>作为步骤4)中接口的匹配对象;步骤3) 检索各项目中的接口信息,与各项目对应的特征集合建立联系,构成由项目特征集合指向项目接口集合的特征‑接口有向图,利用PageRank算法计算接口在项目内部的调用次数作为特征‑接口有向图中边的权值,具体方法如下:遍历当前项目,检索出项目文件中的接口并以“文件名.接口名”的形式定位该接口,建立由最佳特征集合BestF<sub>i</sub>指向接口集合的特征‑接口有向图;特征‑接口有向图建立之后,使用PageRank算法统计项目中各接口的调用次数,同时,依据计算值大小对接口进行排序;步骤4) 在构成特征‑接口有向图后,程序开发人员根据待开发项目的特征与所述特征‑接口有向图中的特征进行匹配,根据有向图边的指向关系推荐可能的最优接口列表供开发人员选择使用,具体方法如下:当程序开发人员进行特征匹配时,将开发人员选择的待开发项目的特征集合f与最佳特征集合BestF<sub>i</sub>进行匹配,匹配方法为:将特征集合f中的每一个词依次匹配BestF<sub>i</sub>中对应的词语,当匹配成功词数占特征集合f总词数的百分比大于等于50%时,判定特征集合f与所述最佳特征集合BestF<sub>i</sub>匹配成功,并根据特征‑接口有向图中边的指向为程序开发人员推荐接口列表供程序开发人员自行选择;当程序开发人员选择某个接口之后,根据步骤3)中的定位方式确定具体的接口,并为开发人员推荐该接口。
地址 225009 江苏省扬州市开发区大学南路88号