发明名称 |
一种基于模糊树核的句法树相似度计算方法 |
摘要 |
本发明公开了一种基于模糊树核的句法树相似度计算方法,所述方法包括:自顶向下遍历句法树;根据句法树节点类型相似度矩阵加载,对节点相似度进行计算;通过节点可删性规则集加载及节点相似度的计算进而计算节点产生式相似度;根据衰退因子设定及节点产生式相似度的计算对不同深度的节点的相似度进行加权求和;对句法树相似度进行归一化处理以消除句法树尺寸的影响,输出句法树相似度。本发明设计的算法加入了模糊匹配思想,主要改进在于引入最小编辑距离用于计算节点产生式间的相似度,实现了模糊树核函数,该项改进突破了原有函数需要两个产生式完全匹配的局限,显著提升了算法的分辨率。 |
申请公布号 |
CN104679732A |
申请公布日期 |
2015.06.03 |
申请号 |
CN201510115035.4 |
申请日期 |
2015.03.17 |
申请人 |
《中国学术期刊(光盘版)》电子杂志社有限公司;同方知网(北京)技术有限公司 |
发明人 |
罗思明;罗霄;李卫东 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京天奇智新知识产权代理有限公司 11340 |
代理人 |
刘黎明 |
主权项 |
一种基于模糊树核的句法树相似度计算方法,其特征在于,所述方法包括:自顶向下遍历句法树;根据句法树节点类型相似度矩阵加载,对节点相似度进行计算;通过节点可删性规则集加载及节点相似度的计算进而计算节点产生式相似度;根据衰退因子设定及节点产生式相似度的计算对不同深度的节点的相似度进行加权求和;对句法树相似度进行归一化处理以消除句法树尺寸的影响,输出句法树相似度。 |
地址 |
100084 北京市海淀区清华园清华大学36区1407、1408、1409 |