发明名称 |
基于多层文本分类器的轻量级本体匹配方法 |
摘要 |
一种基于多层文本分类器的轻量级本体匹配方法,该方法包括以下步骤:选择待匹配的两个本体中的第一本体,将第一本体的概念分类树和文本实例作为训练集,利用自底向上的多层文本特征选择策略构造多层文本分类器;利用多层文本分类器对所述两个本体中的第二本体的文本实例进行预测分类,将第二本体的文本实例分别归属到第一本体的多个概念;判定第二本体中的每个概念的所有文本实例中分别归属到第一本体中的每个概念的文本实例在所述所有文本实例中的比例,分别作为所述两个本体中的相应概念之间的相似度;基于概念之间的相似度得出所述两个本体的概念之间的映射关系,由此完成轻量级本体匹配。 |
申请公布号 |
CN102193928A |
申请公布日期 |
2011.09.21 |
申请号 |
CN201010120535.4 |
申请日期 |
2010.03.08 |
申请人 |
三星电子(中国)研发中心;三星电子株式会社 |
发明人 |
刘思培;王进;彭鸽;姜赢;胡晨 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京铭硕知识产权代理有限公司 11286 |
代理人 |
韩明星;王艳娇 |
主权项 |
一种基于多层文本分类器的轻量级本体匹配方法,包括以下步骤:选择待匹配的两个本体中的第一本体,将第一本体的概念分类树和文本实例作为训练集,利用自底向上的多层文本特征选择策略构造多层文本分类器;利用多层文本分类器对所述两个本体中的第二本体的文本实例进行预测分类,将第二本体的文本实例分别归属到第一本体的多个概念;判定第二本体中的每个概念的所有文本实例中分别归属到第一本体中的每个概念的文本实例在所述所有文本实例中的比例,分别作为所述两个本体中的相应概念之间的相似度;基于概念之间的相似度得出所述两个本体的概念之间的映射关系,由此完成轻量级本体匹配。 |
地址 |
210008 江苏省南京市中山路268号汇杰广场8楼 |