发明名称 |
用于自动分类对象的方法和系统 |
摘要 |
本发明提供了用于自动分类对象的方法和系统。所述方法包括:输入一组对象以及用于分类对象的类别层次结构;获取领域相关的本体信息;利用基于本体信息的方法将每个对象分类到类别层次结构中,以得到第一分类结果;利用基于信息检索(IR)的方法将每个对象分类到类别层次结构中,以得到第二分类结果;以及组合所述第一和第二分类结果以得到最终分类结果。本发明可被应用到单层或多层的类别层次结构,并且可以有效且精确的实现对象分类,从而获得更小的分类结果粒度。 |
申请公布号 |
CN101639837B |
申请公布日期 |
2012.10.24 |
申请号 |
CN200810134793.0 |
申请日期 |
2008.07.29 |
申请人 |
日电(中国)有限公司 |
发明人 |
孟昕;李建强;赵彧;史敬威 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京东方亿思知识产权代理有限责任公司 11258 |
代理人 |
柳春雷 |
主权项 |
一种用于分类对象的方法,包括:a)输入一组对象以及用于分类对象的类别层次结构;b)获取领域相关的本体信息;c)利用基于本体信息的方法将每个所述对象分类到所述类别层次结构中,以得到第一分类结果;d)利用基于信息检索的方法将每个所述对象分类到所述类别层次结构中,以得到第二分类结果;以及e)组合所述第一和第二分类结果以得到最终分类结果,其中所述第一分类结果是利用所述基于本体信息的方法将一对象分类到所述类别层次结构上的不同类别的得分S_Onto(i),所述第二分类结果是利用所述基于信息检索的方法将该对象分类到所述类别层次结构上的不同类别的得分S_IR(i),其中i表示类别,其中所述组合步骤包括:计算对应于所述基于本体信息的方法的第一方法权重W_Onto;计算对应于所述基于信息检索的方法的第二方法权重W_IR;计算组合得分S(i)=S_Onto(i)×W_Onto+S_IR(i)×W_IR;以及将所述对象分类到具有最大所述组合得分的类别,其中如果利用所述基于本体信息的方法计算出的得分S_Onto(i)中的最大值大于预定阈值,则将所述对象分类到具有所述最大得分的类别,作为所述最终分类结果。 |
地址 |
100007 北京市东城区东四十条甲22号南新仓国际大厦B座12层1222室 |