发明名称 |
一种领域特征词的提取方法及系统 |
摘要 |
本发明涉及信息检索领域,提供了一种领域特征词的提取方法,包括,获取领域实体资源;获取领域实体的搜索结果;利用所述搜索结果提取候选领域特征词;根据所述候选领域特征词,筛选出领域特征词。本发明还提供了一种领域特征词的提取系统。采用本发明的技术方案,考虑了领域实体专业词与特征词的关系,采用通过领域专业词借助搜索引擎来提取领域特征词,既不需要在人工规则上花费很大精力投入,过程中只需要一些明显的规则、领域特征词做后续分析用;又避免了靠统计而没有大量优质的统计语料问题。该方案从实际出发,简单易行,效率高,可快速周期性更新,来提取应用于实际。 |
申请公布号 |
CN103258053A |
申请公布日期 |
2013.08.21 |
申请号 |
CN201310211467.6 |
申请日期 |
2013.05.31 |
申请人 |
深圳市宜搜科技发展有限公司 |
发明人 |
车天文;雷大伟;石志伟;周步恋;杨振东;王喜民 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
深圳市凯达知识产权事务所 44256 |
代理人 |
任转英;刘大弯 |
主权项 |
一种领域特征词的提取方法,其特征在于,包括,获取领域实体资源;获取领域实体的搜索结果;利用所述搜索结果提取候选领域特征词;根据所述候选领域特征词,筛选出领域特征词。 |
地址 |
518026 广东省深圳市福田区滨河路与彩田路交汇处联合广场A栋塔楼A5501-A |