发明名称 |
电子文档与某一领域相关程度的判别方法及其应用 |
摘要 |
本发明公开了一种电子文档与某一领域相关程度的判别方法,并将专业度应用于搜索工具和/或引擎,达到文档信息分类和/或过滤和/或封锁之功效,用于提高搜索结果的质量及搜索效率。该方法步骤为:将搜索工具和/或引擎系统分析提取到的关键词和关键字在专业特征码库/封锁特征码库进行查找,取出对应的预设的行业特征度,进行加权平均,可再乘以行业特征比,计算出专业度;将上述计算所得的专业度应用于搜索领域,以提高搜索的执行效率和/或搜索结果的质量和/或提供符合封锁策略的搜索结果和/或提供符合特定类别的搜索结果。 |
申请公布号 |
CN101021866A |
申请公布日期 |
2007.08.22 |
申请号 |
CN200710048610.9 |
申请日期 |
2007.03.13 |
申请人 |
白云 |
发明人 |
白云;刘圣;何顺超 |
分类号 |
G06F17/30(2006.01) |
主分类号 |
G06F17/30(2006.01) |
代理机构 |
成都天嘉专利事务所 |
代理人 |
徐丰 |
主权项 |
1、电子文档与某一领域相关程度的判别方法,其特征在于步骤如下:A、建立行业特征码库和/或封锁特征码库,行业特征码库和封锁特征码库贮存有行业特征码,每个行业特征码对应一个或多个行业特征度;B、根据搜索工具和/或引擎系统将从文档内容中提取出的关键词与行业特征码库和/或封锁特征码库进行逐一对比,从行业特征码库和/或封锁特征码库中找出与关键词匹配的行业特征码,并取出对应的行业特征度;若未找到匹配的行业特征码,则该关键词行业特征度记为0或不作处理;C、对所有提取到的关键词的行业特征度进行加权平均,再结合关键词专业特征比转换为该文档的行业相关度即专业度。 |
地址 |
610212四川省成都市双流县中和镇蓝色钻石9-6-11 |