发明名称 电子文档与某一领域相关程度的判别方法及其应用
摘要 本发明公开了一种电子文档与某一领域相关程度的判别方法,并将专业度应用于搜索工具和/或引擎,达到文档信息分类和/或过滤和/或封锁之功效,用于提高搜索结果的质量及搜索效率。该方法步骤为:将搜索工具和/或引擎系统分析提取到的关键词和关键字在专业特征码库/封锁特征码库进行查找,取出对应的预设的行业特征度,进行加权平均,可再乘以行业特征比,计算出专业度;将上述计算所得的专业度应用于搜索领域,以提高搜索的执行效率和/或搜索结果的质量和/或提供符合封锁策略的搜索结果和/或提供符合特定类别的搜索结果。
申请公布号 CN101021866A 申请公布日期 2007.08.22
申请号 CN200710048610.9 申请日期 2007.03.13
申请人 白云 发明人 白云;刘圣;何顺超
分类号 G06F17/30(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 成都天嘉专利事务所 代理人 徐丰
主权项 1、电子文档与某一领域相关程度的判别方法,其特征在于步骤如下:A、建立行业特征码库和/或封锁特征码库,行业特征码库和封锁特征码库贮存有行业特征码,每个行业特征码对应一个或多个行业特征度;B、根据搜索工具和/或引擎系统将从文档内容中提取出的关键词与行业特征码库和/或封锁特征码库进行逐一对比,从行业特征码库和/或封锁特征码库中找出与关键词匹配的行业特征码,并取出对应的行业特征度;若未找到匹配的行业特征码,则该关键词行业特征度记为0或不作处理;C、对所有提取到的关键词的行业特征度进行加权平均,再结合关键词专业特征比转换为该文档的行业相关度即专业度。
地址 610212四川省成都市双流县中和镇蓝色钻石9-6-11