发明名称 |
一种信息搜索方法及搜索引擎 |
摘要 |
本申请提供了一种信息搜索方法及搜索引擎,属于数据处理技术领域。其中方法包括:依据预置的各入口网站的网站模型,分别获取输入的查询词与各入口网站的关联度;所述入口网站的网站模型用于描述各实体词与相应入口网站的关联度;根据所述查询词与各入口网站的关联度选取入口网站作为价值网站;依据所述查询词在所述价值网站中进行信息搜索,得到相应的搜索结果。本申请将小众站点中的内容也通过模型进行索引,增强了行业类别和网站的覆盖面,提供了更加丰富的信息;而且本申请的操作流程均为自动完成,无需人工参与,且各网站模型可以自动训练和自动更新,大大提高了信息处理的效率。 |
申请公布号 |
CN103729374B |
申请公布日期 |
2017.04.19 |
申请号 |
CN201210390941.1 |
申请日期 |
2012.10.15 |
申请人 |
北京搜狗信息服务有限公司;北京搜狗科技发展有限公司 |
发明人 |
张帆 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京润泽恒知识产权代理有限公司 11319 |
代理人 |
苏培华 |
主权项 |
一种信息搜索方法,其特征在于,包括:依据预置的各入口网站的网站模型,分别获取输入的查询词与各入口网站的关联度;所述入口网站的网站模型用于描述各实体词与相应入口网站的关联度;所述各实体词与相应入口网站的关联度为依据各实体词在入口网站的出现概率和在全网网站的出现概率得到;根据所述查询词与各入口网站的关联度选取入口网站作为价值网站;依据所述查询词在所述价值网站中进行信息搜索,得到相应的搜索结果。 |
地址 |
100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 |