发明名称 |
一种网站的搜索方法和装置 |
摘要 |
本申请提供了一种网站的搜索方法和装置,其中,所述的方法包括:收集数据源,并提取数据源中的官方词语;收集用户在所述网站的搜索关键词,并抓取所述搜索关键词搜索得到的网页;根据搜索关键词和网页中的关键词的相似度,查询出与搜索关键词相似的网页中的关键词,并将所述网页中的关键词和所述搜索关键词作为白话词;建立白话词与官方词语的对应关系,并依据所述对应关系生成百姓体词库;接收用户输入的白话词,查询所述百姓体词库,获取与所述用户输入的白话词相匹配的官方词语,并依据所获取的官方词语搜索网站。因此,本申请能够解决目前搜索结果查询不全或不准确、搜索结果不实用的问题。 |
申请公布号 |
CN103425742A |
申请公布日期 |
2013.12.04 |
申请号 |
CN201310298439.2 |
申请日期 |
2013.07.16 |
申请人 |
北京中科汇联信息技术有限公司 |
发明人 |
乔亚飞;田文奇;胡绍武;孟凡兴;游世学;赵丽娜 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京润泽恒知识产权代理有限公司 11319 |
代理人 |
苏培华 |
主权项 |
一种网站的搜索方法,其特征在于,包括:收集数据源,并提取数据源中的官方词语;收集用户在所述网站的搜索关键词,并抓取所述搜索关键词搜索得到的网页;根据搜索关键词和网页中的关键词的相似度,查询出与搜索关键词相似的网页中的关键词,并将所述网页中的关键词和所述搜索关键词作为白话词;建立白话词与官方词语的对应关系,并依据所述对应关系生成百姓体词库;接收用户输入的白话词,查询所述百姓体词库,获取与所述用户输入的白话词相匹配的官方词语,并依据所获取的官方词语搜索网站。 |
地址 |
100083 北京市海淀区北四环中路229号海泰大厦北527 |