发明名称 |
根据倾向性值进行网页搜索的方法和装置 |
摘要 |
本发明公开了一种根据倾向性值进行网页搜索的方法和装置。该方法包括以下步骤:A)、获取若干网页,并下载至网页数据库;B)、对若干网页的文字进行命名体识别;C)、对若干网页中的若干命名体进行倾向性分析,获得若干网页的若干命名体的倾向性值;D)、制作前向索引表,前向索引表包括若干命名体的倾向性值;E)、制作倒排索引表,倒排索引表包括若干命名体的倾向性值;F)、输入搜索项,将搜索项分解为至少一个关键字;G)、根据倒排索引表,计算包括关键字的网页的排序权值,输出搜索结果。通过本发明的方法和装置,将含有搜索关键字的网页主要按照倾向性值排序,从而使倾向性为贬义或褒义的网页排名靠前,提升用户的搜索满意度。 |
申请公布号 |
CN102110160A |
申请公布日期 |
2011.06.29 |
申请号 |
CN201110044863.5 |
申请日期 |
2011.02.24 |
申请人 |
上海莱希信息科技有限公司;上海语天信息技术有限公司;杜一华 |
发明人 |
杜一华 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海旭诚知识产权代理有限公司 31220 |
代理人 |
王萍萍 |
主权项 |
一种根据倾向性值进行网页搜索的方法,其特征在于,包括以下步骤:A)、获取若干网页,并下载至网页数据库;B)、对所述若干网页的文字进行命名体识别;C)、对所述若干网页中的若干命名体进行倾向性分析,获得所述若干网页的所述若干命名体的倾向性值;D)、制作前向索引表,所述前向索引表包括所述若干命名体的倾向性值;E)、制作倒排索引表,所述倒排索引表包括所述若干命名体的倾向性值;F)、输入搜索项,将所述搜索项分解为至少一个关键字;G)、至少根据所述倒排索引表,计算包括所述关键字的网页的排序权值,输出搜索结果。 |
地址 |
201112 上海市闵行区联航路1588号1号业务楼(北楼)505室 |