发明名称 基于语义的查找、集成和提供评论信息的方法及搜索系统
摘要 本发明涉及互联网搜索技术,旨在提供一种基于语义的查找、集成和提供评论信息的方法及搜索系统。该方法包括利用搜索引擎发现和集成文字评论信息,并按主题分类和汇总评论文本;特别还包括对非文字评论信息的提取,并挖掘非文字评论信息与文字评论信息之间的语义联系,在此基础上集成这两类信息以供搜索服务需要。本发明实现了对异构信息(即文字信息和非文字信息)和层次化的评论内容的评估、集成和整合。赋予搜索引擎发现、创建和管理与评论对象相关的评论信息的新功能,能够带来更多更体贴的使用体验,更好地服务广大用户。
申请公布号 CN102279894A 申请公布日期 2011.12.14
申请号 CN201110278049.X 申请日期 2011.09.19
申请人 嘉兴亿言堂信息科技有限公司 发明人 周诚
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 杭州中成专利事务所有限公司 33212 代理人 金祺
主权项 基于语义的查找、集成和提供评论信息的方法,包括利用搜索引擎发现和集成文字评论信息,并按主题分类和汇总评论文本;其特征在于,该方法还包括对非文字评论信息的提取,并挖掘非文字评论信息与文字评论信息之间的语义联系,在此基础上集成这两类信息以供搜索服务需要;其实现的步骤包括:(1)主动识别提供评论信息的数据源或被动接收包含评论信息的信息源的链接请求,建立与该数据源的链接,并将包含评论信息在内的数据保存到抓取服务器上;(2)分析包含评论信息的数据,提取元信息以建立文字评论信息和非文字评论信息的语义注解标签;(3)利用语义注解标签从包含评论信息的数据中提取文字评论信息和非文字评论信息;(4)对文字评论信息与非文字评论信息进行标准化处理,通过语义分析来评估、过滤不合适的评论信息,并进行异常处理;(5)对已评估的信息根据评价对象及其内在的语义关系进行集成;(6)为集成好的信息和原始数据建立索引;(7)利用索引信息处理查询要求,返回匹配的内容。
地址 314000 浙江省嘉兴市城南路1369号科技大楼213室