发明名称 | 一种利用语义分析的垂直搜索引擎系统与方法 | ||
摘要 | 本发明公开了一种利用语义分析的垂直搜索引擎系统与方法。该系统包括文本语义分析、索引系统、检索系统三个模块。文本语义分析模块以句为单位,提取文本中每个句子所表示的语境属性,并对语境属性进行切分标注;语境属性综合了词语的出现次数、词语的概念属性和词语在句子中的语义地位;索引模块为每种类型的语境属性单独建立索引;在检索时,可以对不同语境属性进行独立检索,也可以进行组合检索。本发明的优点在于,利用语境属性来表示词语所在的语言环境,这样在检索时,可以增加语言环境的限定,使得检索结果的相关度更好。本发明特别适合于企业搜索、垂直搜索等与领域相关的搜索引擎系统,也适合于通用搜索引擎对大量“暗网”数据的处理。 | ||
申请公布号 | CN102200975A | 申请公布日期 | 2011.09.28 |
申请号 | CN201010132348.8 | 申请日期 | 2010.03.25 |
申请人 | 北京师范大学 | 发明人 | 晋耀红 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京万科园知识产权代理有限责任公司 11230 | 代理人 | 杜澄心;张亚军 |
主权项 | 一种利用语义分析技术实现垂直搜索引擎的方法,其特征在于,采用以句为单位的语义分析技术,提取文本中每个句子所表示的语境属性,并对语境属性进行切分标注;在索引时,为每种类型的语境属性单独建立索引;在检索时,可以对不同语境属性进行独立检索,也可以进行组合检索。 | ||
地址 | 100875 北京市海淀区新街口外大街19号 |