发明名称 |
一种语义搜索方法及系统 |
摘要 |
本发明公开了一种语义搜索方法及系统,该方法包括以下步骤:建立语义本体库;根据语义本体库分析句子,得到句子的名词性概念、动作概念和倾向性,得到语句的语义描述,统计分析段落主要语义指代,然后利用文档篇章结构总结篇章主要描述对象、语义倾向性等语义基本信息,并与文档一起关联存储;根据语义本体库进行行业相关数据探测和抓取。本发明通过网络探针技术,自动发现内容相似度高的网站;通过提取网页正文,对每段文本编码,可准确判断一篇文章重复度。 |
申请公布号 |
CN104281693A |
申请公布日期 |
2015.01.14 |
申请号 |
CN201410537867.0 |
申请日期 |
2014.10.13 |
申请人 |
安徽华贞信息科技有限公司 |
发明人 |
贾岩 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
合肥市长远专利代理事务所(普通合伙) 34119 |
代理人 |
程笃庆;黄乐瑜 |
主权项 |
一种语义搜索方法,其特征在于,包括以下步骤:建立语义本体库;根据语义本体库分析句子,得到句子的名词性概念、动作概念和倾向性,得到语句的语义描述,统计分析段落主要语义指代,然后利用文档篇章结构总结篇章主要描述对象、语义倾向性等语义基本信息,并与文档一起关联存储;根据语义本体库进行行业相关数据探测和抓取。 |
地址 |
230000 安徽省合肥市高新区黄山路602号国家大学科技园A502 |