发明名称 |
基于组合理论的类自然语言的语义信息抽取方法及其系统 |
摘要 |
本发明公开了一种基于组合理论的类自然语言的语义信息抽取方法及其系统,运用先进的语义分析技术,对基于web的大数据进行深度分析和挖掘,在海量的web数据中挖掘有商业价值的信息,可运用于广大中小型企业的商业智能服务领域,可为中小企业提供预测市场需求变化、预测竞争对手的行动、发现新的和潜在的竞争对手、支持技术开发决策、支持营销战术决策等方面的商业智能服务以及产品精准营销服务,并且大大降低了企业商机情报获取成本,提高获取信息的能力,极大的增强企业的竞争力。 |
申请公布号 |
CN104281695A |
申请公布日期 |
2015.01.14 |
申请号 |
CN201410537886.3 |
申请日期 |
2014.10.13 |
申请人 |
安徽华贞信息科技有限公司 |
发明人 |
贾岩 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
合肥市长远专利代理事务所(普通合伙) 34119 |
代理人 |
程笃庆;黄乐瑜 |
主权项 |
一种基于组合理论的类自然语言的语义信息抽取方法,其特征在于,包括以下步骤:获取大数据,将其作为基础数据源;在所述获取的大数据中查找表达相近意义,或者包涵相近语义信息的语句,将所述语句的语义元素进行标注;通过内置语义词典对所述语句中未标记部分进行分析,生成归纳方式;在所述归纳方式中拣选符合自然语言表达习惯即符合直觉的方式;根据所述符合自然语言表达习惯的方式对所述语句中未被规则涵盖的语句进行新一轮迭代,形成一套可理解、可用于语义匹配和文本信息抽取库。 |
地址 |
230000 安徽省合肥市高新区黄山路602号国家大学科技园A502 |