发明名称 基于数据挖掘获取词用法知识的系统及方法
摘要 本发明提供了一种基于数据挖掘获取词用法知识的系统及方法,所述系统包括:输入装置,用于输入待查词或词组;查询分析装置,对所述待查词或词组中的关键字进行分析,根据分析结果将待查词或词组送入相应的输入模式处理装置进行处理;多输入模式处理装置,利用语义知识和词典对所述待查词或词组进行分析和扩展,形成查询项,根据所述查询项对网页信息进行搜索,得到与所述待查词或词组相关的网页;网页分析装置,对所述搜索得到的网页进行分析,将所述网页转换为候选文本;用法知识提取装置,对所述候选文本进行处理,提取待查词或词组的上下文信息和典型例句;输出装置,输出上下文信息和典型例句。采用本发明,能准确获取词用法知识。
申请公布号 CN102214189A 申请公布日期 2011.10.12
申请号 CN201010147993.7 申请日期 2010.04.09
申请人 腾讯科技(深圳)有限公司 发明人 方高林
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 广州华进联合专利商标代理有限公司 44224 代理人 何平;曾旻辉
主权项 一种基于数据挖掘获取词用法知识的系统,其特征在于,所述系统包括:输入装置,用于输入待查词或词组;查询分析装置,对所述待查词或词组中的关键字进行分析,根据分析结果将待查词或词组送入相应的输入模式处理装置进行处理;多输入模式处理装置,利用语义知识和词典对所述待查词.或词组进行分析和扩展,形成查询项,根据所述查询项对网页信息进行搜索,得到与所述待查词或词组相关的网页;网页分析装置,对所述搜索得到的网页进行分析,将所述网页转换为候选文本;用法知识提取装置,对所述候选文本进行处理,提取待查词或词组的上下文信息和典型例句;输出装置,输出上下文信息和典型例句。
地址 518044 广东省深圳市福田区振兴路赛格科技园2栋东403室