发明名称 | 一种中文句子中谓语语块提取方法及系统 | ||
摘要 | 本发明提供了一种中文句子中谓语语块提取方法及系统,通过对中文句子进行分词处理,得到所述中文句子中的所有分词单位构成的分词单位序列集合;加载所述分词单位序列集合对应的概念,获得所述中文句子中所有分词单位的全部概念;对动态概念的兼类进行排除;根据剩余的动态概念与其它相关概念间的组合生成不同类型的候选谓语语块;从所述候选谓语语块中选取出所述中文句子的谓语语块。综合了多方面的语言规律对中文句子中所有分词单位的全部概念进行筛选和组合,并据此选取出中文句子的谓语语块,辨识精准,降低了误判率。 | ||
申请公布号 | CN104657348A | 申请公布日期 | 2015.05.27 |
申请号 | CN201510065333.7 | 申请日期 | 2015.02.06 |
申请人 | 北京师范大学 | 发明人 | 朱筠;晋耀红;刘小蝶 |
分类号 | G06F17/27(2006.01)I | 主分类号 | G06F17/27(2006.01)I |
代理机构 | 北京三聚阳光知识产权代理有限公司 11250 | 代理人 | 李敏 |
主权项 | 一种中文句子中谓语语块提取方法,其特征在于,包括:对中文句子进行分词处理,得到所述中文句子中的所有分词单位构成的分词单位序列集合;加载所述分词单位序列集合对应的概念,获得所述中文句子中所有分词单位的全部概念;对动态概念的兼类进行排除;根据剩余的动态概念与其它相关的概念间的组合生成不同类型的候选谓语语块;从所述候选谓语语块中选取出所述中文句子的谓语语块。 | ||
地址 | 100875 北京市海淀区新街口外大街19号 |