发明名称 |
一种基于计算机的自然语言句法结构解析方法和装置 |
摘要 |
本发明公开了一种基于计算机的自然语言句法结构解析方法和装置。本发明依据抽象代数、集合论、组合数学和计算语言学等学科的数学原理和相应的计算机技术,运用复合函数的数学思想,通过建立矩阵模型和线性模型来进行自然语言句法结构解析。所述方法较易于实现,且可以大幅度提高复合式句子结构解析的准确性。 |
申请公布号 |
CN103927298A |
申请公布日期 |
2014.07.16 |
申请号 |
CN201410172114.4 |
申请日期 |
2014.04.25 |
申请人 |
秦一男 |
发明人 |
秦一男 |
分类号 |
G06F17/27(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京成创同维知识产权代理有限公司 11449 |
代理人 |
刘锋;张靖琳 |
主权项 |
一种基于计算机的自然语言句法结构解析方法,包括:读取待解析的经预处理的语句数据结构,所述经预处理的语句数据结构中仅包括语句的关联词单元、谓语动词单元、名词代词单元,且各词单元按照在所述经预处理的语句中的顺序进行编号,并标注类型;对每一谓语动词单元,生成对应的引导语元素、主语元素、谓语元素和宾语元素;所述引导语元素的可能取值为编号小于对应的谓语动词单元编号的关联词单元之一,或空单元;所述主语元素的可能取值为编号小于对应的谓语动词单元编号的名词代词单元之一或空单元,或在前出现的谓语动词单元对应的句法向量之一;所述谓语元素为对应的所述谓语动词单元;所述宾语元素的可能取值为编号大于对应的谓语动词单元编号且小于相邻的在后出现的谓语动词单元编号的名词代词单元之一,或在后出现的谓语动词单元对应的句法向量之一;根据所述引导语元素、主语元素、谓语元素和宾语元素的可能取值,获取每一谓语动词单元对应的句法向量的所有可能取值,所述句法向量包括引导语元素、主语元素、谓语元素和宾语元素;根据所有句法向量的所有可能取值,生成至少一个句法结构可能矩阵解,所述句法结构可能矩阵解由按照谓语动词单元编号顺序排列的句法向量组成;验证根据句法结构可能矩阵解得到的语句是否与所述经预处理的语句完全相同,如果完全相同,则将该句法结构可能矩阵解中的各句法向量作为句法结构解析结果之一。 |
地址 |
100871 北京市海淀区北京大学畅春新园公寓2号楼127室 |