发明名称 |
一种汉语隐式篇章关系识别方法 |
摘要 |
本发明公开了一种汉语隐式篇章关系识别方法,所述方法包括以下步骤:步骤1,对汉语隐式篇章关系论元对进行自动分词处理,得到自动分词结果;步骤2,在得到的汉语隐式篇章关系论元自动分词结果的基础上,学汉语隐式篇章关系论元的特征表达;步骤3,基于得到的特征表达,通过基于最大间隔的神经网络模型对论元间的汉语隐式篇章关系进行建模;步骤4,利用得到的神经网络模型对汉语隐式篇章关系进行识别。本发明能够对汉语中的隐式篇章关系进行较准确地识别。经过在汉语篇章树库上的实验验证,相对于已有的英语隐式篇章关系识别方法,本发明方法在汉语隐式篇章关系识别上得到准确率更高的识别结果。 |
申请公布号 |
CN105955956A |
申请公布日期 |
2016.09.21 |
申请号 |
CN201610294189.9 |
申请日期 |
2016.05.05 |
申请人 |
中国科学院自动化研究所 |
发明人 |
张家俊;李浩然;宗成庆 |
分类号 |
G06F17/27(2006.01)I;G06F17/28(2006.01)I;G06N3/02(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
中科专利商标代理有限责任公司 11021 |
代理人 |
钟文芳 |
主权项 |
一种汉语隐式篇章关系识别方法,其特征在于,所述方法包括以下步骤:步骤1,对汉语隐式篇章关系论元对进行自动分词处理,得到自动分词结果;步骤2,在所述步骤1得到的汉语隐式篇章关系论元自动分词结果的基础上,学习汉语隐式篇章关系论元的特征表达;步骤3,基于所述步骤2得到的汉语隐式篇章关系论元的特征表达,通过基于最大间隔的神经网络模型对论元间的汉语隐式篇章关系进行建模;步骤4,利用所述步骤3得到的基于最大间隔的神经网络模型对于汉语隐式篇章关系进行识别。 |
地址 |
100190 北京市海淀区中关村东路95号 |