发明名称 | 利用二次语义标注的文本信息提取方法 | ||
摘要 | 本发明公开了一种利用二次语义标注的文本信息提取方法,包括如下步骤:步骤1,根据待处理文本中的任务需求,建立任务语义词典;步骤2,利用预存的通用语义词典对待处理文本进行第一次语义标注;步骤3,利用任务语义词典对第一次语义标注后的文本进行第二次语义标注;步骤4,对经过第二次语义标注的文本利用基于语义的子语言语法进行解析以及信息提取,所述信息为任务所需的概念及概念所对应的关系。本发明方法克服了现有大规模语义词典覆盖性低,同时语义标记不能服务于特定子语言语法的问题,对于在中文环境下建立具有任务适应性的信息提取提供了更好的解决方案。 | ||
申请公布号 | CN103810156A | 申请公布日期 | 2014.05.21 |
申请号 | CN201410021389.8 | 申请日期 | 2014.01.17 |
申请人 | 浙江大学 | 发明人 | 段会龙;李昊旻;张寅升;葛彩霞 |
分类号 | G06F17/27(2006.01)I | 主分类号 | G06F17/27(2006.01)I |
代理机构 | 杭州天勤知识产权代理有限公司 33224 | 代理人 | 胡红娟 |
主权项 | 一种利用二次语义标注的文本信息提取方法,其特征在于,包括如下步骤:步骤1,根据待处理文本中的任务需求,建立任务语义词典;步骤2,利用预存的通用语义词典对待处理文本进行第一次语义标注;步骤3,利用任务语义词典对第一次语义标注后的文本进行第二次语义标注;步骤4,对经过第二次语义标注的文本利用基于语义的子语言语法进行解析以及信息提取,所述信息为任务所需的概念及概念所对应的关系。 | ||
地址 | 310027 浙江省杭州市西湖区浙大路38号 |