发明名称 属性提取装置和方法
摘要 本发明提出了一种用于从非结构化文本中进行属性提取的装置和方法,可以基于属性关联知识,提取出与种子属性出现模式不同的新属性。根据本发明的属性提取装置包括:查询项构建单元,用于根据输入的实例和种子属性,基于属性关联知识库,构建基于一种或多种文法的查询项;文本检索单元,用于根据所述查询项,对非结构化文本库中的非结构化文本进行文本检索;以及文本匹配单元,用于对检索得到的文本执行基于前述文法的文本匹配,从而提取出所述实例的其他属性。通过本发明的技术方案,能够根据种子属性,从非结构化文本中自动提取出新属性。
申请公布号 CN102200983A 申请公布日期 2011.09.28
申请号 CN201010135788.9 申请日期 2010.03.25
申请人 日电(中国)有限公司 发明人 丰强泽;齐红威
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 赵伟
主权项 一种属性提取装置,包括:查询项构建单元,用于根据输入的实例和种子属性,基于属性关联知识库,构建基于一种或多种文法的查询项;文本检索单元,用于根据所述查询项,对非结构化文本库中的非结构化文本进行文本检索;以及文本匹配单元,用于对检索得到的文本执行基于前述文法的文本匹配,从而提取出所述实例的其他属性。
地址 100007 北京市东城区东四十条甲22号南新仓国际大厦B栋12层1222室