发明名称 |
信息抽取的方法及系统 |
摘要 |
本发明公开一种信息抽取的方法及系统,涉及信息技术领域,该方法包括:从种子事件信息集合中提取事件名关键词集合;利用所述事件名关键词集合和预设场所名集合从事件网页中抽取事件信息,并利用所述事件信息更新所述种子事件信息集合;利用所述更新后的种子事件信息集合和所述事件名关键词集合从所述事件网页中学出事件抽取模式;利用所述事件抽取模式从所述事件网页中抽取事件信息,并利用所述事件信息更新所述种子事件信息集合。本发明实施例主要用于信息抽取领域,在实现网页事件信息的抽取时,降低了人工标注训练语料的工作量。 |
申请公布号 |
CN102193951A |
申请公布日期 |
2011.09.21 |
申请号 |
CN201010127980.3 |
申请日期 |
2010.03.19 |
申请人 |
华为技术有限公司 |
发明人 |
周雅倩;何一鸣;姜孟晋;谭卫国 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京中博世达专利商标代理有限公司 11274 |
代理人 |
申健 |
主权项 |
一种信息抽取的方法,其特征在于,包括:从种子事件信息集合中提取事件名关键词集合;利用所述事件名关键词集合和预设场所名集合从事件网页中抽取事件信息,并利用所述事件信息更新所述种子事件信息集合;利用所述更新后的种子事件信息集合和所述事件名关键词集合从所述事件网页中学习出事件抽取模式;利用所述事件抽取模式从所述事件网页中抽取事件信息,并利用所述事件信息更新所述种子事件信息集合。 |
地址 |
518129 广东省深圳市龙岗区坂田华为基地总部办公楼 |