发明名称 |
用于从文本储存库里提取仿真陈述的系统和方法 |
摘要 |
公开了一种用于从文本储存库里提取仿真陈述的方法(400),所述仿真陈述与给定仿真陈述类别相关联。所述方法(400)通过训练分类器(230)识别与所述给定仿真陈述类别有关的仿真陈述而开始。接下来从文本储存库中收集(410)与所述给定仿真陈述类别有关的文档或文档摘要。从所述文档或所述文档摘要中提取(420)与所述给定仿真陈述类别有预定关系的句子。在干扰环境中,通过用所述分类器(230)提取包含与所述给定仿真陈述类别有关的短语的片断来分类(440)所述句子。所述被提取的片断是与所述给定仿真陈述类别相关联的仿真陈述。 |
申请公布号 |
CN1991836A |
申请公布日期 |
2007.07.04 |
申请号 |
CN200610162992.3 |
申请日期 |
2006.11.30 |
申请人 |
国际商业机器公司 |
发明人 |
S·乔希;R·克瑞施那普姆;S·内吉;N·库马尔;G·罗摩克里希纳;K·梅赫塔;S·霍尔梅斯 |
分类号 |
G06F17/30(2006.01) |
主分类号 |
G06F17/30(2006.01) |
代理机构 |
北京市中咨律师事务所 |
代理人 |
于静;李峥 |
主权项 |
1.一种从文本储存库中提取与给定仿真陈述类别相关联的仿真陈述的方法,所述方法包括以下步骤:训练分类器识别与所述给定仿真陈述类别有关的仿真陈述;从文本储存库中收集与所述给定仿真陈述类别有关的文档或文档摘要;从所述文档或所述文档摘要中提取与所述给定仿真陈述类别有预定关系的句子;以及在干扰环境中,通过用所述分类器提取包含与所述给定仿真陈述类别有关的短语的片断来分类所述句子,所述被提取的片断是与所述给定仿真陈述类别相关联的所述仿真陈述。 |
地址 |
美国纽约 |