发明名称 | 内容提取方法 | ||
摘要 | 本发明提供一种内容提取方法,从多种样式的文档中提取内容,包括:保存步骤,将用于从不同样式的文档中提取内容的多个提取方法保存在保存单元中;获取步骤,获取配置信息,该配置信息包括用于确定所述保存单元中保存的提取方法的信息以及与该提取方法对应的参数;以及提取步骤,根据所述获取步骤中获取的所述配置信息,生成提取程序,从所述文档中提取内容。根据本发明的内容提取方法,在文档的样式繁多且不断变化的情况下,也能够使用户简单地从多种样式的文档中提取内容,从而避免了开发新的提取程序,增加了项目管理工具的灵活性,同时不明显影响用户的管理流程。 | ||
申请公布号 | CN102799597A | 申请公布日期 | 2012.11.28 |
申请号 | CN201110141390.0 | 申请日期 | 2011.05.26 |
申请人 | 株式会社日立制作所 | 发明人 | 细矢淳;柴梅平 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 永新专利商标代理有限公司 72002 | 代理人 | 陈萍 |
主权项 | 一种内容提取方法,从多种样式的文档中提取内容,其特征在于,包括:保存步骤,将用于从不同样式的文档中提取内容的多个提取方法保存在保存单元中;获取步骤,获取配置信息,该配置信息包括用于确定所述保存单元中保存的提取方法的信息以及与该提取方法对应的参数;以及提取步骤,根据所述获取步骤中获取的所述配置信息,生成提取程序,从所述文档中提取内容。 | ||
地址 | 日本东京都 |