发明名称 文档处理装置和文档处理方法
摘要 文档处理装置、文档处理方法和记录相关程序的存储介质。本发明提供了一种文档处理装置,包括:存储器,其存储有语法数据,所述语法数据表示成为文档标题的可能性大的字符串或者成为文档标题的可能性小的字符串的语法;输入单元,其输入通过对文档进行数字化而获得的文档数据;提取单元,其分析输入的文档数据、并提取表示字符串的字符串数据;语法分析单元,其分析所提取的字符串数据、并指定对应于文档数据的文档中包含的各字符串的语法;以及指定单元,其根据语法分析单元的指定结果以及存储在存储器中的内容,从所提取的字符串数据中指定表示与文档数据对应的文档的标题的字符串数据。
申请公布号 CN100447805C 申请公布日期 2008.12.31
申请号 CN200510055925.7 申请日期 2005.03.18
申请人 富士施乐株式会社 发明人 增市博;刘绍明;田宗道弘;田川昌俊;田代洁;伊藤笃;石川恭辅;佐藤直子
分类号 G06K9/00(2006.01) 主分类号 G06K9/00(2006.01)
代理机构 北京三友知识产权代理有限公司 代理人 黄纶伟
主权项 1、一种文档处理装置,包括:存储器,其存储有语法数据,所述语法数据表示成为文档标题的可能性大的字符串或者成为文档标题的可能性小的字符串的语法;输入单元,其输入通过对文档进行数字化而获得的文档数据;提取单元,其分析所述输入单元输入的文档数据、并提取表示字符串的字符串数据;语法分析单元,其分析所述提取单元提取的字符串数据、并指定对应于所述文档数据的文档中包含的各字符串的语法,所述语法是构成字符串的字符的树结构;以及指定单元,其根据所述语法分析单元的指定结果以及所述存储器中存储的内容,从所述提取单元所提取的字符串数据中指定表示与所述文档数据对应的文档的标题的字符串数据,其中,利用权重数据表示具有语法数据所表示的语法的字符串是文档标题的可能性程度,并且所述权重数据与存储在所述存储器中的语法数据相关联,并且所述指定单元根据与表示所述语法分析单元所指定语法的语法数据相关联地存储在所述存储器中的权重数据,指定表示所述文档标题的字符串数据。
地址 日本东京