发明名称 搜索结构化文档的设备和方法
摘要 同义词搜索部件(131a)在同义词词典(14)中搜索指示了来自终端(30)的指定结构的第一信息中包括的标志所属的同义词组的同义词组标识符。基于搜索结果,指定结构的信息产生部件(131b)产生指定结构的第二信息,在所述的指定结构的第二信息中将在指定结构的第一信息中包括的标志替换为指示同义词组的各自的同义词组标识符。同义词结构模板搜索部件(131c)在同义词结构模板管理块(152)中搜索匹配指定结构的第二信息的同义词结构模板。获取部件(132a)从数据库(15)获得由对应于所检测的同义词结构模板的结构模板指示的结构化文档中的文档结构。
申请公布号 CN1752980A 申请公布日期 2006.03.29
申请号 CN200510116569.5 申请日期 2005.09.23
申请人 株式会社东芝;东芝解决方案株式会社 发明人 谷川均;幸田和久
分类号 G06F17/30(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 北京市中咨律师事务所 代理人 杨晓光;李峥
主权项 1.一种结构化文档搜索设备,用于响应包含指定结构的第一信息并由客户终端产生的搜索请求在存储于数据库中的多个结构化文档中搜索对应于指定结构的第一信息的结构化文档中的文档结构,所述的指定结构的第一信息指定了包括标志的任意文档结构,所述的结构化文档搜索设备的特征在于包括:结构模板存储装置,用于存储关于指定到结构模板的标识符的作为标志结构模板的多个结构模板,所述的结构模板对应包括在存储在数据库中的结构化文档中的文档结构;同义词词典,其存储指出同义词组的同义词组标识符和属于所述同义词组的标志,所述每个同义词组都是一组具有共同概念的标志;同义词搜索装置,用于在同义词词典中搜索指明了在指定结构的第一信息中包括的标志所属的同义词组的同义词组标识符的搜索处理;指定结构的信息产生装置,用于基于用于搜索处理的同义词搜索装置的搜索结果产生指定结构的第二信息,在所述的指定结构的第二信息中将包括在指定结构的第一信息中的标志替换为指明所述标志所属的同义词组的各自的同义词组标识符;同义词结构模板存储装置,用于存储同义词结构模板,在所述的同义词结构模板中将存储在结构模板存储装置中的结构模板中包括的全部标志替换为指明所述全部标志所属的同义词组的同义词组标识符;同义词结构模板搜索装置,用于在同义词结构模板存储装置中搜索对应指定结构的第二信息的同义词结构模板;和获取装置,用于从数据库获得由同义词结构模板搜索装置搜索的结构模板所指示的结构化文档中的文档结构。
地址 日本东京都