发明名称 文本检索装置和文本检索方法
摘要 本发明提供文本检索装置、记录了文本检索程序的记录介质、以及文本检索方法。一种文本检索装置,利用N-gram方式进行文本检索,其特征在于,具有:检索对象文本分析部,其根据文本分析规则对检索对象文本进行分析,提取出索引词;索引生成部,其利用所述索引词生成索引;检索词分析部,其根据检索词分析规则来分析在检索条件中包含的检索词,从该检索词中切出词;检索条件生成部,其根据从所述检索词中切出的词,生成内部检索条件;以及检索处理部,其根据所述内部检索条件检索所述索引。
申请公布号 CN101021851B 申请公布日期 2011.05.18
申请号 CN200610128965.4 申请日期 2006.09.05
申请人 富士施乐株式会社 发明人 石飞康浩
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京三友知识产权代理有限公司 11127 代理人 李辉
主权项 一种文本检索装置,该文本检索装置利用N‑gram方式进行文本检索,该文本检索装置包括:检索对象文本分析部,其根据文本分析规则,对检索对象文本进行分析,提取出索引词;索引生成部,其利用所述索引词生成索引;检索词分析部,其根据检索词分析规则,分析在检索条件中包含的检索词,并从该检索词中切出词;检索条件生成部,其根据从所述检索词中切出的所述词来生成内部检索条件;以及检索处理部,其根据所述内部检索条件对所述索引进行检索,其中,所述文本分析规则中,在检索词为两个字符以上、且最后的一个字符为非ASCII字符的情况下,把仅有最后1个字符的词作为索引词来切出;所述检索词分析规则除了以下一点之外都与文本分析规则相同:当检索词为两个字符以上、且最后的1个字符为非ASCII字符的情况下,不切出仅有最后1个字符的词。
地址 日本东京