发明名称 | 文本检索装置和文本检索方法 | ||
摘要 | 本发明提供文本检索装置、记录了文本检索程序的记录介质、以及文本检索方法。一种文本检索装置,利用N-gram方式进行文本检索,其特征在于,具有:检索对象文本分析部,其根据文本分析规则对检索对象文本进行分析,提取出索引词;索引生成部,其利用所述索引词生成索引;检索词分析部,其根据检索词分析规则来分析在检索条件中包含的检索词,从该检索词中切出词;检索条件生成部,其根据从所述检索词中切出的词,生成内部检索条件;以及检索处理部,其根据所述内部检索条件检索所述索引。 | ||
申请公布号 | CN101021851B | 申请公布日期 | 2011.05.18 |
申请号 | CN200610128965.4 | 申请日期 | 2006.09.05 |
申请人 | 富士施乐株式会社 | 发明人 | 石飞康浩 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京三友知识产权代理有限公司 11127 | 代理人 | 李辉 |
主权项 | 一种文本检索装置,该文本检索装置利用N‑gram方式进行文本检索,该文本检索装置包括:检索对象文本分析部,其根据文本分析规则,对检索对象文本进行分析,提取出索引词;索引生成部,其利用所述索引词生成索引;检索词分析部,其根据检索词分析规则,分析在检索条件中包含的检索词,并从该检索词中切出词;检索条件生成部,其根据从所述检索词中切出的所述词来生成内部检索条件;以及检索处理部,其根据所述内部检索条件对所述索引进行检索,其中,所述文本分析规则中,在检索词为两个字符以上、且最后的一个字符为非ASCII字符的情况下,把仅有最后1个字符的词作为索引词来切出;所述检索词分析规则除了以下一点之外都与文本分析规则相同:当检索词为两个字符以上、且最后的1个字符为非ASCII字符的情况下,不切出仅有最后1个字符的词。 | ||
地址 | 日本东京 |