主权项 |
一种信息处理装置,包括:搜索条件信息获取单元,用于获取搜索条件信息,该搜索条件信息为指示用于搜索根据格结构被结构化的搜索对象文本的搜索条件的文本信息;语言处理单元,用于针对所述搜索条件信息执行语言分析处理;结构提取单元,用于使用所述搜索条件信息的语言分析结果来提取所述搜索条件信息的语句结构;搜索表达式生成单元,用于根据所述搜索条件信息的所述语句结构生成搜索表达式,所述搜索表达式反映用于对搜索对象文本进行搜索的搜索条件信息的语句结构;以及搜索单元,用于利用生成的搜索表达式,根据所述搜索条件信息的语句结构来从所述搜索对象文本搜索与所述搜索条件相匹配的文本,所述信息处理装置进一步包括搜索对象数据生成单元,搜索对象数据生成单元利用其中词或词组与作为赋予所述词或词组的唯一标识信息的语言代码相关联的语言代码信息,生成用于所述搜索对象文本的搜索处理的搜索对象数据,以及其中,基于所述语言代码信息,包括在所述搜索对象文本中的语言代码信息中的词或词组由对应的语言代码来代替,所述搜索对象文本中由所述语言代码代替的词或词组的格与所述语言代码相关联,且所述搜索对象文本的谓语结构被标记出来,所述搜索对象数据生成单元生成在其中按照形成搜索对象文本的语句中包括有语言代码的语句的出现顺序来累积与所述语句相对应的谓语结构时序事实数据,并利用作为赋予所述搜索对象文本的唯一识别信息的文本识别信息和作为赋予形成搜索对象文本的语句的唯一识别信息的语句识别信息来生成在其中用于指定包括所述语言代码的语句的语句识别信息和文本识别信息与所述语言代码相关联的搜索索引。 |