摘要 |
【課題】一側面において、文書データに対する文字列検索の対象絞り込みにおける絞り込みノイズを抑制することを目的とする。【解決手段】 一態様によれば、コンピュータが、文書ファイルに所定数以上の子要素を有する文書要素が存在するか否かに応じて、前記文書ファイルタ内のデータを複数のブロックのいずれに含めるかの制御を、前記子要素の階層の文書要素ごとに行なうか、もしくは、前記文書要素又は前記文書要素よりも上位の要素の階層の文書要素ごとに行なうかの切り換えを行ない、前記切り換えに応じた前記制御により、前記文書ファイルを前記複数のブロックに分割し、分割して得られたデータごとに、各データが所定の文字情報を含むか否かを示すインデックス情報を生成する。 |