发明名称 |
面向光盘库的全文检索系统 |
摘要 |
本发明涉及一种面向光盘库的全文检索系统,属于计算机应用技术领域。包括文件索引建立模块、文件数据存储模块、关键词检索模块、文件信息读取模块;文件索引建立模块包含文件容量计算模块、光盘分配模块、文件读取模块、文件信息分词模块、索引表建立模块。其中,索引表建立模块包含磁盘索引文件建立模块、光盘索引文件建立模块、光盘索引文件更新模块;关键词检索模块包含关键词获取模块、关键词处理模块、磁盘检索模块、光盘索引文件获取模块、光盘检索模块、检索结果输出模块。本发明直接以文件的形式将数据存入光盘库中,直接对光盘库的文件进行操作而并不是通过数据库文件进行存储和检索,降低了数据存储和光盘库操作的复杂性。 |
申请公布号 |
CN104834663A |
申请公布日期 |
2015.08.12 |
申请号 |
CN201510053372.5 |
申请日期 |
2015.02.02 |
申请人 |
北京理工大学 |
发明人 |
宋丹丹;杨欢;蔡晓聪;陈科宇;孙宇超 |
分类号 |
G06F17/30(2006.01)I;G06F3/06(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种面向光盘库的全文检索系统,其特征在于:包括,文件索引建立模块(110)、文件数据存储模块(120)、关键词检索模块(130)、文件信息读取模块(140);其中,文件索引建立模块(110)包含文件容量计算模块(u1)、光盘分配模块(u2)、文件读取模块(u3)、文件信息分词模块(u4)、索引表建立模块(u5);索引表建立模块(u5)包含磁盘索引文件建立模块(u6)、光盘索引文件建立模块(u7)、光盘索引文件更新模块(u8);关键词检索模块(130)包含关键词获取模块(u9)、关键词处理模块(u10)、磁盘检索模块(u11)、光盘索引文件获取模块(u12)、光盘检索模块(u13)、检索结果输出模块(u14);文件索引建立模块(110)通过文件容量计算模块(u1)统计所要存入的总文件大小,确定分配的光盘数。再通过光盘分配模块(u2)对文件存放位置进行分配,确定每个文件要存入的光盘编号;然后通过文件读取模块(u3)读取文件的内容,通过文件信息分词模块(u4)对文件内容进行分词处理,最后通过索引表建立模块(u5)分别建立磁盘上的索引文件和光盘上的索引文件;文件数据存储模块(120)将文件数据和通过文件索引建立模块建立的各个光盘索引文件存入对应的光盘中;关键词检索模块(130)通过关键词获取模块(u9)获得用户输入的关键词,利用关键词处理模块(u10)实现对关键词的识别和拆分处理。再通过磁盘检索模块(u11)对各个关键词进行检索,获得每个关键词所在文件的光盘编号,然后通过索引文件获取模块(u12)得到对应光盘上的索引文件。最后通过光盘检索模块(u13)获得每个关键词的检索信息,并通过检索结果输出模块(u14)根据关键词在文件中出现的频率递减的顺序输出文件路径;文件信息读取模块(140),根据关键词检索模块(130)得到的文件路径,读取相应文件内容。 |
地址 |
100081 北京市海淀区中关村南大街5号北京理工大学 |