发明名称 一种MySQL多语言混合文本全文检索的实现方法
摘要 本发明公开了一种MySQL多语言混合文本全文检索的实现方法,包括:准备工作;创建MySQL正译函数、反译函数;正译函数与反译函数的测试;添加MySQL多语言混合文本测试数据;MySQL多语言混合文本全文检索;自定义多语言混合文本停用词表;重建全文检索。本发明巧妙地避开分词算法以及各种插件、词库的安装,在不用改变原有应用系统的基础上,独立实现多语言混合全文检索,减少了应用系统风险,既可以解决因不同的中间件带来的平台不兼容、存储引擎不兼容、开发语言不兼容等技术难题,同时也提高了系统集成的灵活性和可扩展性,可以实现包括中文简体在内的多语言混合文本的全文检索;简单易行,还可以大幅提升多语言混合文本的查全率和查准率。
申请公布号 CN104133854A 申请公布日期 2014.11.05
申请号 CN201410324275.0 申请日期 2014.07.09
申请人 新乡学院 发明人 孔祥盛;潘红;闪永强;张丽伟;高雪霞;张磊;茹蓓;常青;郜伟雪;魏红娟;张涛;苏明强
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京科亿知识产权代理事务所(普通合伙) 11350 代理人 汤东凤
主权项 一种MySQL多语言混合文本全文检索的实现方法,其特征在于,所述的MySQL多语言混合文本全文检索的实现方法包括:步骤一、MySQL多语言混合文本全文检索的准备工作,具体任务包括:字符集的统一设置、创建测试用的数据库、创建测试用的数据库表、创建全文索引;步骤二、创建MySQL正译函数,该函数完成的功能是:将多语言混合文本统一正译成“英文句子”;步骤三、创建MySQL反译函数,该函数完成的功能是:将正译函数翻译出来的“英文句子”反译成多语言混合文本;步骤四、正译函数与反译函数的测试;步骤五、添加MySQL多语言混合文本测试数据,通过MySQL正译函数的翻译工作,将多语言混合文本测试数据正译成“英文句子”,由MySQL内置的分词技术建立全文索引;步骤六、MySQL多语言混合文本全文检索;步骤七、自定义多语言混合文本停用词表,节省索引所占用的储存空间,提高检索效率,同时提高多语言混合文本检索的查全率和查准率;步骤八、重建全文检索。
地址 453003 河南省新乡市红旗区金穗大道191号