发明名称 |
一种MySQL多语言混合文本全文检索的实现方法 |
摘要 |
本发明公开了一种MySQL多语言混合文本全文检索的实现方法,包括:准备工作;创建MySQL正译函数、反译函数;正译函数与反译函数的测试;添加MySQL多语言混合文本测试数据;MySQL多语言混合文本全文检索;自定义多语言混合文本停用词表;重建全文检索。本发明巧妙地避开分词算法以及各种插件、词库的安装,在不用改变原有应用系统的基础上,独立实现多语言混合全文检索,减少了应用系统风险,既可以解决因不同的中间件带来的平台不兼容、存储引擎不兼容、开发语言不兼容等技术难题,同时也提高了系统集成的灵活性和可扩展性,可以实现包括中文简体在内的多语言混合文本的全文检索;简单易行,还可以大幅提升多语言混合文本的查全率和查准率。 |
申请公布号 |
CN104133854A |
申请公布日期 |
2014.11.05 |
申请号 |
CN201410324275.0 |
申请日期 |
2014.07.09 |
申请人 |
新乡学院 |
发明人 |
孔祥盛;潘红;闪永强;张丽伟;高雪霞;张磊;茹蓓;常青;郜伟雪;魏红娟;张涛;苏明强 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京科亿知识产权代理事务所(普通合伙) 11350 |
代理人 |
汤东凤 |
主权项 |
一种MySQL多语言混合文本全文检索的实现方法,其特征在于,所述的MySQL多语言混合文本全文检索的实现方法包括:步骤一、MySQL多语言混合文本全文检索的准备工作,具体任务包括:字符集的统一设置、创建测试用的数据库、创建测试用的数据库表、创建全文索引;步骤二、创建MySQL正译函数,该函数完成的功能是:将多语言混合文本统一正译成“英文句子”;步骤三、创建MySQL反译函数,该函数完成的功能是:将正译函数翻译出来的“英文句子”反译成多语言混合文本;步骤四、正译函数与反译函数的测试;步骤五、添加MySQL多语言混合文本测试数据,通过MySQL正译函数的翻译工作,将多语言混合文本测试数据正译成“英文句子”,由MySQL内置的分词技术建立全文索引;步骤六、MySQL多语言混合文本全文检索;步骤七、自定义多语言混合文本停用词表,节省索引所占用的储存空间,提高检索效率,同时提高多语言混合文本检索的查全率和查准率;步骤八、重建全文检索。 |
地址 |
453003 河南省新乡市红旗区金穗大道191号 |