发明名称 |
基于语义检索的文语转换方法及系统 |
摘要 |
本发明涉及语音合成技术领域,提供了一种基于语义检索的文语转换方法及系统。本发明的方法和系统中,首先同时使用正向最大匹配和逆向最大匹配,几乎全部的非歧义字段都可以被切分出,大大提高了文本切分的准确度,改善了语音合成效果。此外,本发明将文本切分方法与传统的基于语义的信息检索方法相结合,借鉴信息检索技术中对于关键词的处理方式,来进行歧义字段的处理,可有效提高歧义字段自动识别的效率和准确度,大大提高语音合成的效果。 |
申请公布号 |
CN102394061A |
申请公布日期 |
2012.03.28 |
申请号 |
CN201110351225.8 |
申请日期 |
2011.11.08 |
申请人 |
中国农业大学 |
发明人 |
傅泽田;李鑫星;张领先;温皓杰;李道亮;刘雪 |
分类号 |
G10L13/08(2006.01)I;G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G10L13/08(2006.01)I |
代理机构 |
北京路浩知识产权代理有限公司 11002 |
代理人 |
王莹 |
主权项 |
一种基于语义检索的文语转换方法,其特征在于,该方法包括步骤:S1,对输入的文本信息分别进行正向最大匹配和逆向最大匹配;S2,对比两种匹配方式对文本切分的结果,将切分相同的文本字串直接作为切分结果执行步骤S6~S7;对切分不同的文本字串执行步骤S3~S7;S3,提取每一文本字串中的最大交集型歧义切分字段;S4,对每一歧义切分字段进行语义检索;S5,根据语义检索匹配情况识别每一歧义切分字段作为切分结果;S6,根据切分结果进行单词的语音韵律处理;S7,将经过韵律处理的全部单词按文本顺序合成为语音输出。 |
地址 |
100193 北京市海淀区圆明园西路2号 |