发明名称 用于分布式文本到话音合成以及可理解性的系统和方法
摘要 本发明提供了用于分布式文本到话音合成以及可理解性的系统和方法。更具体而言,本发明提供了在手持便携式计算设备上的分布式文本到话音合成,其可以被用于例如生成帮助用户与手持便携式计算设备的用户界面进行交互的可理解的音频提示。该文本到话音分布式系统70从客机设备接收文本串,并且包含文本分析器72、韵律分析器74、文本分析器和韵律分析器所参考的数据库14、以及话音合成器80。话音合成器80的元件驻留在主机设备和客机设备上,并且与文本串相关联的音频文件的音频索引表示是在主机设备处生成并被发送到客机设备的,以用于在客机设备处产生音频文件。
申请公布号 CN101872615A 申请公布日期 2010.10.27
申请号 CN201010153291.X 申请日期 2010.04.21
申请人 创新科技有限公司 发明人 许军;李泰齐
分类号 G10L13/04(2006.01)I 主分类号 G10L13/04(2006.01)I
代理机构 北京东方亿思知识产权代理有限责任公司 11258 代理人 李晓冬;南霆
主权项 一种用于从文本串形式的文本输入创建音频文件的音频索引表示并从该音频索引表示再现所述音频文件的方法,该方法包括:接收所述文本串;在文本到话音合成器处将所述文本串转换成与所述文本串相关联的音频文件的音频索引表示,该转换包括从具有多个音频单元的第一音频单元合成仓库中选择至少一个音频单元,所选择的至少一个音频单元形成所述音频文件;利用所述音频索引表示来表示所选择的至少一个音频单元;以及通过拼接来自所述第一音频单元合成仓库或具有在所述音频索引表示中标识的音频单元的第二音频单元合成仓库的、在所述音频索引表示中标识的音频单元,来再现所述音频文件。
地址 新加坡新加坡市