发明名称 文字转音标的方法
摘要
申请公布号 申请公布日期 2011.04.11
申请号 TW094139899 申请日期 2005.11.14
申请人 财团法人工业技术研究院 发明人 王稔志;李青宪
分类号 G06F17/28 主分类号 G06F17/28
代理机构 代理人 洪尧顺 台北市内湖区行爱路176号3楼
主权项 一种文字转音标的方法,包含:一个形素音素片段的寻找过程,系透过一已训练好的标音字典,及加入一边界符号的设计,来寻找出可能的区块集合,该区块的定义为长度大于1的形素音素配对序列;以及一个三阶段的字转音过程,系将输入的文字依序进行一形素切割、根据该形素切割与该可能的区块集合进行一区块标示、以及一确认程序之该三阶段的字转音过程,而决定出一发音序列。如申请专利范围第1项所述之文字转音标的方法,其中,该边界符号的加入系依区块会出现在边界位置之发音机会的多寡而定。如申请专利范围第1项所述之文字转音标的方法,其中,该形素音素片段的寻找过程更包含:当该形素音素配对序列出现的机率大于某一个门槛值时,则为区块的候选人,而该区块的分数系由其出现的机率值来决定。如申请专利范围第1项所述之文字转音标的方法,其中,该三阶段的字转音过程更包含:将该输入的文字进行该形素切割,以获得一形素序列;根据该形素序列与得到的该区块集合,进行该区块标示,产生N个可能的区块序列,N为自然数;以及对该N个可能的区块序列,进行该确认程序,并进行一分数权重调整,决定出该发音序列。如申请专利范围第4项所述之文字转音标的方法,其中,进行该区块标示后,并对该区块标示执行一评分函式。如申请专利范围第4项所述之文字转音标的方法,其中,该形素切割系采用一n-gram模型以获得该形素序列。如申请专利范围第4项所述之文字转音标的方法,其中,进行该确认程序,并对该确认程序执行一评分函式。如申请专利范围第7项所述之文字转音标的方法,其中,该确认程序系将该N个区块序列进行音素序列的再确认和重新对该N个区块序列进行评分。如申请专利范围第8项所述之文字转音标的方法,其中,该音素序列的再确认系对区块中与区块间的特征集合重新对该N个区块序列进行评分。如申请专利范围第9项所述之文字转音标的方法,其中,该分数权重调整系对该区块标示执行一评分函式,并透过权重的调整与该再确认的分数进行整合,而得到分数最高的区块序列,选其发音序列为决定出的该发音序列。如申请专利范围第1项所述之文字转音标的方法,其中,该文字转音标的方法适用于行动资讯家电上的文字转音标模型。
地址 新竹县竹东镇中兴路4段195号