发明名称 用于分布式语音识别的音高量化
摘要 本发明公开一种用于量化音频的音高信息的系统、方法和计算机可读介质。该方法包括捕获表示多个编号帧中的编号帧的音频。该方法还包括计算该帧的类,其中类是浊音或清音类中的任一个。如果该帧是浊音类,则为该帧计算音高(903)。如果该帧是偶编号帧和浊音类,则通过绝对量化帧音高来计算第一长度的码字(910)。如果该帧是奇数编号帧和浊音类,并且可靠帧是可用的,则通过差分量化帧音高来计算第二长度的码字(905)。如果没有可靠帧可用,则通过绝对量化帧音高来计算第二长度的码字。
申请公布号 CN1748244B 申请公布日期 2010.09.29
申请号 CN200480003674.1 申请日期 2004.02.05
申请人 国际商业机器公司;摩托罗拉公司 发明人 藤卡思·V·拉马巴德兰;亚历山大·索兰
分类号 G10L11/04(2006.01)I 主分类号 G10L11/04(2006.01)I
代理机构 中国国际贸易促进委员会专利商标事务所 11038 代理人 李镇江
主权项 一种信息处理系统中用于量化音频的音高信息的方法,包括:捕获表示多个编号帧中的一个编号帧的音频;计算该帧的类,其中类是浊音类和清音类中的任一个;如果该帧是浊音类,则为该帧计算音高;如果该帧是偶编号帧和浊音类,则通过绝对量化该帧的音高来计算第一长度的码字;如果该帧是偶数编号帧和清音类,则计算表示清音类帧的第一长度的码字;如果该帧是奇数编号帧和浊音类,并且紧邻在该帧之前的三个帧中的至少之一是可靠的,则通过参考最近前面可靠帧的量化音高来差分量化该帧的音高,计算第二长度的码字,其中第一长度大于第二长度;如果该帧是奇数编号帧和浊音类并且紧邻在该帧之前的三个帧中的每一个都不可靠,则通过绝对量化该帧的音高来计算第二长度的码字;以及如果该帧是奇数编号帧和清音类,则计算表示清音类帧的第二长度的码字。
地址 美国纽约