发明名称 多功能数位式电话机
摘要 一种数位式电话,具有答录机、线上录音、语音拨号、音调调整、以及放音速度调整之功能,且各功能间的程式码与参数可相互使用,例如进行语音辨认所需之参数,可由语音压缩参数转换而得,而放音速度调整与音调调整功能可共用相同的程式;以及一种数位语音讯号处理方法,应用于数位化语音资料之取样与处理,使数位式电话具有音调调整与放音速度调整之功能。
申请公布号 TW453099 申请公布日期 2001.09.01
申请号 TW088123231 申请日期 1999.12.29
申请人 陈文源;锺启仁 新竹市富群街三十巷一弄四十三号 发明人 陈文源;锺启仁
分类号 H04M9/08;H04M1/78;H04M3/40 主分类号 H04M9/08
代理机构 代理人 蔡坤财 台北巿松江路一四八号十二楼
主权项 1.一种数位式电话装置,具有答录机、线上录音、 语音拨号、音调调整、以及放音速度调整之功能, 该数位式电话装置包含: 一数位储存装置,用以储存数位化语音资料; 一音调调整装置,用以处理该数位化语音资料,使 放音音调升高或降低,并维持未经处理时的放音时 间长度;以及 一放音速度调整装置,用以处理该数位化语音资料 ,使放音速度增加或减缓,并维持未经处理时的音 调高低。2.如申请专利范围第1项之数位式电话装 置,其中上述之数位储存装置为随机存取记忆体( RAM)。3.如申请专利范围第1项之数位式电话装置, 其中上述之音调调整装置处理该数位化语音资料 之方法至少包含下列步骤: (a)设定调整音调的比例値m; (b)设定数位讯号转换为类比讯号的取样频率为(mf ),其中f为类比讯号转换为数位讯号的取样频率; (c)由原始声音中取出第一音框的样本数N,且在类 比讯号转换为数位讯号的取样频率为f时的放音时 间为t; (d)进行音框样本的音调升降处理,使升降频后的音 框放音长度变为t/m; (e)设定第二音框,其为由该原始声音中的第N/m个样 本点开始的N个样本所组成; (f)找出最佳衔接点,将该第一音框与该第二音框衔 接在一起; (g)将第三音框的样本进行如同步骤四中的音调升 降处理; (h)若衔接点位于第((N/m)+X)资料点,则衔接后两音框 的总长度为(2N-X),其中X为因衔接而舍去的样本数, 则第四音框为由原始声音中的第(2N-X)/m个样本点 开始的N个样本所组成;以及 (i)重复(c)到(h)之步骤,直到所有数位语音资料处理 完毕为止。4.如申请专利范围第1项之数位式电话 装置,其中上述之音调调整装置将数位语音资料分 割成复数个音框,并进行音框样本的音调升降处理 ,而后再衔接该复数个音框。5.如申请专利范围第1 项之数位式电话装置,其中上述之放音速度调整装 置处理该数位化语音资料之方法至少包含下列步 骤: (a)设定数位讯号转换为类比讯号的取样频率等于 原来录音相同的取样频率; (b)设定调整放音速度的比例値k; (c)由原始声音中取出第一音框的样本数N,并进行 音框样本的放音速度调整处理; (d)设定第二音框,其为由原始声音中的第kN个样本 点开始的N个样本所组成; (e)找出最佳衔接点,并将该第一音框与该第二音框 衔接在一起; (f)将第三音框的样本进行同步骤三中的放音速度 调整处理; (g)若衔接后的样本数为(2N-X),其中X为因衔接而舍 去的样本数,则第四音框为由原始声音中的第k(2N-X )个样本点开始的N个样本所组成;以及 (h)重复(c)至(g)之步骤,直到所有数位语音资料处理 完毕为止。6.如申请专利范围第1项之数位式电话 装置,其中上述之放音速度调整装置将数位语音资 料分割成复数个音框,并进行音框样本的放音速度 处理,而后再衔接该复数个音框。7.如申请专利范 围第1项之数位式电话装置,其中上述之装置更包 含: 一语音压缩装置,用以压缩该数位化语音资料; 一语音解压缩装置,用以将该数位化语音资料解压 缩;以及 一语音辨识装置,用以分别将参考字汇与待辨识字 汇之线性频谱数对(line spectrum pair,LSP)转换成mel- scale pseudo-cepstrum参数,而后逐一做样型比对,并经 判断法则处理后,得到辨认结果。8.如申请专利范 围第7项之数位式电话装置,其中上述之语音压缩 装置系利用激发码线性预估(Code Excited Linear Prediction, CELP)方法压缩数位语音资料。9.如申请专 利范围第7项之数位式电话装置,其中上述之语音 辨识装置所需之线性频谱数对(Line Spectrum Pairs,LSPs )参数系由上述之语音压缩装置提供。10.一种数位 化语音讯号处理方法,使放音音调升高或降低,该 方法包含下列步骤: (a)设定调整音调的比例値m; (b)设定数位讯号转换为类比讯号的取样频率为(mf ),其中f为类比讯号转换为数位讯号的取样频率; (c)由原始声音中取出第一音框的样本数N,且在类 比讯号转换为数位讯号的取样频率为f时的放音时 间为t; (d)进行音框样本的音调升降处理,使升降频后的音 框放音长度变为t/m; (e)设定第二音框,其为由该原始声音中的第N/m个样 本点开始的N个样本所组成; (f)找出最佳衔接点,将该第一音框与该第二音框衔 接在一起; (g)将第三音框的样本进行如同步骤四中的音调升 降处理; (h)若衔接点位于第((N/m)+X)资料点,则衔接后两音框 的总长度为(2N-X),其中X为因衔接而舍去的样本数, 则第四音框为由原始声音中的第(2N-X)/m个样本点 开始的N个样本所组成; (i)重复(c)到(h)之步骤,直到所有数位语音资料处理 完毕为止。11.一种数位化语音讯号处理方法,使放 音速度加快或减慢,该方法包含下列步骤: (a)设定数位讯号转换为类比讯号的取样频率等于 原来录音相同的取样频率; (b)设定调整放音速度的比例値k; (c)由原始声音中取出第一音框的样本数N,并进行 音框样本的放音速度调整处理; (d)设定第二音框,其为由原始声音中的第kN个样本 点开始的N个样本所组成; (e)找出最佳衔接点,并将该第一音框与该第二音框 衔接在一起; (f)将第三音框的样本进行同步骤三中的放音速度 调整处理; (g)若衔接后的样本数为(2N-X),其中X为因衔接而舍 去的样本数,则第四音框为由原始声音中的第k(2N-X )个样本点开始的N个样本所组成; (h)重复(c)至(g)之步骤,直到所有数位语音资料处理 完毕为止。图式简单说明: 第一图为本发明的系统方块图; 第二图为习知之CELP语音编码的系统方块图; 第三图为本发明利用不定音框分割法,将音调调降 (m<1)之运作原理的图示; 第四图为本发明利用不定音框分割法,将放音速度 调快(k>1)之运作原理的图示; 第五图为本发明之语音辨认系统方块图。
地址 新竹巿东区宝山路四五二巷五弄五号