发明名称 一种音频信号处理方法、装置及终端
摘要 本发明实施例提供一种音频信号处理方法、装置及终端,包括:在对音频信号进行编码时,通过接收到的视频信号确定接收到的音频信号的种类,在确定接收到的音频信号为语音信号时,利用时域编码的方式对该音频信号进行编码,在确定接收到的音频信号为非语音信号时,利用频域编码的方式对该音频信号进行编码,从而对识别出的语音信号和非语音信号分别进行编码,并实现声音的传输。
申请公布号 CN103198834B 申请公布日期 2016.12.14
申请号 CN201210001235.3 申请日期 2012.01.04
申请人 中国移动通信集团公司 发明人 刘玮哲;刘霖;黄健
分类号 G10L19/20(2013.01)I 主分类号 G10L19/20(2013.01)I
代理机构 北京同达信恒知识产权代理有限公司 11291 代理人 郭润湘
主权项 一种音频信号处理方法,其特征在于,所述方法包括:在接收音频信号的同时,接收视频信号;根据接收到的视频信号的像素信息确定接收到的视频信号中是否包含指定的图像以确定所述音频信号为语音信号或非语音信号,若该视频信号中存在指定的图像,确定距离该视频信号时间最短的一个已接收的视频信号;若该已接收的视频信号中存在指定的图像,在该已接收的视频信号中指定的图像与当前接收到的视频信号中指定的图像的相对位移的绝对值满足设定的阈值时,确定当前接收到的音频信号为语音信号,否则,确定当前接收到的音频信号为非语音信号,其中,按照以下公式确定已接收的视频信号中指定的图像与当前接收到的视频信号中指定的图像的相对位移:<img file="FDA0000939384690000011.GIF" wi="598" he="175" />其中,D为已接收的视频信号中指定的图像与当前接收到的视频信号中指定的图像的相对位移,P为指定的图像所在区域对应的二值化点阵,A(P)表示所述点阵的面积;(x,y)表示点阵P中任意一个像素点,h'(x,y)表示已接收的视频帧二值化像素值;h(x,y)表示当前接收到的视频帧的二值化像素值;在确定所述音频信号为语音信号时,利用基于时域编码的低码率音频编码对所述音频信号进行编码,否则,在确定所述音频信号为非语音信号时,利用基于频域编码的低码率音频编码对所述音频信号进行编码;对编码后获得的数据进行量化,并组织码流输出,所述码流中包括标识位,用于标识该码流对应的数据的编码方式。
地址 100032 北京市西城区金融大街29号
您可能感兴趣的专利