发明名称 |
一种视频终端以及一种音频码流处理方法 |
摘要 |
本发明的实施例公开了一种音频码流处理的方法,该方法为:对视频压缩码流进行解码,获得包含音源的图像,在所述的图像中检测所述音源的位置信息;对音频压缩码流进行解码,获得语音信息;根据所述音源的位置信息对所述语音信息进行处理,使重放的声音方位和所述音源的位置相匹配。这样,接收端不需要依赖于发送端提供的音源位置信息,也可以使音源的位置信息和重放的声音方位信息相匹配。本发明的实施例同时还公开了一种视频终端。 |
申请公布号 |
CN100556151C |
申请公布日期 |
2009.10.28 |
申请号 |
CN200610064656.5 |
申请日期 |
2006.12.30 |
申请人 |
华为技术有限公司 |
发明人 |
詹五洲 |
分类号 |
H04N7/52(2006.01)I;H04N5/14(2006.01)I |
主分类号 |
H04N7/52(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
1、一种音频码流处理方法,其特征在于,包括:对视频压缩码流进行解码,获得包含音源的图像;若所述音源为说话人,则根据嘴唇特征从所述的图像中检测所述说话人的嘴唇位置;根据检测到的嘴唇位置,检测唇动位置;如果在所述的视频压缩码流解码得到的前一帧图像中已检测出唇动位置,则当前帧在所述前一帧唇动位置的附近检测是否有嘴唇存在,如果没有,则在整个图像范围内检测唇动位置,如果有,则进一步判断嘴唇是否在运动;如果在运动,则将运动的嘴唇位置作为唇动位置;根据检测到的唇动位置,检测所述音源的位置信息;对视频压缩码流对应的音频压缩码流进行解码,获得语音信息;根据所述音源的位置信息对所述语音信息进行处理,使重放的声音方位和所述音源的位置信息相匹配。 |
地址 |
518129广东省深圳市龙岗区坂田华为总部办公楼 |