发明名称 |
一种降低VOIP通信资源开销的系统和方法 |
摘要 |
本发明公开了一种降低VOIP通信资源开销的系统,包括输入层,卷积层,子采样层和输出层,每一层均由特征图谱构成,每一维特征图谱含有神经元;应用该系统降低VOIP通信资源开销的方法,具体为:一、训练卷积神经网络系统;二、初始化卷积神经网络系统;三、将待测语音输入VAD系统;四、按序每一帧提取语音特征参数MFCC及其一阶差分特征参数;五、将每一帧参数组成一维特征图谱带入卷积神经网络系统;六、卷积神经网络系统将按序输出待测语音每一帧的结果[x,y],VAD系统判决并记录结果。优点在于:将卷积神经网络系统引入到VAD系统进行检测,降低VAD系统的误判率,节省计算时间和带宽,能够在保证通信质量的情况下减少VOIP的语音资源开销。 |
申请公布号 |
CN105321525A |
申请公布日期 |
2016.02.10 |
申请号 |
CN201510638936.1 |
申请日期 |
2015.09.30 |
申请人 |
北京邮电大学 |
发明人 |
王珂;孙瑞浩;张鹤立;李曦;纪红 |
分类号 |
G10L25/24(2013.01)I;G10L25/30(2013.01)I;G10L25/84(2013.01)I;G10L15/06(2013.01)I |
主分类号 |
G10L25/24(2013.01)I |
代理机构 |
北京永创新实专利事务所 11121 |
代理人 |
赵文利 |
主权项 |
一种降低VOIP通信资源开销的系统,其特征在于,所述系统是由输入层,卷积层,子采样层和输出层组成的卷积神经网络系统;每一层均由特征图谱构成,每一维特征图谱含有神经元;所述VOIP是指IP承载语音;输入层输入的是待测语音每一帧的语音特征参数MFCC及MFCC的一阶差分特征参数,所述参数构成一维特征图谱;所述MFCC是指梅尔倒谱系数;卷积层每一维的特征图谱均由输入层的特征图谱和一个卷积核卷积得到,且每维特征图谱中相同位置的神经元均连接输入层中相对应的神经元;子采样层对卷积层的每一维特征图谱进行降维操作,将卷积层每一维特征图谱上的神经元平均分组,然后选取每组中的最大神经元作为子采样层的神经元,子采样层上神经元的个数降低为卷积层上神经元个数的1/3到2/3;输出层是一维特征图谱,特征图谱上的每个神经元均全部连接子采样层的所有神经元,并输出待测语音的实际结果。 |
地址 |
100876 北京市海淀区西土城路10号 |