发明名称 音频处理方法和音频处理设备
摘要 提供一种音频处理方法和设备,该方法包括以下步骤:a)根据音频物理特性将音频初始地分段为一个或多个片段;对于所述一个或多个片段中的每个片段:b)在该片段中的多个时间点的每个处,提取一种或多种音频特征作为音频特征向量;c)针对所述多个时间点的每个,通过所述音频特征向量来计算该时间点的贝叶斯信息准则值;d)通过各个时间点的贝叶斯信息准则值中的最大值所对应的时间点,将该片段划分为第一部分和第二部分;以及e)通过第一部分和第二部分中的由各个时间点的贝叶斯信息准则值构成的相对于时间点的两个曲线的分布,来判断该最大值所对应的时间点是否是说话人改变点。
申请公布号 CN102655002A 申请公布日期 2012.09.05
申请号 CN201110049298.1 申请日期 2011.03.01
申请人 株式会社理光 发明人 鲁耀杰;尹悦燕;郑继川
分类号 G10L15/04(2006.01)I;G10L15/08(2006.01)I;G10L17/00(2006.01)I 主分类号 G10L15/04(2006.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 万里晴
主权项 一种音频处理方法,所述方法包括以下步骤:a)根据音频物理特性将音频初始地分段为一个或多个片段;对于所述一个或多个片段中的每个片段:b)在该片段中的多个时间点的每个处,提取一种或多种音频特征作为音频特征向量;c)针对所述多个时间点的每个,通过所述音频特征向量来计算该时间点的贝叶斯信息准则值;d)通过各个时间点的贝叶斯信息准则值中的最大值所对应的时间点,将该片段划分为第一部分和第二部分;以及e)通过第一部分和第二部分中的由各个时间点的贝叶斯信息准则值构成的相对于时间点的两个曲线的分布,来判断该最大值所对应的时间点是否是说话人改变点。
地址 日本东京都