发明名称 声音空间的基准模型适应装置、集成电路以及AV设备
摘要 本发明提供一种在利用AV流中的音频流来执行AV流的分类等的装置中,对执行该分类时所使用的声音空间基准模型进行在线自适应调节的装置以及其方法。该装置将所输入的音频流分割成具有相同声音特征的片段数据,并对所分割得到的片段数据的单一概率模型进行估计。其后,针对所估计的单一概率模型与到此为止所存储的其他的声音特征的单一概率模型执行聚类,来生成新的声音空间的基准模型。
申请公布号 CN102473409B 申请公布日期 2014.04.23
申请号 CN201180002465.5 申请日期 2011.04.19
申请人 松下电器产业株式会社 发明人 贾磊;张丙奇;沈海峰;马龙;小沼知浩
分类号 G10L25/57(2013.01)I 主分类号 G10L25/57(2013.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 汪惠民
主权项 一种声音空间的基准模型适应装置,具备:存储单元,其存储有多个基准模型,该基准模型是基于具有单一声音特征的音声所生成的多个概率模型的集合;输入单元,其受理音频流的输入;以及分割单元,其将所述音频流分割成被估计为具有单一声音特征的片段数据,所述基准模型适应装置的特征在于,还具备:估计单元,其对每个所述片段数据的概率模型进行估计;以及聚类单元,其针对用于表示所述存储单元中存储的多个基准模型的每一个的多个概率模型、与所述估计单元所估计的概率模型进行聚类,来生成新的基准模型。
地址 日本大阪府