发明名称 一种基于内容计算的音频标签传播方法
摘要 一种基于内容计算的音频标签传播方法,基于内容分析计算音频数据间相似距离;根据相似距离,利用p@n率为每一个已标注音乐的最近邻为标注音乐计算其与该标注音乐具备相同曲风标签τ的概率。另外,如果有一为标注音乐α满足:距离L内,最多n个最近邻居中已标注音乐出现率高于P2,且某标签出现率高于P3,则将该标签传播给α。对于同一个P2值,进行多次迭代直到收敛。求出上述两种中被传播标签的交集,并以此交集补充进原始数据中重新进行上述过程,收敛后获得最终标签传播结果。本发明合并不同标签传播模型,在没有引入其他信息的情况下准确率比单个模型更高。
申请公布号 CN102262659A 申请公布日期 2011.11.30
申请号 CN201110197940.0 申请日期 2011.07.15
申请人 北京航空航天大学 发明人 蔡晶;郎波;李未
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京科迪生专利代理有限责任公司 11251 代理人 李新华
主权项 一种基于内容计算的音频标签传播方法,其特征在于步骤如下:(1)基于密度的标签传播:基于内容相似计算出音频的相似矩阵,构建音乐网络,扫描所有未标注音乐,当距离某个未标注音乐α的相似距离不超过L,且最多m个最邻近音乐上标注率达到P1时,如果某个标签τ的出现率达到P3,则将标签τ传播给α;(2)基于概率的标签传播:对于全体音乐集中的已标注音乐部分集,计算出n*p@n率,其中p@n即percision at n,为某已标注音乐的n个最近邻居音乐与其具备相同标签的平均准确率,n∈N,N为自然数,n*p@n表示某音乐的邻近音乐中与其具有相同标签的音乐个数期望,并将其近似为全体集的n*p@n,根据所述期望,计算出某个已标注音乐周围的相似音乐与其具有相同标签概率,据此传播标签;(3)基于上述步骤(1)和(2)分别进行标签传播后,求出传播结果的交集,并将其作为已标注音乐,利用上述步骤(1)或(2)重新进行一次传播。
地址 100191 北京市海淀区学院路37号