主权项 |
一种基于人声音色的个性化点唱推荐方法,其特征在于:方法的步骤如下:步骤一、伴奏人声分离;步骤二、从人声数据中提取能代表用户音色特征的声学特征量MFCC和LPCC;步骤三、根据步骤二中提取的声学特征量推荐个性化点唱曲目;首先将人声音频按音色进行分类,为此构造了一个人声音色分类数据集,将人声音色分为男声沙哑、男声明亮、女声沙哑、女声明亮、甜美、空灵六大类;其次基础音色歌曲推荐,分类后包含音频数目最多的类别为用户的基本音色类别,其它音色类为用户的扩展音色类别;然后计算基本特征类别中所有用户声音样本的平均值作为用户基本音色模型,然后计算本类中所有待推荐样本与平均值的距离,以此度量歌手和用户音色相似度;将相似度从大到小排序;然后扩展音色歌曲推荐,代表用户扩展音色的歌曲数目相对很少,所以这部分推荐可以直接使用AR策略,为每首扩展音色歌曲在其对应的类别中计算与其他歌曲的相似度,然后根据相似度从大到小排序;最后推荐结果合并,假设用户演唱历史中基础音色对应的音频数目为m,扩展音色对应的音频数目为n,推荐歌曲数目为k,最后按照比例进行推荐结果合并,基础音色推荐结果中取前Int(k*(m/(m+k)))个,在扩展音色推荐结果中取k‑Int(k*(m/(m+k)))个,形成最终推荐结果集;步骤四、可扩展性分析;根据基础音色产生平均值后,产生推荐的过程是代表基础音色平均值的向量和代表扩展音色的向量与曲库中所有样本向量计算距离的过程,此过程可以分布到多个结点并行计算,每个结点产生m个推荐样本,再从这m*n个推荐样本中产生m个最优推荐样本作为推荐。 |