发明名称 一种语义增强的音乐评论分类方法
摘要 本发明提供了一种语义增强的音乐评论分类方法,用于对音乐评论进行自动分类,它根据乐评内容将其划分为专辑评论、艺术家评论、旋律评论、歌词评论和外部特征评论五大类,只需要对少量乐评进行手工分类,即可实现对大量类别未知乐评的自动分类。本发明方法的优点是不仅对音乐评论本身进行分析,同时它还运用了与被评论对象相关的音乐短语,如音乐元数据、歌词等,来增强分析的准确性;同时,本发明方法还提供了一种有效合并两个分类器输出的方法,显著提高了预测的准确性。
申请公布号 CN102737069B 申请公布日期 2014.03.05
申请号 CN201110097052.1 申请日期 2011.04.15
申请人 清华大学 发明人 王朝坤;王建民;郑伟
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京润泽恒知识产权代理有限公司 11319 代理人 苏培华
主权项 一种语义增强的音乐评论分类方法,其特征在于,所述方法包括:收集与被评论音乐对象相关的信息短语,将所收集的信息短语集合用作语义音乐字典;将对音乐的评价分为专辑评论、艺术家评论、旋律评论、歌词评论和外部特征评论五类;针对五类评价中的每一类分析预设条数的评价,将每条评价根据语义音乐字典按照最长匹配的原则分割成若干个短语,将每条评价分割后得到的所有短语组成的集合记作D;复制集合D得到集合PR1,使用tf‑idf模型对每条评论生成一个向量,建立分类器f1;复制集合D得到集合PR2,使用熵模型对每条评论生成另外一个向量,建立分类器f2;获取未分类的评论,按照集合PR1提取基于tf‑idf的向量,使用分类器f1其进行分类,按照集合PR2提取基于熵的向量,使用分类器f2其进行分类;合并分类器f1和f2的分类结果。
地址 100084 北京市海淀区清华园一号
您可能感兴趣的专利