发明名称 |
智能导航播放器 |
摘要 |
本发明公开了一种智能导航播放器,包括音频特征分析模块、智能搜索模块、声音采集模块、智能音频标引制作模块、音频标引导航模块和网络服务平台;提供了音频特征分析、识别与搜索,通过声学建模、模式分类和动态规划方法建立音频的旋律特征和每个人物或对象独特的声纹特征,通过云计算分布式协同,进行精确匹配,包括相关乐曲、演员、节目唯一标识、节目属性、版权信息、网络服务平台链接,以及与节目本身相关的各时间节点上的主题、人物、商品及内容关联的应用程序、支付接口、多媒体、网络链接、评价、赞助商索引及访问方法;并能通过图像水印进行版权鉴别和辅助导航。本发明还公开了一种带有社区服务功能的移动终端智能导航播放器。 |
申请公布号 |
CN103678308A |
申请公布日期 |
2014.03.26 |
申请号 |
CN201210319021.0 |
申请日期 |
2012.09.03 |
申请人 |
许丰 |
发明人 |
许丰 |
分类号 |
G06F17/30(2006.01)I;G10L15/02(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种智能导航播放器,其特征在于,包括音频特征分析模块、智能搜索模块、声音采集模块、智能音频标引制作模块、音频标引导航模块和网络服务平台组成,所述音频特征分析模块提供了音频特征的分析、识别与搜索,通过声学建模、模式分类和动态规划方法建立音频的旋律特征和每个人物或发声对象的独特的声纹特征,通过以下方法的组合,进行多媒体节目和人物的精确匹配,并通过所述智能搜索模块和所述网络服务平台提供相关多媒体节目的导航链接:(1)识别文件名或数据流的命名;(2)识别文件头或数据流中的属性信息;(3)识别文件分段或数据流分段的哈希值;(4)通过声学建模、模式分类和动态规划方法识别发声者的声纹特征;(5)通过声学建模、模式分类和动态规划方法识别音频的旋律特征;(6)通过声学建模、模式分类和动态规划方法识别由声音采集模块采集的5‑30秒范围内的哼唱特征,进行旋律和声纹的自适应匹配。 |
地址 |
100164 北京市丰台区方庄南路58号院5-4-602 |