发明名称 基于自然语音识别的音频/视频点播方法和系统
摘要 本发明公开一种基于自然语音识别的音频/视频点播方法和系统,涉及通信领域。只需按动一键,便可以通过终端设备连接到网络侧的云计算平台服务器,通过云计算平台服务器进行语音音频/视频点播。其中,云计算平台服务器采用非特定人语音识别技术以及自然语音识别技术对用户输入的音频/视频点播语音信息进行语音识别,获取用户进行音频/视频点播地址,并将该音频/视频点播地址通过自动音频/视频点播控制信息发送给终端设备,以使得终端设备根据该自动音频/视频点播控制信息自动启动音频/视频播放功能,从音频/视频服务器获取音频/视频媒体流,将该音频/视频媒体流播放述用户。本发明实施例提供的技术方案可以应用在语音音频/视频点播系统中。
申请公布号 CN102347026A 申请公布日期 2012.02.08
申请号 CN201110185534.2 申请日期 2011.07.04
申请人 深圳市子栋科技有限公司 发明人 沈嘉鑫;王力劭;许军;庞泽耀;王力勃
分类号 G10L15/08(2006.01)I;H04L29/08(2006.01)I;H04L29/06(2006.01)I 主分类号 G10L15/08(2006.01)I
代理机构 代理人
主权项 一种基于自然语音识别的音频/视频点播地址系统,其特征在于,包括:一键式控制装置、终端设备以及云计算平台服务器;所述一键式控制装置,安装在车辆的固定部件上,用于在用户按下启动键以后,通过直接或短距离通信方式与所述终端设备建立连接,并通过直接或短距离通信方式驱动所述终端设备与所述云计算平台服务器建立连接;所述终端设备,用于与所述一键式控制装置建立连接以后,通过语音电话交换网络或多种无线数据网络与所述云计算平台服务器建立连接,接收用户发送的音频/视频点播语音信息,将所述音频/视频点播语音信息发送给所述云计算平台服务器,接收所述云计算平台服务器返回的包含音频/视频点播地址的自动音频/视频播放控制信息,根据该自动音频/视频播放控制信息启动音频/视频播放功能,根据所述音频/视频点播地址与音频/视频服务器建立音频/视频媒体流传输通道连接,从所述音频/视频服务器获取音频/视频媒体流,将该音频/视频媒体流播放给所述用户;所述云计算平台服务器,位于网络侧,包括:非特定人语音识别模块,用于对所述终端设备发送的音频/视频点播语音信息进行识别、解析,获取该音频/视频点播语音信息对应的拼音;自然语音识别模块,用于采用预先设置的词典对所述非特定人语音识别模块获取的拼音进行分词处理,获取分词后的词语拼音串,从所述词典中查找所述词语拼音串对应的待识别词语,根据所述待识别词语查找兴趣点音频/视频描述信息数据库,获取与所述待识别词语匹配度最高的目标音频/视频描述信息,其中,所述词典用于存储待进行语音识别的目标词语以及目标词语对应的拼音;通信模块,用于获取自然语音识别模块获取的目标音频/视频描述信息对应的音频/视频点播地址,将所述音频/视频点播地址携带在自动音频/视频点播控制信息中发送给所述终端设备。
地址 518000 广东省深圳市福田区深南西路车公庙工业区天安数码时代大厦914室