发明名称 |
语音识别处理方法及装置 |
摘要 |
本申请提出一种语音识别处理方法和装置,其中,该方法包括:从语音处理库的语音数据中获取待识别的数据块,标记与数据块对应的识别标签,识别标签包括:根据语音检测的端点时刻为数据块归属的语音分句分配的分句标识,以及数据块在语音分句中的块标识;向语音识别服务器发送携带所述识别标签的数据块识别请求,并接收携带所述识别标签的数据块识别结果;根据所有数据块识别结果中的识别标签,将属于同一语音分句中的多个数据块进行整合,以及将所有的语音分句进行整合。实现了利用现有的语音处理库对长时间的连续语音进行识别处理,提高了语音识别的稳健性。 |
申请公布号 |
CN105679319A |
申请公布日期 |
2016.06.15 |
申请号 |
CN201511009160.3 |
申请日期 |
2015.12.29 |
申请人 |
百度在线网络技术(北京)有限公司 |
发明人 |
白晶亮;穆向禹 |
分类号 |
G10L15/22(2006.01)I;G10L15/30(2013.01)I |
主分类号 |
G10L15/22(2006.01)I |
代理机构 |
北京清亦华知识产权代理事务所(普通合伙) 11201 |
代理人 |
宋合成 |
主权项 |
一种语音识别处理方法,其特征在于,包括以下步骤:在语音连续输入过程中,从语音处理库的语音数据中获取待识别的数据块,标记与所述数据块对应的识别标签,其中,所述识别标签包括:根据语音检测的端点时刻为所述数据块归属的语音分句分配的分句标识,以及所述数据块在所述语音分句中的块标识;向语音识别服务器发送携带所述识别标签的数据块识别请求,并接收所述语音服务器返回的携带所述识别标签的数据块识别结果;根据所有数据块识别结果中的识别标签,将属于同一语音分句中的多个数据块进行整合,以及将所有的语音分句进行整合。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦三层 |