发明名称 |
数据处理方法和装置 |
摘要 |
本申请提出一种数据处理方法和装置,该数据处理方法包括:获取训练数据,所述训练数据包括:语音数据及对应的标注结果;根据所述训练数据生成第一声学模型;采用所述第一声学模型对所述训练数据进行语音识别,得到识别结果;根据所述标注结果和所述识别结果,确定所述训练数据属于的类别。该方法能够自动对训练数据进行分类,以避免人工抽检方式存在的问题。 |
申请公布号 |
CN106228980A |
申请公布日期 |
2016.12.14 |
申请号 |
CN201610581652.8 |
申请日期 |
2016.07.21 |
申请人 |
百度在线网络技术(北京)有限公司 |
发明人 |
李先刚;丁科 |
分类号 |
G10L15/06(2013.01)I;G10L15/08(2006.01)I |
主分类号 |
G10L15/06(2013.01)I |
代理机构 |
北京清亦华知识产权代理事务所(普通合伙) 11201 |
代理人 |
宋合成 |
主权项 |
一种数据处理方法,其特征在于,包括:获取训练数据,所述训练数据包括:语音数据及对应的标注结果;根据所述训练数据生成第一声学模型;采用所述第一声学模型对所述训练数据进行语音识别,得到识别结果;根据所述标注结果和所述识别结果,确定所述训练数据属于的类别。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦三层 |