发明名称 |
一种语音识别中的标点添加方法和装置 |
摘要 |
本发明实施例公开了一种语音识别中的标点添加方法和装置,以解决进行语音识别得到的识别结果缺少实效性的问题。所述方法包括:对通过语音识别得到的语句中的当前字词进行特征提取;将提取到的当前字词的特征在预先建立的最大熵模型中进行识别,得到当前字词之后的标识字符;根据获取到的标识字符与各标点的关联关系,在已知的标识字符集合中选择与当前字词之后的标识字符对应的标点,添加到当前字词之后。本发明实施例根据当前字词与其前后几个字词之间的逻辑关系等,按照预先建立的最大熵模型,预测当前字词后应该添加的标点(标点可以为空)。添加标点后的语音识别结果提高了语音识别结果的实效性。 |
申请公布号 |
CN103164399A |
申请公布日期 |
2013.06.19 |
申请号 |
CN201310059656.6 |
申请日期 |
2013.02.26 |
申请人 |
北京捷通华声语音技术有限公司 |
发明人 |
李健;吴飞;郑晓明;张连毅;武卫东 |
分类号 |
G06F17/28(2006.01)I |
主分类号 |
G06F17/28(2006.01)I |
代理机构 |
北京润泽恒知识产权代理有限公司 11319 |
代理人 |
苏培华 |
主权项 |
一种语音识别中的标点添加方法,其特征在于,包括:对通过语音识别得到的语句中的当前字词进行特征提取;将提取到的当前字词的特征在预先建立的最大熵模型中进行识别,得到当前字词之后的标识字符;根据获取到的标识字符与各标点的关联关系,在已知的标识字符集合中选择与当前字词之后的标识字符对应的标点,添加到当前字词之后。 |
地址 |
100193 北京市海淀区东北旺西路8号中关村软件园10号楼二层206-1 |