发明名称 |
一种添加标点的方法和系统 |
摘要 |
本发明公开了一种添加标点的方法和系统。该方法包括:基于静音检测将待处理语音文件分为一个以上的待处理语段,根据每个待处理语段包含的每个词和每个词的语义特征,识别所述待处理语音文件中出现的所有特征单元;利用基于分词和词语的语义特征建立的语言模型,根据所述所有特征单元确定所述待处理语音文件的各种标点状态的综合权重;根据所述综合权重为所述待处理语音文件添加标点。应用本发明能提高添加标点准确性。 |
申请公布号 |
CN104142915A |
申请公布日期 |
2014.11.12 |
申请号 |
CN201310196391.4 |
申请日期 |
2013.05.24 |
申请人 |
腾讯科技(深圳)有限公司 |
发明人 |
刘海波;王尔玉;张翔;卢鲤;岳帅;陈波;李露;刘荐 |
分类号 |
G06F17/27(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京德琦知识产权代理有限公司 11018 |
代理人 |
张玉波;宋志强 |
主权项 |
一种添加标点的方法,其特征在于,该方法包括:基于静音检测将待处理语音文件分为一个以上的待处理语段,根据每个待处理语段包含的每个词和每个词的语义特征,识别所述待处理语音文件中出现的所有特征单元;利用基于分词和词语的语义特征建立的语言模型,根据所述所有特征单元确定所述待处理语音文件的各种标点状态的综合权重;根据所述综合权重为所述待处理语音文件添加标点。 |
地址 |
518044 广东省深圳市福田区振兴路赛格科技园2栋东403室 |