发明名称 语音识别多信息文本获取装置及方法
摘要 本发明提供一种语音识别多信息文本获取装置及方法,在通过语音识别将语音音频转换为纯文本信息之后,还将语音音频中的单字发音语速、单字发音强度、单字发音语调通过一定表现方式整合至初始生成的纯文本信息中生成多信息的文本信息。本发明的语音识别多信息文本获取装置及方法可广泛应用于微博、短信和签名档等信息发布平台。
申请公布号 CN102237088B 申请公布日期 2013.10.23
申请号 CN201110165101.0 申请日期 2011.06.17
申请人 盛乐信息技术(上海)有限公司 发明人 张峰;黄伟
分类号 G10L15/26(2006.01)I;G10L15/02(2006.01)I;G10L15/18(2013.01)I;G10L25/90(2013.01)I 主分类号 G10L15/26(2006.01)I
代理机构 上海思微知识产权代理事务所(普通合伙) 31237 代理人 菅秀君
主权项 一种语言识别多信息文本获取装置,其特征在于,包括:纯文本信息及单字发音时间生成模块,用于通过语音识别将语音音频转换为纯文本信息,同时用于获得所述语音音频中的单字发音时间,通过所述单字发音时间的长短确定单字发音语速;多信息文本生成模块,用于将所述纯文本信息生成多信息的文本信息,即在所述纯文本信息中整合所述单字发音语速和/或单字发音强度和/或单字发音语调的信息生成多信息的文本信息;单字语调计算模块,用于依据所述单字发音时间计算得到单字发音语调。
地址 201203 上海市浦东新区张江高科技园区郭守敬路356号3幢102室