发明名称 语音处理系统及语音处理方法
摘要 一种语音处理方法包括:从一预存的语音文件中提取各发言者的语音特征;响应用户的操作,在该语音文件中有与该选择的声纹模型匹配的发言者语音时,获取与该声纹模型匹配的发言者语音,按照在该语音文件的时间先后顺序组成一单一音频文件,复制该获取的单一音频文件,将该复制的单一音频文件转换成对应的文本;将该文本中的词语与对应的时间相关联;响应用户操作,当该被转换的文本中存在输入的关键字时,获取该文字中的关键字所关联的时间,根据该获取的时间确定单一音频文件中该关键字对应语音的播放时间点,并控制一音频播放装置从该播放时间点开始播放该单一音频文件。本发明还提供一种语音处理系统,方便查找发言者针对某话题的发言内容。
申请公布号 CN103165131A 申请公布日期 2013.06.19
申请号 CN201110426397.7 申请日期 2011.12.17
申请人 富泰华工业(深圳)有限公司;鸿海精密工业股份有限公司 发明人 林希
分类号 G10L17/02(2013.01)I;G10L21/06(2013.01)I 主分类号 G10L17/02(2013.01)I
代理机构 代理人
主权项 一种语音处理系统,其特征在于,该语音处理系统包括:一特征获取模块,用于从一预存的语音文件中提取各发言者的语音特征,其中,该语音文件中包括有各发言者的发言;一语音识别模块,用于响应用户选择一预存的声纹模型的操作,判断该语音文件中是否有与该选择的声纹模型匹配的发言者语音;一语音转换模块,用于在该语音文件中有与该声纹模型匹配的发言者语音时,获取与该声纹模型匹配的发言者语音,并将该些发言者语音提取出来,按照在该语音文件的时间先后顺序组成一单一音频文件,复制该单一音频文件,并将该复制的单一音频文件转换成文本,其中,该文本包括词语;一关联模块,用于根据单一音频文件中各个词语对应的语音的播放时间点,将语音转换模块转换成的文本中的词语与对应的播放时间点相关联;一查询模块,用于响应用户输入的关键字的操作,判断该被转换的文本中是否存在该输入的关键字;及一执行模块,用于当该被转换的文本中存在该输入的关键字时,获取该转换的文本中的关键字所关联的播放时间点,根据该获取的播放时间点确定单一音频文件中该关键字对应语音的播放时间点,并控制一音频播放装置从该播放时间点开始播放该单一音频文件。
地址 518109 广东省深圳市宝安区观澜街道大三社区富士康观澜科技园B区厂房4栋、6栋、7栋、13栋(I段)