发明名称 语音处理系统、装置及方法
摘要 本发明提供一种语音处理系统、装置及方法,该系统包括用于选取音频/视频文件的档案读取单元、控制单元、标签文件生成单元、界面呈现单元,控制单元用于控制一语音处理芯片依序对读取的音频文件或视频文件中的预定时长的部份进行声纹识别,以确定每个预定时长的部份中的发言者的身份,标签文件生成单元用于生成记录每个预定时长的部份与发言者的身份之对应关系的标签文件,界面呈现单元用于生成一界面以呈现上述对应关系以及接收用户对上述对应关系的反馈,控制单元根据用户对至少上述预定时长的部份中之一与发言者的身份的对应关系的反馈来控制语音处理芯片重新依序对读取的音频文件或视频文件中的预定时长的部份进行声纹识别。
申请公布号 CN103594086B 申请公布日期 2016.08.17
申请号 CN201310507989.0 申请日期 2013.10.25
申请人 海菲曼(天津)科技有限公司 发明人 边仿
分类号 G10L15/26(2006.01)I;G06F17/30(2006.01)I 主分类号 G10L15/26(2006.01)I
代理机构 深圳市神州联合知识产权代理事务所(普通合伙) 44324 代理人 邓扬
主权项 一种语音处理系统,包括档案读取单元,所述档案读取单元用于选取音频文件或视频文件,其特征在于,还包括控制单元、标签文件生成单元、界面呈现单元,所述控制单元用于控制一语音处理芯片依序对读取的音频文件或视频文件中的预定时长的部份进行声纹识别,以确定每个预定时长的部份中的发言者的身份,所述标签文件生成单元用于生成记录每个预定时长的部份与发言者的身份之对应关系的标签文件,所述界面呈现单元用于生成一界面以呈现上述对应关系以及接收用户对上述对应关系的反馈,所述控制单元还根据用户对至少上述预定时长的部份中之一与发言者的身份的对应关系的反馈来控制所述语音处理芯片重新依序对读取的音频文件或视频文件中的预定时长的部份进行声纹识别。
地址 300384 天津市华苑产业区兰苑路五号B座