发明名称 一种将语音数据转换为文本文件的方法和系统
摘要 本发明涉及语音识别技术领域,特别涉及一种将语音数据转换为文本文件的方法和系统。所述方法包括:开始采集语音数据,将语音数据转换为文本文字;提取出第一份音色数据,标记所述音色数据并储存;将文本文字储存为对应所述已标记的音色数据的文本文件;从预设的信号采集时间间隔内采集的语音数据中提取出音色数据,并将所述音色数据与已标记的所有音色数据逐一进行对比;如果音色数据相同,则将转换成的文本文字储存至与所述已标记的音色数据对应的文本文件;如果音色数据不同,则标记所述音色数据并储存,将转换成的文本文字储存为对应所述音色数据的另一文本文件。本发明能区分不同发言人的发言内容,简化了录音后的人工整理工作,省时省力。
申请公布号 CN102522084A 申请公布日期 2012.06.27
申请号 CN201110436096.2 申请日期 2011.12.22
申请人 广东威创视讯科技股份有限公司 发明人 刘观发
分类号 G10L15/26(2006.01)I;G10L15/08(2006.01)I 主分类号 G10L15/26(2006.01)I
代理机构 广州华进联合专利商标代理有限公司 44224 代理人 王茹;曾旻辉
主权项 一种将语音数据转换为文本文件的方法,其特征在于,包括如下步骤:开始采集语音数据,将语音数据转换为文本文字;从第一个预设的信号采集时间间隔内采集的语音数据中提取出音色数据,标记所述音色数据并储存;将第一个预设的信号采集时间间隔内采集的语音数据转换的文本文字储存为对应所述已标记的音色数据的文本文件;从第二个所述信号采集时间间隔开始,从每一所述信号采集时间间隔内采集的语音数据中提取出音色数据,并将所述音色数据与已标记的所有音色数据逐一进行对比;如果音色数据相同,则将所述语音数据转换成的文本文字存储至与所述已标记的音色数据对应的文本文件;如果音色数据不同,则标记所述音色数据并储存,将转换成的文本文字储存为对应所述音色数据的另一文本文件。
地址 510663 广东省广州市广州高新技术产业开发区彩频路6号