发明名称 一种根据音频输出的实时字幕生成方法
摘要 一种根据音频输出的实时字幕生成方法,步骤如下:对于电子设备需要进行输出的音频信息进行如下操作:采用音频采集模块实时监测电子设备输出的音频信息,并将其收集;将收集到的音频信息传入语音提取模块,将音频信息中的背景音乐等无关内容进行过滤并进行降噪处理,得到准确的语音信息;此后将得到的需要转换成文字的语音信息输入到语音识别模块,得到语音对应的文字信息;最后经显示模块将转换后得到的文字利用字幕的形式实时显示在设备屏幕上。本方法的优点在于:可以帮助听障人士获取视频,音频或其他形式中包含的语音内容,为听障人士获取语音信息提供了有效便捷的方式,同时也为普通用户提供了便利。
申请公布号 CN106504754A 申请公布日期 2017.03.15
申请号 CN201610863894.6 申请日期 2016.09.29
申请人 浙江大学 发明人 卜佳俊;于智;陈静;王灿;王炜;陈纯
分类号 G10L15/26(2006.01)I;G10L25/24(2013.01)I 主分类号 G10L15/26(2006.01)I
代理机构 杭州天正专利事务所有限公司 33201 代理人 王兵;黄美娟
主权项 一种根据音频输出的实时字幕生成方法,该方法的特征在于:1)音频采集;实时监测电子设备输出的音频信息,并将其收集;2)语音提取;将收集到的音频信息进行处理,过滤掉音频信息中的背景音乐等无关内容并进行降噪处理,得到准确的语音信息;3)语音识别;得到需要转换成文字的语音信息后,对语音信息进行语音识别,得到语音对应的文字信息;4)显示;将转换后得到的文字通过字幕的形式显示在设备屏幕上。
地址 310027 浙江省杭州市西湖区浙大路38号