发明名称 文本和自然语音自动同步方法
摘要 本发明提供一种文本和自然语音自动同步方法,其特征在于:该方法包括以下步骤:(1)打开所选的文本文件和语音文件,在显示屏上显示文本,同时播放语音,在播放语音的同时,启动计时器计时;(2)播放语音的过程中,采用活动语音技术检测出语音中的活动语音段和静音段,并粗略估计文本的当前位置;(3)播放语音时,每隔一个固定时间对所显示文本进行调整,得到的文本当前位置粗估值,分别对语音和文本确定一个搜索范围,自动识别出语音中的关键词,并据此更新文本在显示屏上的显示内容;(4)语音播放完毕,停止播放语音,并复位所设的计时器。本发明是通过语音播放过程的程序流程步骤来完成,可实现全自动的利用自然语音对文本进行同步伴音的功能,并可完全由机器在文本显示和语音播放的时刻自动实现两者的同步,无须人工参与,既保证了伴音质量,又大大提高了同步伴音效率和时间。
申请公布号 CN1300762C 申请公布日期 2007.02.14
申请号 CN200410051338.6 申请日期 2004.09.06
申请人 华南理工大学 发明人 韦岗;张军
分类号 G10L13/00(2006.01);G10L11/02(2006.01);G06F3/16(2006.01) 主分类号 G10L13/00(2006.01)
代理机构 广州新诺专利商标事务所有限公司 代理人 王振英
主权项 1、一种文本和自然语音自动同步方法,其特征在于:包括以下几个步骤:步骤1:打开所选的文本文件和语音文件,在显示屏上适当位置开始显示文本,同时开始播放语音,在开始播放语音的同时,启动计时器进行计时;步骤2:播放语音的过程中,采用活动语音检测技术检测出语音中的活动语音段和静音段,并结合文本的特点,粗略估计文本的当前位置;步骤3:播放语音的过程中,每隔一个固定的时间间隔对所显示的文本进行调整,方法为:根据当前语音播放的位置和步骤2得到的文本当前位置粗估值,分别对语音和文本确定一个合理的搜索范围,采用语音关键词确认技术自动识别出语音中的关键词,根据活动语音、静音和关键词的位置进一步确定文本的当前位置,并据此更新文本在显示屏上的显示内容;步骤4:语音播放完毕,或收到停止命令后,停止播放语音,停止并复位所设的计时器。
地址 510640广东省广州市五山华南理工大学电子与信息学院