发明名称 |
自动语音-文本转换系统和方法 |
摘要 |
通过以下操作以接近实时的方式执行和改进语音识别:利用事件和事件序列,应用包括增强分类器、组合、检测器和级联的机器学技术,和使用感知聚类。还使用串连的处理来改进语音识别。一种自动加标点器将标点插入到所识别的文本流中。 |
申请公布号 |
CN102227767B |
申请公布日期 |
2014.10.15 |
申请号 |
CN200980148155.7 |
申请日期 |
2009.11.12 |
申请人 |
SCTI控股公司 |
发明人 |
马克·品森;老戴维·品森;玛丽·弗拉纳根;沙洛克·马坎范德 |
分类号 |
G10L15/16(2006.01)I |
主分类号 |
G10L15/16(2006.01)I |
代理机构 |
北京律诚同业知识产权代理有限公司 11006 |
代理人 |
徐金国;谢雪闽 |
主权项 |
一种用于识别与数字语音信号对应的语音的系统,所述系统包括:语音识别引擎,所述语音识别引擎访问:已知类型的数字化语音话语的训练语料库;多个弱检测器,其中每个弱检测器包括用于判定事件存在于所述训练语料库中的方法;以及检测器组,所述检测器组包括多个所述弱检测器,多个所述弱检测器一起工作时比包含的任一个弱检测器都能更好地确定语音信号事件存在;其中所述语音识别引擎包括:事件提取器,所述事件提取器用于从所述数字语音信号中提取语音信号事件和捕获所述语音信号事件之间的时间关系,其中所述语音信号事件和所述语音信号事件之间的时间关系与语音识别相关;其中,所述语音识别引擎包括至少一个处理器,所述至少一个处理器经配置以执行多个操作,其中所述多个操作包括:检测相关语音信号事件在所述数字语音信号中的位置;捕获所有检测的相关语音信号事件的位置之间的时间关系;根据所述相关语音信号事件的检测位置,切分所述数字语音信号;分析切分的数字语音信号,其中所述分析与检测的相关语音信号事件的位置同步;提供用于经识别的语音数据的感知替代的列表,所述感知替代的列表对应于在所述数字语音信号中检测的模式;以及根据对一个或多个所述语音信号事件的分析,在用于经识别的语音数据的所述感知替代之间消除歧义,以改进经识别的语音数据;其中所述系统经配置以输出改进的经识别的语音数据。 |
地址 |
美国马里兰州 |