发明名称 一种计算机实现的创建从文本到音频记录的时序映射方法
摘要 本发明公开一种计算机实现的创建从文本到音频记录的时序映射方法,更具体地讲,涉及创建文本到音频映射的相应处理过程。包括馈送步骤和赋值步骤:采用标记记录音频记录开始时间和结束时间,对标记中音频记录对应的文本或者符号用令牌表示;将对应的标记与令牌组合成项,多个标记组成标记表,多个令牌组成令牌表,对应的标记表与令牌表组成项表。本发明可以用于在音频记录播放过程中给文本赋予生气;代替传统的重放控制器来控制音频播放;播放并显示语音记录的注释;在不用基础流协议的情况下实现流动音频的特征。
申请公布号 CN101079301B 申请公布日期 2010.06.09
申请号 CN200710086531.7 申请日期 2007.03.13
申请人 埃里克·路易斯·汉森 发明人 埃里克·路易斯·汉森
分类号 G11B20/10(2006.01)I;G11B27/10(2006.01)I;G11B27/00(2006.01)I 主分类号 G11B20/10(2006.01)I
代理机构 北京安博达知识产权代理有限公司 11271 代理人 徐国文
主权项 一种计算机实现的创建从文本到音频记录的时序映射方法,包括如下步骤:A、馈送步骤:利用计算机上的声文映射器接收输入数据,所述输入数据包括音频记录和文本;B、赋值步骤:将起始和终止时间赋值给对应此音频记录的文本单元;所述文本单元为文本粒度,所述文本粒度包括固定时间段音频、字母、音素、音节、单词、短语、句子或段落;其特征在于:所述A步骤中,所述文本为计算机可读取格式的文本,音频记录为计算机可读取格式的音频,所述声文映射器用于创建文本与音频录音之间的时序映射,所述输入数据从内存、存储器和/或通过网络适配器从网络接收,所述B步骤赋值步骤方法如下:采用标记记录音频记录开始时间和结束时间,所述结束时间始终大于开始时间,并且标记不重叠,对标记中音频记录对应的文本或者符号用令牌表示;将对应的标记与令牌组合成项,其中,所述声文映射器将接收的音频记录首先生成一个初始标记表,所述初始标记表采用如下两种方式创建:a、利用预先选定的时间长度的音频的音量阈值高低来创建,其中,将等于或长于持续时间内小于音量阈值的音频记录的音频段为平静类,将等于或长于持续时间内开始和结束音量大于阈值且不包含平静类的音频段为声音类,将未包括在上述两类中的音频段为模棱两可类;b、利用任意持续时间的固定间隔创建,所述持续时间由用户自行定义;所述声文映射器在标点、文字或者HTML标签中间数据的基础上,将文本分离成单元,创建出初始令牌表;多个标记组成标记表,多个令牌组成令牌表,对应的标记表与令牌表组成项表,其中项表对应方式可以是:对应的标记表与令牌表成对合并、对应的令牌表在标记表终点拼接或为标记和令牌单元定义XML或者其他中间数据标签。
地址 加拿大新斯科舍省哈利法克斯市春季花园街哈利法克斯专业中心645号