发明名称 基于音节识别的视频点播方法
摘要 本发明公开一种基于音节识别的视频点播方法,以语音的音节为单位,将待识别语音的音节序列直接识别为视频名称,无需进行文本匹配。在训练阶段,将视频名称分解为音节序列,并按音节将视频名称分类,将每个视频名称与其音节建立索引关系;在识别阶段,首先将待识别视频名称的语音切分并识别为音节序列,然后根据得到的音节,从音节索引中选取全部有可能的视频名称,将待识别音节序列与这些视频名称的音节序列匹配解码,得到待识别视频名称。本发明可以显著降低视频点播系统的复杂性,有利于其在嵌入式系统等独立终端上实现。
申请公布号 CN102970618A 申请公布日期 2013.03.13
申请号 CN201210486825.X 申请日期 2012.11.26
申请人 河海大学 发明人 吕勇
分类号 H04N21/81(2011.01)I;G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/08(2006.01)I 主分类号 H04N21/81(2011.01)I
代理机构 南京苏高专利商标事务所(普通合伙) 32204 代理人 柏尚春
主权项 一种基于音节识别的视频点播方法,其特征在于:包括训练阶段和识别阶段的方法;其中在训练阶段,首先对视频名称库中的每个视频名称进行音节提取,得到视频音节序列库,然后进行中/英文模型训练、音节模型训练、音节上下文训练和音节索引提取,分别得到中/英文识别模型、音节模型、音节序列上下文模型和音节索引库;在识别阶段,对用户输入的待识别语音进行语音切分后,首先进行中/英文名称识别,识别出是中文名称或英文名称;然后用中文音节模型或英文音节模型进行音节识别,得到待识别语音的音节序列;最后利用音节索引库和音节序列上下文模型进行音节序列的匹配解码,得到视频名称。
地址 210098 江苏省南京市鼓楼区西康路1号