发明名称 一种基于内容的语音文件检索方法和系统
摘要 本发明公开了信息检索技术领域中的一种基于内容的语音文件检索方法及系统。其中方法包括以下步骤:预置素材文件的XML对象数据库;获取各语音数据的语音特征量和时码,将各文本字符与对应语音的特征量和时码关联,形成语音库;把语音库中的语音文件转化为声学模型序列化码、音素码、次文字单元、和语音识别结果并进行分割,作为元素形成第一语音检索单元;把输入的查询词转化为声学模型序列化码、音素码、次文字单元、和语音识别结果并进行分割,作为元素形成第二语音检索单元;在第一语音检索单元和第二语音检索单元之间进行匹配,根据该匹配程度来确定匹配结果。上述系统包括:预置装置,转化装置、分割装置、语音检索单元形成装置、匹配装置。
申请公布号 CN106021249A 申请公布日期 2016.10.12
申请号 CN201510588899.8 申请日期 2015.09.16
申请人 展视网(北京)科技有限公司 发明人 张树坤
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于内容的语音文件检索方法,其特征在于,包括以下步骤:预置素材文件或节目文件的XML对象数据库,所述XML对象中包括描述视音频数据及对应文本属性的XML元数据;获取各语音数据的语音特征量和时码,将各文本字符分别与对应语音的特征量和时码进行关联,形成语音库;把语音库中的语音文件转化为声学模型序列化码、音素码、次文字单元、和语音识别结果;对第一转化步骤所转化的声学模型序列化码、音素码、次文字单元、语音识别结果进行分割;把在第一分割步骤中所分割的声学模型序列化码、音素码、次文字单元、语音识别结果作为元素形成第一语音检索单元;把输入的查询词转化为声学模型序列化码、音素码、次文字单元、和语音识别结果;对在第二转化步骤中所转化的声学模型序列化码、音素码、次文字单元、语音识别结果进行分割;把在第二分割步骤中所分割的声学模型序列化码、音素码、次文字单元、语音识别结果作为元素形成第二语音检索单元;在第一语音检索单元和第二语音检索单元之间进行匹配,以确定查询词与语音文件的匹配程度,根据该匹配程度来确定匹配结果;在搜索结果界面上展示所述视音频信息及文本信息。
地址 100086 北京市海淀区中关村南大街3号海淀科技大厦810