发明名称 一种基于人类语音内容索引的音频和视频文件管理方法
摘要 本发明提出一种基于人类语音内容索引的视频和音频文件管理方法,该方法利用语音识别技术识别音频和视频文件中的人类语音,将其中的人类语音内容(例如:对话声音)转化为文本信息,利用不同环境下对话内容的唯一性特点,将该文本信息作为标识该视频或音频文件实质内容的一项重要数据。在视频或音频文件库中采用该文本信息做文件索引标记信息,便可以高效地检测出实质内容相同的音频或视频文件,快速地辨别出实质内容不同的视频或音频文件。
申请公布号 CN105912615A 申请公布日期 2016.08.31
申请号 CN201610212603.7 申请日期 2016.04.05
申请人 重庆大学 发明人 谭玉娟;晏志超
分类号 G06F17/30(2006.01)I;G10L21/10(2013.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于人类语音内容索引的视频和音频文件管理方法,具体步骤为:(1)采用语音识别技术将视频和音频文件中的人类语音内容转换为文本文字信息;(2)使用(1)得到的文本文字信息来标识视频或音频文件的实质内容,若两个视频或两个音频文件的文本文字信息相同,则标记这两个视频或两个音频文件的实质内容相同,否则,则标记这两个视频或音频文件的实质内容不同。具体步骤为:(2.1)在视频或音频文件库中,采用(1)中得到的文本文字信息作为视频或音频数据库的文件索引标记信息;(2.2)对于某个视频或音频文件,使用(1)中得到的文本文字信息在视频或音频文件库中进行检索;(2.3)若存在具有相同文件索引标记信息(即(1)中得到的文本文字信息)的文件,则将(2.2)的文件和文件库中检索到的文件标记为具有相同实质内容的文件;否则,则标记(2.2)的文件为具有唯一实质内容的文件;(2.4)将(2.2)所指的文件及其文件索引标记信息更新至视频或音频文件库索引中。(3)对于(2.3)标记出的具有相同实质内容的视频或音频文件,采用一定的数据分布策略在多个区域之间或同一个区域内分布存储和管理(包括文件读,文件写,文件删除等多种文件操作)这些实质内容相同的视频或音频文件。其中区域可为服务器,机架,数据中心等硬实体或软实体。
地址 400044 重庆市沙坪坝区沙正街174号