发明名称 音讯/视讯的检索资料库之建立方法及歌曲检索系统
摘要 一种建立音讯/视讯的检索资料库之方法,包括下列步骤,从影音档中分别撷取出视讯和音讯,对视讯及该音讯分别进行视讯特征分析及音讯特征分析,依据视讯特征分析及音讯特征分析之结果,对影音档进行场景切割,由切割而得之所有场景中抽取出关键影格,撷取关键影格中之文字,以作为文字资料,依据文字资料、音讯特征分析结果、及其对应之关键影格,产生索引表格,以及将索引表格及影音档储存,以建立一可透过文字或音讯特征进行检索之音讯/影讯检索资料库。一种KTV歌曲检索系统,系应用前述资料库,让使用者可透过文字或音讯特征检索歌曲或其片段,亦一并予以揭露。
申请公布号 TWI220483 申请公布日期 2004.08.21
申请号 TW091123913 申请日期 2002.10.17
申请人 财团法人资讯工业策进会 发明人 赖志群;吴宗德
分类号 G06F17/30 主分类号 G06F17/30
代理机构 代理人 洪澄文 台北市大安区信义路四段二七九号三楼;颜锦顺 台北市大安区信义路四段二七九号三楼
主权项 1.一种音讯/影讯检索资料库之建立方法,包括以下步骤:从一影音档中分别撷取出视讯和音讯;对该视讯及该音讯分别进行视讯特征分析及音讯特征分析;依据上述视讯特征分析及音讯特征分析之结果,对该影音档进行场景切割;由前述切割而得之所有场景中抽取出关键影格;撷取该关键影格中之文字,以作为文字资料;依据该文字资料、该音讯特征分析结果、及其对应之关键影格,产生索引表格;以及将该索引表格及该影音档储存,以建立一可透过文字或音讯特征进行检索之音讯/影讯检索资料库。2.如申请专利范围第1项所述之音讯/影讯检索资料库之建立方法,其中,该场景切割系将该影音档分割成个别之片段,并标记每一该等片段(场景)之起始点和结束点、文字所在之场景及在每一该场景中之时间点。3.如申请专利范围第2项所述之音讯/影讯检索资料库之建立方法,其中,更将每一该等片段之起始点和结束点、文字所在之场景及在每一该场景中之时间点,储存于该音讯/影讯检索资料库。4.如申请专利范围第3项所述之音讯/影讯检索资料库之建立方法,其中,透过文字在每一该场景中之时间点,更精确地找出该文字中特定字串在该影音档中及对应场景之位置,以达到检索特定字串并播出特定场景之目的。5.如申请专利范围第1项所述之音讯/影讯检索资料库之建立方法,其中,撷取该关键影格中之文字系使用视讯光学文字辨识法。6.如申请专利范围第1项所述之音讯/影讯检索资料库之建立方法,其中,该影音档系为KTV影片裆。7.一种KTV歌曲之检索系统,包括:一音讯/影讯检索资料库,储存有复数曲目、音讯特征、及索引表格,透过该索引表可由文字或音讯特征检索而得到对应之曲目及片段;一第一输入装置,用以输入语音资料;一第二输入装置,用以输入文字资料;一音讯特征分析单元,用以接收由该第一输入装置所输入之语音资料并进行音讯特征分析;一音讯特征比对单元,用以将该语音资料之音讯特征与该音讯/影讯检索资料库中所储存之音讯特征进行比对,若有相符合者则将对应之曲目或片段输出;以及一搜寻引擎,用以在该音讯/影讯检索资料库中搜寻符合由该第二输入装置所输入文字资料之曲目,并将符合之曲目或片段输出。8.如申请专利范围第7项所述之KTV歌曲之检索系统,更包括一语音辨识单元,用以将由该第一输入装置所输入之语音资料转换为文字字串,再提供给该搜寻引擎进行比对。9.如申请专利范围第8项所述之KTV歌曲之检索系统,其中,该第一输入装置所输入之语音资料系指明歌曲名称、歌手名称、及歌词片段。10.如申请专利范围第7项所述之KTV歌曲之检索系统,其中,该第一输入装置为麦克风,所输入之语音资料系为歌曲片段。11.如申请专利范围第7项所述之KTV歌曲之检索系统,其中,该第二输入装置为键盘,所输入之文字资料系指明歌曲名称、歌手名称、及歌词片段。图式简单说明:第1图系显示音讯/视讯的检索资料库建立之操作流程图;第2图系显示视讯光学文字辨识之操作流程图;第3图系显示一实施例利用音讯/影讯检索资料库检索KTV歌曲之系统的系统架构。
地址 台北市大安区和平东路二段一○六号十一楼