侦测新闻主播之影音特征以将电视新闻分段,申请号TW094126220-传众专利搜索

发明名称	侦测新闻主播之影音特征以将电视新闻分段
摘要	本发明系揭露一种影像分段方法，用来根据影像片段的内容剪辑影像片段。该方法包含有：利用一第一水平扫描线来扫描该影像画面的像素，判断该像素的颜色是否落于一预定颜色范围内；利用复数个连续的影像画面中位于该第一水平扫描线上之像素来产生一色彩地图；如果色彩地图显示一预定数目的连续影像画面中，皆包含一稳定的像素区域，并且该像素皆落于该预定的颜色范围，则将目前的影像段落标示为候选的影像段落；以及对该稳定的像素区域执行一色谱曲线颜色比较，以侦测镜头转换。可以进一步分析该影像片段的声音讯号以验证该候选的影像段落。
申请公布号	TWI283375	申请公布日期	2007.07.01
申请号	TW094126220	申请日期	2005.08.02
申请人	智辉研发股份有限公司	发明人	李士弘;叶家宏;施宣辉;郭宗杰
分类号	G06T7/40(2006.01)	主分类号	G06T7/40(2006.01)
代理机构		代理人	许锺迪台北县永和市福和路389号5楼
主权项	1.一种影像分段方法,用来根据影像片段的内容剪辑影像片段,该方法包含有: 接收一包含有复数个影像画面的影像讯号; 利用一第一水平扫描线来分析该影像讯号的影像画面,其中该第一水平扫描线系选取至少一列像素来作分析; 分析影像画面中位于该第一水平扫描线上之像素以决定该像素的颜色是否落于一预定颜色范围之内; 在该影像画面中指出落于该预定颜色范围之内之相邻像素所含盖的区域; 利用复数个连续的影像画面中位于该第一水平扫描线上之像素来产生一色彩地图; 如果色彩地图显示一预定数目的连续影像画面中, 皆包含一稳定的像素区域,并且该像素皆落于该预定的颜色范围,则将目前的影像段落标示为候选的影像段落; 对于每一个候选的影像段落,自每N个影像画面中选出一个影像画面,并且针对每个选出的影像画面的稳定区域,产生一色谱曲线; 执行一第一色谱曲线比较,比较每一对连续选出的影像画面之色谱曲线; 当该第一色谱曲线比较所得的第一色谱曲线差大于一第一临界値时,执行一第二色谱曲线比较,比较介于该对连续选出的影像画面之间之每一对连续的影像画面之稳定区域,其中该对连续选出的影像画面之色谱曲线差系大于该第一临界値;以及当该第二色谱曲线比较所得的第二色谱曲线差大于一第二临界値时,指示该候选的影像段落中有一镜头改变。 2.如申请专利范围第1项所述之方法,其中该自每N 个影像画面中选出一个影像画面系包含选取第N个影像画面。 3.如申请专利范围第1项所述之方法,其中该第一水平扫描线系位于一影像画面中自顶端往下大约三分之一画面的地方。 4.如申请专利范围第1项所述之方法,更包含有在分析该影像画面中位于该第一水平扫描线上之像素前,执行一RGB色彩至Lab色彩转换,来判断该像素的颜色是否落于该预定颜色范围。 5.如申请专利范围第1项所述之方法,其中该预定数目的连续影像画面系构成三秒钟的影像。 6.如申请专利范围第1项所述之方法,更包含有: 利用一第二水平扫描线来分析该影像讯号的影像画面,其中该第一、第二水平扫描线系选取相同数目的列来作分析; 如果影像画面上位于该第一、第二水平扫描线上之像素的颜色系落于该预定颜色范围内,则将该像素设定为逻辑値“1"; 利用位于该第一及第二水平扫描线上的相对应的像素,执行一“或(OR)"逻辑运算,来产生合成的像素资料;以及利用该合成的像素资料来指出该影像画面中落于该预定颜色范围的相邻像素的区域,以及利用该复数个连续的影像画面来产生该色彩地图。 7.如申请专利范围第6项所述之方法,其中该第一、第二水平扫描线系位于一影像画面中自顶端往下大约三分之一画面的地方。 8.如申请专利范围第1项所述之方法,更包含有移除长度小于一预定时间的候选的影像段落。 9.如申请专利范围第1项所述之方法,更包含有: 接收与该已接收之影像讯号相关联的声音讯号;以及分析该声音讯号以过滤该候选的影像段落,其中该声音讯号系在一预定尺寸的声音栏框(audio frame)中进行处理。 10.如申请专利范围第9项所述之方法,更包含将声音样本转换至频域(frequency domain)以分析该声音栏框的频率响应,以及计算该声音栏框的总体声音能阶。 11.如申请专利范围第10项所述之方法,更包含有: 计算该声音栏框之背景声音能阶; 比较该背景声音能阶与该总体声音能阶;以及如果该背景声音能阶对该总体声音能阶之比例并未落在一第一特定范围,则消除该候选的影像段落。 12.如申请专利范围第11项所述之方法,更包含有: 计算声音能阶低于该背景声音能阶之声音栏框数对所有声音栏框数之比例;以及如果该比例系未落于一第二特定范围,则消除该候选的影像段落。 13.如申请专利范围第10项所述之方法,更包含有: 计算频率落于8-13 kHz之声音栏框的平均声音能量; 计算频率落于8-13 kHz之声音栏框的平均声音能量对总体声音能阶之比例;以及如果该比例未落于一特定的范围,则消除该候选的影像段落。 14.如申请专利范围第10项所述之方法,更包含有: 计算该目前候选影像段落之频率中心(frequency centroid)的变异数;以及如果该频率中心的变异数未落于一特定的范围,则消除该候选的影像段落。 15.一种影像分段方法,用来根据影像片段的内容剪辑影像片段,该方法包含有: 接收一包含有复数个影像画面的影像讯号; 接收与该已接收之影像讯号相关联的声音讯号; 利用一第一水平扫描线与一第二水平扫描线来分析该影像讯号的影像画面,其中该第一水平扫描线与该第二水平扫描线系各选取至少一列像素来作分析; 如果影像画面上位于该第一、第二水平扫描线上之像素的颜色系落于一预定颜色范围内,则将该像素设定为逻辑値“1"; 利用位于该第一及第二水平扫描线上之相对应的像素,执行一“或(OR)"逻辑运算,来产生合成的像素资料; 利用该合成的像素资料来指出该影像画面中落于该预定颜色范围的相邻像素的区域; 利用复数个连续的影像画面中之合成的像素资料来产生一色彩地图; 如果色彩地图显示一预定数目的连续影像画面中, 皆包含一稳定的像素区域,并且该像素皆落于该预定的颜色范围,则将目前的影像段落标示为候选的影像段落; 对于每一个候选的影像段落,自每N个影像画面中选出一个影像画面,并且针对每个选出的影像画面的稳定区域,产生一色谱曲线; 执行一第一色谱曲线比较,比较每一对连续选出的影像画面之色谱曲线; 当该第一色谱曲线比较所得的第一色谱曲线差大于一第一临界値时,执行一第二色谱曲线比较,比较介于该对连续选出的影像画面之间之每一对连续的影像画面之稳定区域,其中该对连续选出的影像画面之色谱曲线差系大于该第一临界値; 当该第二色谱曲线比较所得的第二色谱曲线差大于一第二临界値时,指示该候选的影像段落中有一镜头改变;以及分析该声音讯号以过滤该候选的影像段落,其中该声音讯号之特征系藉由处理该声音讯号之复数个预定尺寸的声音栏框(audio frame)而取得。 16.如申请专利范围第15项所述之方法,其中该第一、第二水平扫描线系位于一影像画面中自顶端往下大约三分之一画面的地方。 17.一种影像分段方法,该方法系根据侦测一电视新闻影像片段中的电视新闻主播来剪辑该电视新闻影像片段,该方法包含有: 接收一包含有复数个新闻影像画面的影像讯号; 利用一第一水平扫描线来分析该影像讯号的新闻影像画面,其中该第一水平扫描线系选取至少一列像素来作分析; 分析新闻影像画面中位于该第一水平扫描线上之像素以决定该像素的颜色是否落于一预定颜色范围之内,以侦测该电视新闻主播的肤色; 在该新闻影像画面中指出落于该预定颜色范围之内之相邻像素所含盖的区域; 利用复数个连续的新闻影像画面中位于该第一水平扫描线上之像素来产生一色彩地图; 如果色彩地图显示一预定数目的连续新闻影像画面中,皆包含一稳定的像素区域,并且该像素皆落于该预定的颜色范围,则将目前的影像段落标示为候选的影像段落; 对于每一个候选的影像段落,自每N个新闻影像画面中选出一个新闻影像画面,并且针对每个选出的新闻影像画面的稳定区域,产生一色谱曲线; 执行一第一色谱曲线比较,比较每一对连续选出的新闻影像画面之色谱曲线; 当该第一色谱曲线比较所得的第一色谱曲线差大于一第一临界値时,执行一第二色谱曲线比较,比较介于该对连续选出的新闻影像画面之间之每一对连续的新闻影像画面之稳定区域,其中该对连续选出的新闻影像画面之色谱曲线差系大于该第一临界値;以及当该第二色谱曲线比较所得的第二色谱曲线差大于一第二临界値时,指示该候选的影像段落中有一镜头改变。图式简单说明: 第1图为电视新闻分段系统的方块图。第2图显示利用第一水平扫描线以及第二水平扫描线来侦测影像画面上是否有电视新闻主播的脸部影像。第3图为本发明侦测电视新闻主播脸部影像的流程图。第4图显示如何从两条扫描线来得到一逻辑色彩图 ,用来侦测电视新闻主播。第5图显示侦测镜头切换之示意图,藉由比较两个影像画面的影像带的局部色谱曲线,来侦测镜头切换。
地址	桃园县龙潭乡渴望路185号3楼之2