发明名称 辨识视讯内容前景之方法
摘要 本发明揭示一种辨识视讯内容前景的方法,主要包含:决定三维开重构之最适结构因子(Bo)及三维闭重构之最适结构因子(Bc);比较原始视讯影像及使用Bo对原始视讯影像执行MSOR运算后的影像与使用Bc对原始视讯影像执行MSCR运算后的影像,产生帽顶影像及帽底影像;及找出帽顶影像与帽底影像两者叠合之区域,而形成前景识别屏幕。
申请公布号 TWI376647 申请公布日期 2012.11.11
申请号 TW097132384 申请日期 2008.08.25
申请人 国立台湾科技大学 发明人 连俊豪;陈建中;苏俊荣
分类号 G06T7/00 主分类号 G06T7/00
代理机构 代理人 刘育志 台北市大安区敦化南路2段77号19楼
主权项 一种辨识视讯内容前景之方法,包含下列步骤:(a)使用复数种值之三维结构因子,对一输入的原始视讯影像分别执行一MSOR运算及一MSCR运算,来决定三维开重构之最适结构因子及三维闭重构之最适结构因子;(b)比较该原始视讯影像与使用该三维开重构之最适结构因子对该原始视讯影像执行该MSOR运算后的影像,以产生一帽顶影像,并比较该原始视讯影像与使用该三维闭重构之最适结构因子对该原始视讯影像执行该MSCR运算后的影像,以产生一帽底影像;(c)找出该帽顶影像与该帽底影像两者间叠合之区域,而形成一前景识别屏幕;(d)模拟该前景识别屏幕移除该原始视讯影像之前景后留下之背景影像的色彩变化,并产生一内插的背景网格;(e)将该原始视讯影像切割成复数个区域的影像;(f)比较该内插的背景网格与该切割成复数个区域的影像,利用一改善的算则,来决定一最终的前景识别屏幕;以及(g)利用该最终的前景识别屏幕,取出该原始视讯影像的前景。如申请专利范围第1项所述之方法,其中决定该三维开重构之最适结构因子之步骤(a)更包含下列子步骤:(b1)设定一第一结构因子值及一第二结构因子值,该第二结构因子值大于该第一结构因子值;(b2)计算该原始视讯影像与使用该第一结构因子值执行该MSOR运算后的影像每一像素的差量合,得到一第一差量合;(b3)计算该原始视讯影像与使用该第二结构因子值执行该MSOR运算后的影像每一像素的差量合,得到一第二差量合;(b4)将该第一差量合与该第二差量合之差值除以该第一结构因子值及该第二结构因子值之差值,得到一斜率;以及(b5)如果该斜率实质上等于零,则该三维开重构之最适结构因子之值为该第一结构因子值,否则,将该第二结构因子值增量,作为新的第二结构因子值,原来的第二结构因子值作为新的第一结构因子值,使用该新的第一与第二结构因子值重复步骤(b2)至步骤(b4)之计算。如申请专利范围第2项所述之方法,其中该原始视讯影像系先经缩小,再经子步骤(b1)至(b5)来决定该三维开重构之最适结构因子。如申请专利范围第1项所述之方法,其中该MSOR运算系以下列公式表示:@sIMGTIF!d10031.TIF@eIMG!其中I为该原始视讯影像,B为三维结构因子,i>I/i>。i>B/i>=(i>I/i>Θi>B/i>)i>B/i>为数学型态学之开运算(opening),@sIMGCHAR!d10101.TIF@eIMG!为多重比例的开运算(multi-scale opening),n为整数,为三维结构因子之比例系数(scaling factor),m为整数,表示重建之次数,@sIMGCHAR!d10102.TIF@eIMG!。如申请专利范围第1项所述之方法,其中该MSCR运算系以下列公式表示:@sIMGTIF!d10032.TIF@eIMG!其中I为该原始视讯影像,B为三维结构因子,i>I/i>˙i>B/i>=(i>I/i>i>B/i>)Θi>B/i>为数学型态学之闭运算(closing),@sIMGCHAR!d10109.TIF@eIMG!为多重比例的闭运算(multi-scale closing),n为整数,为三维结构因子之比例系数,m为整数,表示重建之次数,@sIMGCHAR!d10110.TIF@eIMG!。如申请专利范围第1项所述之方法,其中该帽顶影像系由该原始视讯影像每一像素减去使用该三维开重构之最适结构因子对该原始视讯影像执行该MSOR运算后的影像对应的像素而产生。如申请专利范围第1项所述之方法,其中该帽底影像系由使用该三维闭重构之最适结构因子对该原始视讯影像执行该MSCR运算后的影像每一像素减去该原始视讯影像对应的像素而产生。如申请专利范围第1项所述之方法,其中该前景识别屏幕系由下列公式计算该帽顶影像与该帽底影像叠合之区域来取得:@sIMGTIF!d10033.TIF@eIMG!其中@sIMGCHAR!d10103.TIF@eIMG!表示该前景识别屏幕,@sIMGCHAR!d10104.TIF@eIMG!,@sIMGCHAR!d10105.TIF@eIMG!表示该帽顶影像,@sIMGCHAR!d10106.TIF@eIMG!表示该帽底影像,TM为决定该帽顶影像与该帽底影像叠合后是否为同一区域的阈值(threshold),@sIMGCHAR!d10107.TIF@eIMG!为逻辑运算子AND,用来运算影像矩阵@sIMGCHAR!d10108.TIF@eIMG!与相同维度之单位矩阵U中的元素(element)。如申请专利范围第1项所述之方法,其中该前景识别屏幕移除该原始视讯影像之前景后留下之背景影像系由下列公式计算而得:@sIMGTIF!d10034.TIF@eIMG!其中I表示该原始视讯影像,@sIMGCHAR!d10127.TIF@eIMG!表示该背景影像,@sIMGCHAR!d10119.TIF@eIMG!,@sIMGCHAR!d10111.TIF@eIMG!表示一背景识别屏幕,其由该前景识别屏幕@sIMGCHAR!d10112.TIF@eIMG!经二值互换而得,亦即当@sIMGCHAR!d10113.TIF@eIMG!之像素值为1,则@sIMGCHAR!d10114.TIF@eIMG!之像素值为0,当@sIMGCHAR!d10115.TIF@eIMG!之像素值为0,则@sIMGCHAR!d10116.TIF@eIMG!之像素值为1,运算符号@sIMGCHAR!d10126.TIF@eIMG!表示影像矩阵间对应位置的元素相乘。如申请专利范围第9项所述之方法,其中该内插的背景网格系利用该背景影像@sIMGCHAR!d10117.TIF@eIMG!,并以拉格朗日内差演算法(Lagrangian interpolation algorithm)来模拟而产生。如申请专利范围第1项所述之方法,其中决定该最终的前景识别屏幕之改善的算则,系以下列公式表示:@sIMGTIF!d10036.TIF@eIMG!其中@sIMGCHAR!d10118.TIF@eIMG!为该最终的前景识别屏幕,@sIMGCHAR!d10120.TIF@eIMG!表示该内插的背景网格的第i个区域,i>I/i>(i>i/i>)表示该原始视讯影像切割成复数个区域的影像中第i个区域的影像,TN为决定i>I/i>(i>i/i>)中第i个区域的影像是否够靠近@sIMGCHAR!d10121.TIF@eIMG!中相应区域的阈值(threshold),Ui表示对第i个区域的影像之所有像素的联合运算(union operation),@sIMGCHAR!d10125.TIF@eIMG!为逻辑运算子AND,用来运算影像矩阵@sIMGCHAR!d10122.TIF@eIMG!与相同维度之单位矩阵U中的元素。如申请专利范围第1项所述之方法,其中,在步骤(g)中,该原始视讯影像的前景系由下列公式之计算取出:@sIMGTIF!d10035.TIF@eIMG!其中i>I/i>i>FG/i>表示该原始视讯影像的前景,@sIMGCHAR!d10123.TIF@eIMG!表示该最终的前景识别屏幕,I表示该原始视讯影像,运算符号@sIMGCHAR!d10124.TIF@eIMG!表示影像矩阵间对应位置的元素相乘。
地址 台北市大安区基隆路4段43号