发明名称 基于智能家居设备的多维度观影系统控制方法
摘要 本发明提供一种基于智能家居设备的多维度观影系统控制方法,对任意给定的视频进行分析,包括图像信息、音频信息、字幕文字信息;对分析的结果进行整合,获得视频内容,以及视频内容随时间的变化;利用内容与感官间的映射关系,形成随视频变化的感官变化脚本,脚本内容包括温度感觉、湿度感觉、移动感、味觉、增强视觉、触觉;根据感觉随视频变化的脚本,通过智能家居设备产生与脚本同步的感受。本发明具有分析准确性高、利用智能家居设备因而成本低廉、实时性强等优点。
申请公布号 CN103970892B 申请公布日期 2017.03.01
申请号 CN201410223724.2 申请日期 2014.05.23
申请人 无锡清华信息科学与技术国家实验室物联网技术中心 发明人 孙雨新;杨磊;刘云浩
分类号 G06F17/30(2006.01)I;G06T7/00(2017.01)I;G05B15/02(2006.01)I;G05B19/418(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 无锡市大为专利商标事务所(普通合伙) 32104 代理人 曹祖良
主权项 一种基于智能家居设备的多维度观影系统控制方法,其特征在于,包括下述步骤:S1.将影片视频以镜头为单位进行切分;S2.对镜头内的图像、声音、字幕进行提取和分析,获得镜头内容,内容表示为关键词与对应置信度;S3.对内容分析结果,即通过图像、声音、字幕获得的关键词‑置信度对,使用投票的方式进行统计,得出分析内容的最终结果;S4.将镜头分析得到的内容与建立的感受与物体的映射关系表进行匹配,获得当前镜头内给人的感受,从而形成感受随视频变化的脚本;S5.根据感觉随视频变化的脚本,通过智能家居设备产生与脚本同步的感受,并通过传感器反馈调节这一过程;步骤S3中采用投票方式对视频内容进行决策,图像、声音、字幕三种信息提供的内容均用关键词‑置信度的二元对表示,设关键词集合为KW,图像内容分析结果可以表示为:<maths num="0001"><math><![CDATA[<mrow><msub><mi>R</mi><mrow><mi>i</mi><mi>m</mi><mi>a</mi><mi>g</mi><mi>e</mi></mrow></msub><mo>=</mo><mo>{</mo><msub><mi>c</mi><msub><mi>k</mi><mn>1</mn></msub></msub><mo>,</mo><msub><mi>c</mi><msub><mi>k</mi><mn>2</mn></msub></msub><mo>,</mo><mo>...</mo><mo>,</mo><msub><mi>c</mi><msub><mi>k</mi><mi>i</mi></msub></msub><mo>,</mo><mn>...</mn><mo>,</mo><msub><mi>c</mi><msub><mi>k</mi><mi>n</mi></msub></msub><mo>}</mo></mrow>]]></math><img file="FDA0001137419500000011.GIF" wi="798" he="69" /></maths>其中<img file="FDA0001137419500000012.GIF" wi="67" he="62" />为图像内容中对第i个关键词的置信度,n为关键词的总数即n=|KW|;同理可以得出声音的内容标注结果:<maths num="0002"><math><![CDATA[<mrow><msub><mi>R</mi><mrow><mi>s</mi><mi>o</mi><mi>u</mi><mi>n</mi><mi>d</mi></mrow></msub><mo>=</mo><mo>{</mo><msubsup><mi>c</mi><msub><mi>k</mi><mn>1</mn></msub><mo>&prime;</mo></msubsup><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mn>2</mn></msub><mo>&prime;</mo></msubsup><mo>,</mo><mo>...</mo><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mi>i</mi></msub><mo>&prime;</mo></msubsup><mo>,</mo><mn>...</mn><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mi>n</mi></msub><mo>&prime;</mo></msubsup><mo>}</mo></mrow>]]></math><img file="FDA0001137419500000013.GIF" wi="806" he="85" /></maths>和字幕的内容标注结果:<maths num="0003"><math><![CDATA[<mrow><msub><mi>R</mi><mrow><mi>t</mi><mi>e</mi><mi>x</mi><mi>t</mi></mrow></msub><mo>=</mo><mo>{</mo><msubsup><mi>c</mi><msub><mi>k</mi><mn>1</mn></msub><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msubsup><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mn>2</mn></msub><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msubsup><mo>,</mo><mo>...</mo><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mi>i</mi></msub><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msubsup><mo>,</mo><mn>...</mn><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mi>n</mi></msub><mrow><mo>&prime;</mo><mo>&prime;</mo></mrow></msubsup><mo>}</mo></mrow>]]></math><img file="FDA0001137419500000014.GIF" wi="918" he="87" /></maths><img file="FDA0001137419500000015.GIF" wi="65" he="86" />和<img file="FDA0001137419500000016.GIF" wi="90" he="86" />分别表示声音内容中和字幕内容中对第i个关键词的置信度;对内容的投票结果为<maths num="0004"><math><![CDATA[<mrow><mi>R</mi><mo>=</mo><mo>{</mo><msubsup><mi>c</mi><msub><mi>k</mi><mn>1</mn></msub><mrow><mo>&prime;</mo><mo>&prime;</mo><mo>&prime;</mo></mrow></msubsup><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mn>2</mn></msub><mrow><mo>&prime;</mo><mo>&prime;</mo><mo>&prime;</mo></mrow></msubsup><mo>,</mo><mo>...</mo><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mi>i</mi></msub><mrow><mo>&prime;</mo><mo>&prime;</mo><mo>&prime;</mo></mrow></msubsup><mo>,</mo><mn>...</mn><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mi>n</mi></msub><mrow><mo>&prime;</mo><mo>&prime;</mo><mo>&prime;</mo></mrow></msubsup><mo>}</mo></mrow>]]></math><img file="FDA0001137419500000017.GIF" wi="1006" he="85" /></maths>其中<img file="FDA0001137419500000018.GIF" wi="755" he="88" />如果<img file="FDA0001137419500000019.GIF" wi="131" he="90" />大于阈值λ<sub>c</sub>=0.5,则认为存在该词;步骤S4中的感受与物体映射关系表的内容为:物体→温度感受,湿度感受,运动感受,味觉,增强视觉,触觉;步骤S4中,对不同词汇进行分析得到的感受可能存在冲突,采用投票的方式对这些感受进行冲突消除,#(感受名称)表示某种感受名称在此次标注中出现的次数,S(感受名称)表示某种感受最后的投票结果,以百分比形式表示;<img file="FDA00011374195000000110.GIF" wi="1963" he="399" /><img file="FDA0001137419500000021.GIF" wi="1979" he="170" />选择投票结果最高的感受作为最终感受的结果。
地址 214135 江苏省无锡市新区菱湖大道清源路大学科技园立业楼A区5楼
您可能感兴趣的专利