主权项 |
一种基于智能家居设备的多维度观影系统控制方法,其特征在于,包括下述步骤:S1.将影片视频以镜头为单位进行切分;S2.对镜头内的图像、声音、字幕进行提取和分析,获得镜头内容,内容表示为关键词与对应置信度;S3.对内容分析结果,即通过图像、声音、字幕获得的关键词‑置信度对,使用投票的方式进行统计,得出分析内容的最终结果;S4.将镜头分析得到的内容与建立的感受与物体的映射关系表进行匹配,获得当前镜头内给人的感受,从而形成感受随视频变化的脚本;S5.根据感觉随视频变化的脚本,通过智能家居设备产生与脚本同步的感受,并通过传感器反馈调节这一过程;步骤S3中采用投票方式对视频内容进行决策,图像、声音、字幕三种信息提供的内容均用关键词‑置信度的二元对表示,设关键词集合为KW,图像内容分析结果可以表示为:<maths num="0001"><math><![CDATA[<mrow><msub><mi>R</mi><mrow><mi>i</mi><mi>m</mi><mi>a</mi><mi>g</mi><mi>e</mi></mrow></msub><mo>=</mo><mo>{</mo><msub><mi>c</mi><msub><mi>k</mi><mn>1</mn></msub></msub><mo>,</mo><msub><mi>c</mi><msub><mi>k</mi><mn>2</mn></msub></msub><mo>,</mo><mo>...</mo><mo>,</mo><msub><mi>c</mi><msub><mi>k</mi><mi>i</mi></msub></msub><mo>,</mo><mn>...</mn><mo>,</mo><msub><mi>c</mi><msub><mi>k</mi><mi>n</mi></msub></msub><mo>}</mo></mrow>]]></math><img file="FDA0001137419500000011.GIF" wi="798" he="69" /></maths>其中<img file="FDA0001137419500000012.GIF" wi="67" he="62" />为图像内容中对第i个关键词的置信度,n为关键词的总数即n=|KW|;同理可以得出声音的内容标注结果:<maths num="0002"><math><![CDATA[<mrow><msub><mi>R</mi><mrow><mi>s</mi><mi>o</mi><mi>u</mi><mi>n</mi><mi>d</mi></mrow></msub><mo>=</mo><mo>{</mo><msubsup><mi>c</mi><msub><mi>k</mi><mn>1</mn></msub><mo>′</mo></msubsup><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mn>2</mn></msub><mo>′</mo></msubsup><mo>,</mo><mo>...</mo><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mi>i</mi></msub><mo>′</mo></msubsup><mo>,</mo><mn>...</mn><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mi>n</mi></msub><mo>′</mo></msubsup><mo>}</mo></mrow>]]></math><img file="FDA0001137419500000013.GIF" wi="806" he="85" /></maths>和字幕的内容标注结果:<maths num="0003"><math><![CDATA[<mrow><msub><mi>R</mi><mrow><mi>t</mi><mi>e</mi><mi>x</mi><mi>t</mi></mrow></msub><mo>=</mo><mo>{</mo><msubsup><mi>c</mi><msub><mi>k</mi><mn>1</mn></msub><mrow><mo>′</mo><mo>′</mo></mrow></msubsup><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mn>2</mn></msub><mrow><mo>′</mo><mo>′</mo></mrow></msubsup><mo>,</mo><mo>...</mo><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mi>i</mi></msub><mrow><mo>′</mo><mo>′</mo></mrow></msubsup><mo>,</mo><mn>...</mn><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mi>n</mi></msub><mrow><mo>′</mo><mo>′</mo></mrow></msubsup><mo>}</mo></mrow>]]></math><img file="FDA0001137419500000014.GIF" wi="918" he="87" /></maths><img file="FDA0001137419500000015.GIF" wi="65" he="86" />和<img file="FDA0001137419500000016.GIF" wi="90" he="86" />分别表示声音内容中和字幕内容中对第i个关键词的置信度;对内容的投票结果为<maths num="0004"><math><![CDATA[<mrow><mi>R</mi><mo>=</mo><mo>{</mo><msubsup><mi>c</mi><msub><mi>k</mi><mn>1</mn></msub><mrow><mo>′</mo><mo>′</mo><mo>′</mo></mrow></msubsup><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mn>2</mn></msub><mrow><mo>′</mo><mo>′</mo><mo>′</mo></mrow></msubsup><mo>,</mo><mo>...</mo><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mi>i</mi></msub><mrow><mo>′</mo><mo>′</mo><mo>′</mo></mrow></msubsup><mo>,</mo><mn>...</mn><mo>,</mo><msubsup><mi>c</mi><msub><mi>k</mi><mi>n</mi></msub><mrow><mo>′</mo><mo>′</mo><mo>′</mo></mrow></msubsup><mo>}</mo></mrow>]]></math><img file="FDA0001137419500000017.GIF" wi="1006" he="85" /></maths>其中<img file="FDA0001137419500000018.GIF" wi="755" he="88" />如果<img file="FDA0001137419500000019.GIF" wi="131" he="90" />大于阈值λ<sub>c</sub>=0.5,则认为存在该词;步骤S4中的感受与物体映射关系表的内容为:物体→温度感受,湿度感受,运动感受,味觉,增强视觉,触觉;步骤S4中,对不同词汇进行分析得到的感受可能存在冲突,采用投票的方式对这些感受进行冲突消除,#(感受名称)表示某种感受名称在此次标注中出现的次数,S(感受名称)表示某种感受最后的投票结果,以百分比形式表示;<img file="FDA00011374195000000110.GIF" wi="1963" he="399" /><img file="FDA0001137419500000021.GIF" wi="1979" he="170" />选择投票结果最高的感受作为最终感受的结果。 |