主权项 |
一种互动数字电视节目搜索方法,其特征在于,包括:查询服务器的线下模块通过实时采集节目信息,建立电视节目信息数据库,并建立一个包括关键词与电视节目之间关联程度的关键词数据库;查询服务器的线上模块获取用户输入的关键词,在查询所述关键词数据库后向用户返回关键词集合;在获取用户根据所述关键词集合选择的关键词后,查询所述电视节目信息数据库,并向用户返回查询的电视节目信息,供用户进行选择;所述关键词与电视节目之间关联程度使用relevant(wi,m)描述;其中wi代表一个关键词;m代表一个互动数字电视节目;关联程度relevant(wi,m)的计算公式如下: <mrow> <mi>relevant</mi> <mrow> <mo>(</mo> <msub> <mi>w</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munder> <mi>Σ</mi> <mrow> <msub> <mi>w</mi> <mi>j</mi> </msub> <mo>∈</mo> <mi>w</mi> </mrow> </munder> <mi>sin</mi> <mrow> <mo>(</mo> <msub> <mi>w</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>w</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>sum</mi> <mrow> <mo>(</mo> <msub> <mi>w</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>其中,sum(wi)代表关键词wi在互动数字电视节目信息数据库中关键词项出现的次数;w为节目m中所有的关键词集合;sim(wi,wj)代表两个关键词wi,wj之间的相似度;所述sim(wi,wj)的计算公式如下: <mrow> <mi>sim</mi> <mrow> <mo>(</mo> <msub> <mi>w</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>w</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>tog</mi> <mrow> <mo>(</mo> <msub> <mi>w</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>w</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>sum</mi> <mrow> <mo>(</mo> <msub> <mi>w</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>其中,sum(wi)代表关键词wi在互动数字电视节目信息数据库中关键词项出现的次数;tog(wi,wj)代表关键词wi,wj同时在一个节目中出现的次数。 |