发明名称 一种在无线数据广播点播模式下XML文档分割方法
摘要 本发明属于无线数据广播技术领域,具体为一种在无线数据广播点播模式下XML文档分割的方法。该项方法的步骤为:首先对服务器端的XML文档集合进行预处理,对XML文档集合中的文档分支进行剪枝;然后将用户查询分成两个集合,它们分别包含了文档分支选择率比较低的查询请求和文档分支选择率较高的查询请求;第三,根据所得到的两个查询集合,对经过剪枝后的XML文档进行分割,得到两个分割文档集合;第四,构造下一个广播周期的索引,并将这两个分割文档集合广播出去;最后,移动终端根据访问协议来访问无线信道上的数据。本发明进一步提高了无线数据广播系统的性能。
申请公布号 CN101179577B 申请公布日期 2012.05.09
申请号 CN200710172175.0 申请日期 2007.12.13
申请人 复旦大学 发明人 孙未未;覃泳睿;余平;张卓瑶
分类号 H04L29/06(2008.01)I;H04H60/85(2008.01)I 主分类号 H04L29/06(2008.01)I
代理机构 上海正旦专利代理有限公司 31200 代理人 陆飞;盛志范
主权项 一种在无线数据广播点播模式下XML文档分割方法,其特征在于具体步骤如下:(1)对服务器端的XML文档集合进行预处理:在点播模式下,服务器端根据到来的查询请求,对XML文档集合D中没有被任意一个用户请求到的文档分支进行剪枝,得到文档集合PD;(2)将用户查询分成两个集合:首先根据用户查询的文档分支选择率,按升序对用户查询进行排序;然后根据指定的SP值,将用户查询分成两个集合,其中一个集合包含了文档分支选择率比较低的查询请求,记为Q1,占所有用户查询的(SP‑1)/SP的比例,另一个集合则包含了文档分支选择率较高的查询请求,记为Q2,占所有用户查询的1/SP的比例;其中,SP值取2,4,8,16,32,64或128;(3)根据查询集合的分割结果对文档进行分割:首先对PD集合中经过剪枝后的XML文档按照用户请求的热门程度进行降序排序;然后,根据第(2)步得到的两个查询集合,对经过剪枝后的每个XML文档进行分割;(4)广播XML文档分割集合:利用已有的索引技术和广播调度技术,构造下一个广播周期的索引,将第(3)步得到的两个XML文档分割集合DSL和DSH依次广播出去;(5)移动终端访问协议:(a)移动终端下载索引I;根据索引I和用户的查询请求,计算得出相应的匹配文档和偏移量,移动终端切换至休眠状态,等待匹配文档的到来;(b)对于所匹配的文档分支全部在一个文档分割集合DSL或DSH中的查询请求,移动终端只需要下载相应的匹配文档;而对于所匹配的文档分支分布在两个文档分割集合DSL和DSH中的查询请求,移动终端需要分别下载DSL和DSH中的相应的匹配文档,然后通过合并操作,将原来属于同一个XML文档的文档分支进行复原,从而得到最终的匹配文档;步骤(3)中所述对经过剪枝后的每个XML文档进行分割的步骤如下:(a)根据包含文档分支选择率比较低的查询请求的查询集合Q1对XML文档进行分割,即将所有被Q1请求的文档分支保留,没有被Q1请求的文档分支全部剪枝掉,得到第一个文档分割集合DSL; (b)根据包含文档分支选择率较高的查询请求的查询集合Q2,继续对XML文档集合进行分割,即将所有被Q2请求的文档分支保留,同时去除所有已经在文档分割集合DSL中出现的分支节点,但是需要保证新文档分支路径的完整性,而没有被Q2请求的文档分支全部剪枝掉,从而得到第二个文档分割集合DSH;步骤(4)中所述广播XML文档分割集合的步骤如下:(a)根据PD生成相应的DataGuides索引DG;(b)对索引DG中每一个Dataguide文档dg的所有的节点进行标记,用于指明该节点将会在文档分割集合DSL和DSH中的哪个集合出现或是在这两个集合都出现;(c)计算索引DG中每一个Dataguide文档dg所索引的XML文档pd的偏移量,包括两个偏移量offset1和offset2,分别指向相应的文档pd在文档分割集合DSL和DSH中的两个分割文档;(d)根据(a),(b),(c)三个步骤的结果,构造下一个广播周期的索引I;(e)广播索引I到无线广播信道上;(f)广播文档分割集合DSL到无线广播信道上;(g)广播文档分割集合DSH到无线广播信道上。
地址 200433 上海市邯郸路220号