发明名称 | 一种面向大数据的数据频度并行处理方法 | ||
摘要 | 本发明公开了一种面向大数据的数据频度并行处理方法,该方法在CUDA环境下把对大数据的数据频度统计以并行方式处理,从而降低处理时间。用户提供目标数据流,在接收到数据后,对数据进行读取,提取有效数据并做一些预处理,使其易于在GPU上以并行化方式处理;对处理后的数据进行任务块划分,并行化处理任务块。该处理方法中利用GPU并行特点,合理的任务划分,CPU与GPU协作处理,根据数据流的接收速度动态设置并发速度,保持接收与处理的一致性,具有很好的透明性、体验性和自适应性,高效可靠,特别适用于数据规模较大的数据频度统计处理中。 | ||
申请公布号 | CN103577161A | 申请公布日期 | 2014.02.12 |
申请号 | CN201310488199.2 | 申请日期 | 2013.10.17 |
申请人 | 江苏科技大学 | 发明人 | 刘镇;尚艳羽;范桂林;蒋玉宇 |
分类号 | G06F9/38(2006.01)I | 主分类号 | G06F9/38(2006.01)I |
代理机构 | 南京经纬专利商标代理有限公司 32200 | 代理人 | 楼高潮 |
主权项 | 一种面向大数据的数据频度并行处理方法,在CUDA环境下把要处理的数据进行任务块划分实现并行化,其特征在于包括以下步骤:步骤1:接收数据,对数据预处理;步骤2:定义各状态变量;步骤3:将数据由CPU传输到GPU端;步骤4:在GPU上划分任务,并根据任务分配情况动态设置并发速度;步骤5:在CUDA环境下并行发射任务,在device端利用GPU的并行性特点处理数据,统计特征数据频度。 | ||
地址 | 212003 江苏省镇江市梦溪路2号 |