发明名称 一种向量点积的OpenCL自动化实现方法
摘要 本发明公开了一种向量点积的OpenCL自动化实现方法,适用于支持OpenCL的处理器,包括如下步骤:(一)输入OpenCL内核代码实现向量点积所需的参数信息;(二)根据所输入的参数信息生成OpenCL内核代码。本发明通过获取向量点积的数据类型、向量长度、向量内存分布位置、向量点积次数、点积参数的数据类型以及具体数值,自动生成向量点积的OpenCL内核代码,适用于向量点积的各种情况,并达到OpenCL内核自动化设计的目的。
申请公布号 CN105068971A 申请公布日期 2015.11.18
申请号 CN201510446624.0 申请日期 2015.07.27
申请人 东南大学 发明人 戚隆宁;汪晨;黄少珉
分类号 G06F17/16(2006.01)I 主分类号 G06F17/16(2006.01)I
代理机构 南京苏高专利商标事务所(普通合伙) 32204 代理人 孟红梅
主权项 一种向量点积的OpenCL自动化实现方法,其特征在于,包括如下步骤:(1)输入OpenCL内核代码实现向量点积所需的参数信息,所述参数信息包括:向量数据类型、向量长度、向量内存分布位置、点积次数、点积后处理公式、与向量内存分布相对应的点积参数类型和数值;(2)根据所输入的参数信息生成OpenCL内核代码。
地址 210096 江苏省南京市四牌楼2号