发明名称 基于GPU的图像文本语义提取方法
摘要 一种基于GPU的图像文本语义提取方法,包括以下步骤:获取网页集合;根据网页集合建立文档对象模型集合,其包括多个文本节点、图像链接节点;根据图像链接节点的标签确定图像链接节点的集合以及图像链接节点的数量;判断图像链接节点的数量是否为0;如果图像链接节点的数量不为0,则取出一个图像链接节点,并设置计数器i=0;根据经验规则查找图像链接节点周围是否存在文本节点。本发明解决了现有图像文本语义提取方法中存在的效率和精度不可兼得、图像的文字性描述的精度不高、图像搜索系统后台数据更新的周期长的问题。
申请公布号 CN102314513A 申请公布日期 2012.01.11
申请号 CN201110276585.6 申请日期 2011.09.16
申请人 华中科技大学 发明人 金海;郑然;江武;邓巍
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 华中科技大学专利中心 42201 代理人 朱仁玲
主权项 一种基于GPU的图像文本语义提取方法,其特征在于,包括以下步骤:获取网页集合;根据所述网页集合建立文档对象模型集合,其包括多个文本节点、图像链接节点;根据所述图像链接节点的标签确定所述图像链接节点的集合以及所述图像链接节点的数量;判断所述图像链接节点的数量是否为0;如果所述图像链接节点的数量不为0,则取出一个图像链接节点,并设置计数器i=0;根据经验规则查找所述图像链接节点周围是否存在文本节点;如果不存在文本节点,则设置计数器i=i+1;判断i是否等于4;若i等于4,则组合所述图像链接节点与所述文本节点,以形成一主题块;累加所述主题块,以形成主题块集合;判断是否存在下一个图像链接节点;若不存在下一个图像链接节点,则转换所述主题块集合的存储方式,以使其可被GPU读取;GPU对所述转换后的主题快集合进行语义分析,以得到语义块集合;GPU对所述语义块集合进行处理,以得到所有图像链接节点的语义描述信息。
地址 430074 湖北省武汉市洪山区珞喻路1037号