发明名称 | 数据处理方法和数据处理设备 | ||
摘要 | 提供了一种数据处理方法和数据处理设备,该方法包括:图片识别步骤,用于对图片进行识别,以获得多个识别结果词,并根据特定组合形式从多个识别结果词生成一个或多个检索词;初始化步骤,用于对利用检索词进行检索而获得的网页进行初始化,以获得多个语句;主题相关性确定步骤,用于确定所获得的各个语句之间的主题相关性;主题段落划分步骤,用于基于所确定的主题相关性将多个语句划分为多个段落并确定各个段落的主题性值;以及主题段落选择步骤,用于基于确定的各段落的主题性值,从多个段落中选择满足预定条件的主题段落。根据本发明的实施例,能够高效准确地获取与图片相关的网页的主题段落并确定图片的主题,有利于信息检索、集成和共享。 | ||
申请公布号 | CN103678407A | 申请公布日期 | 2014.03.26 |
申请号 | CN201210358626.0 | 申请日期 | 2012.09.24 |
申请人 | 富士通株式会社 | 发明人 | 孙健;夏迎炬;杨宇航;张明明 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京集佳知识产权代理有限公司 11227 | 代理人 | 李春晖;李德山 |
主权项 | 一种数据处理方法,包括:图片识别步骤,用于对图片进行识别,以获得多个识别结果词,并根据特定组合形式从所述多个识别结果词生成一个或多个检索词;初始化步骤,用于对利用所述检索词进行检索而获得的网页进行初始化,以获得多个语句;主题相关性确定步骤,用于确定所获得的各个语句之间的主题相关性;主题段落划分步骤,用于基于所确定的主题相关性将所述多个语句划分为多个段落并确定各个段落的主题性值;以及主题段落选择步骤,用于基于确定的各段落的主题性值,从所述多个段落中选择满足预定条件的主题段落。 | ||
地址 | 日本神奈川县 |