发明名称 数据处理方法和设备
摘要 公开了一种数据处理方法和设备,该方法包括:图片识别步骤,用于从图片识别关键词作为初始的检索词;网页和候选关键词获取步骤,用于在搜索引擎中利用检索词进行搜索来获取网页并从网页中挖掘候选关键词;评级步骤,用于基于检索词和/或候选关键词与网页之间的链接关系,对检索词和/或候选关键词以及网页进行评级;以及检索词选择步骤,用于基于评级结果从候选关键词中选择网页和候选关键词获取步骤中下次所用的检索词,重复执行网页和候选关键词获取步骤、评级步骤和检索词选择步骤,直到满足预定条件。根据本发明实施例,可以提高数据处理效率,更准确地从图片挖掘主题关键词和主题网页,从而有利于向用户进行后续的扩展应用和服务推荐。
申请公布号 CN103577414B 申请公布日期 2017.04.12
申请号 CN201210254434.5 申请日期 2012.07.20
申请人 富士通株式会社 发明人 孙健;夏迎炬;杨宇航;张明明
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 朱胜;陈炜
主权项 一种数据处理方法,包括:图片识别步骤,用于从图片识别关键词作为初始的检索词;网页和候选关键词获取步骤,用于在搜索引擎中利用所述检索词进行搜索来获取网页,并从所述网页中挖掘候选关键词;评级步骤,用于基于所述检索词和/或所述候选关键词与所述网页之间的链接关系,分别计算所述检索词和/或所述候选关键词以及所述网页的指向性级别和被指向性级别,并且基于所述指向性级别和所述被指向性级别中的至少一个对所述检索词和/或所述候选关键词以及所述网页进行评级;以及检索词选择步骤,用于基于评级结果从所述候选关键词中选择所述网页和候选关键词获取步骤中下次所用的检索词,其中,重复执行所述网页和候选关键词获取步骤、所述评级步骤和所述检索词选择步骤,直到满足预定条件为止。
地址 日本神奈川县