发明名称 产品价格数据采集方法及系统
摘要 本发明涉及一种产品价格数据采集方法及系统,所述方法为建立站内外类目映射匹配表;对相似产品判别;通过http请求,基于网络爬虫抓取目标网站产品数据,将所有参与比价产品构建文本索引;将所有参与比价产品主图构建图像索引;基于文本相似判别;基于图片相似判别;进行产品相似融合;相似产品比价。本发明产品价格数据采集方法及系统,节省人力成本,可以通过竞争对手或同类产品现状分析,体现产品的特点和优势;基于产品文本信息和产品主图图像特征进行相似产品计算,相似准确度高。
申请公布号 CN105912642A 申请公布日期 2016.08.31
申请号 CN201610217664.2 申请日期 2016.04.08
申请人 世纪禾光科技发展(北京)有限公司 发明人 张宏志;谢志胜;顾锡栋;陈磊;杨秦;郭田华
分类号 G06F17/30(2006.01)I;G06Q30/02(2012.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京驰纳智财知识产权代理事务所(普通合伙) 11367 代理人 郭平平
主权项 一种产品价格数据采集方法,建立站内外类目映射匹配表;对相似产品判别;通过http请求,基于网络爬虫抓取目标网站产品数据,其特征在于,1)将所有参与比价产品构建文本索引;2)将所有参与比价产品主图构建图像索引;基于文本相似判别;基于图片相似判别;进行产品相似融合;相似产品比价。
地址 100083 北京市海淀区成府路28号1-901室