发明名称 |
产品价格数据采集方法及系统 |
摘要 |
本发明涉及一种产品价格数据采集方法及系统,所述方法为建立站内外类目映射匹配表;对相似产品判别;通过http请求,基于网络爬虫抓取目标网站产品数据,将所有参与比价产品构建文本索引;将所有参与比价产品主图构建图像索引;基于文本相似判别;基于图片相似判别;进行产品相似融合;相似产品比价。本发明产品价格数据采集方法及系统,节省人力成本,可以通过竞争对手或同类产品现状分析,体现产品的特点和优势;基于产品文本信息和产品主图图像特征进行相似产品计算,相似准确度高。 |
申请公布号 |
CN105912642A |
申请公布日期 |
2016.08.31 |
申请号 |
CN201610217664.2 |
申请日期 |
2016.04.08 |
申请人 |
世纪禾光科技发展(北京)有限公司 |
发明人 |
张宏志;谢志胜;顾锡栋;陈磊;杨秦;郭田华 |
分类号 |
G06F17/30(2006.01)I;G06Q30/02(2012.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京驰纳智财知识产权代理事务所(普通合伙) 11367 |
代理人 |
郭平平 |
主权项 |
一种产品价格数据采集方法,建立站内外类目映射匹配表;对相似产品判别;通过http请求,基于网络爬虫抓取目标网站产品数据,其特征在于,1)将所有参与比价产品构建文本索引;2)将所有参与比价产品主图构建图像索引;基于文本相似判别;基于图片相似判别;进行产品相似融合;相似产品比价。 |
地址 |
100083 北京市海淀区成府路28号1-901室 |