发明名称 |
一种基于互联网点评数据的分析方法 |
摘要 |
本发明公开了一种基于互联网点评数据的分析方法,包括以下步骤:采用网络爬虫对第三方消费点评类网站进行数据爬取,获得平台上店铺的基本信息以及消费者的点评信息;对爬取到的店铺及评价数据进行预处理,生成用于进一步分析的数据,即依托自然语言处理技术对评价文本进行分析;多角度开展挖掘分析,包括采用统计技术发现人均消费、人气指数的分布情况、采用聚类算法发现商圈、TF‑IDF算法进行词频统计以发现顾客的关注焦点;多角度地展现分析结果。本发明通过对点评数据展开有效分析,可以深刻理解消费者的行为特征,探索消费趋势,发现商圈及其演变趋势。 |
申请公布号 |
CN106528611A |
申请公布日期 |
2017.03.22 |
申请号 |
CN201610859976.3 |
申请日期 |
2016.09.28 |
申请人 |
西南交通大学 |
发明人 |
王欣;袁韵;贾建民;张恩阳 |
分类号 |
G06F17/30(2006.01)I;G06K9/62(2006.01)I;G06Q30/02(2012.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
成都信博专利代理有限责任公司 51200 |
代理人 |
张辉;崔建中 |
主权项 |
一种基于互联网点评数据的分析方法,其特征在于,包括以下步骤:步骤1:采用网络爬虫对第三方消费点评类网站进行数据爬取,获得平台上店铺的基本信息以及消费者的点评信息;步骤2:对爬取到的店铺及评价数据进行预处理,生成用于进一步分析的数据,即依托自然语言处理技术对评价文本进行分析;步骤3:多角度开展挖掘分析,包括采用统计技术发现人均消费、人气指数的分布情况、采用聚类算法发现商圈、TF‑IDF算法进行词频统计以发现顾客的关注焦点;步骤4:采用百度地图API进行地址解析,返回店铺的经纬度坐标;采用LBS绘制热力图以及聚类图;开发“客户端/服务器”系统,多角度地展现分析结果。 |
地址 |
610031 四川省成都市二环路北一段111号西南交通大学科技处 |