引言
在电商竞争日益激烈的情况下,商家既要提高产品质量,又要洞悉客户的想法和需求,关注客户购买商品后的评论,而第三方商家获取商品评价主要依赖于人工收集,不但效率低,而且准确度得不到保障。通过使用Python网络爬虫技术采集近期店铺商品评论信息,进行数据清洗、分词、去除停用词、词频统计等数据预处理,最终绘制词云图实现数据可视化,并对数据结果进行分析,为商家提高选品质量、制定个性化的营销策略提供依据。
item_review-获得淘宝京东商品评论
请求地址:taobao.item_review/jd.item_review
公共参数
名称 | 类型 | 必须 | 描述 |
---|---|---|---|
key | String | 是 | 调用key(必须以GET方式拼接在URL中) |
secret | String | 是 | 调用密钥 |
api_name | String | 是 | API接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等] |
cache | String | 否 | [yes,no]默认yes,将调用缓存的数据,速度比较快 |
result_type | String | 否 | [json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读 |
lang | String | 否 | [cn,en,ru]翻译语言,默认cn简体中文 |
version | String | 否 | API版本 |
请求参数
请求参数:num_iid=600530677643&data=&page=1
参数说明:num_iid:淘宝商品ID
sort:排序 0:默认排序 ,1: 最新排序
响应参数
Version: Date:
名称 | 类型 | 必须 | 示例值 | 描述 |
---|---|---|---|---|
rate_content | String | 0 | 衣服面料很好 穿起来很舒服 衣服挺合适的! | 评论内容 |
rate_date | Date | 0 | 2019-03-16 12:10:24 | 评论日期 |
pics | MIX | 0 | ["//img.alicdn.com/bao/uploaded/i4/O1CN01Zmq4QI1dqwnpBIxmX_!!0-rate.jpg"] | 评论图片 |
display_user_nick | String | 0 | 李***0 | 买家昵称 |
auction_sku | String | 0 | 颜色:加绒;尺码:2XL | 评论商品属性 |
rate_id | String | 0 | 1182747118197 | 评论ID |
add_feedback | String | 0 | 衣服面料很好 穿起来很舒服 衣服挺合适的! | 追评内容 |
add_feedback_images | MIX | 0 | ["//img.alicdn.com/bao/uploaded/i4/O1CN01Zmq4QI1dqwnpBIxmX_!!0-rate.jpg"] | 追评图片 |
video | String | 0 | http://cloud.video.taobao.com/play/u/416a306c576e44524a75367539493165745863466b513d3d/p/1/d/sd/e/6/t/1/288913501300.mp4 | 视频地址 |
videoCover | String | 0 | https://img.alicdn.com/imgextra/i3/O1CN01cvjYjY28SRpqyDJIN_!!0-tbbala.jpg | 视频截图 |
结语
为提升电商平台第三方商家收集商品评论信息的效率,获取具有参考价值的选品指标和客户需求,实现更好的收益,在此使用Python网络爬虫技术对店铺商品评论数据进行采集和保存,对爬取的评论记录进行数据清洗、中文分词、去除停用词、词频统计等预处理操作,并以此为基础绘制词云图,实现数据可视化。根据正负面词云图对客户评论做进一步分析,以获取客户的实际需求和商品需要优化的方向,帮助商家掌握核心卖。
商品评论数据采集数据展示(部分)