任务:
将数据存放到temp.csv
链接:
1.排行页面 https://www.dongchedi.com/sales
2.参数页面 https://www.dongchedi.com/auto/params-carIds-x-9824
完善打印:
1.
[{‘series_id’: 5952,
‘series_name’: ‘海鸥’,
‘image’: ‘https://p3-dcd.byteimg.com/img/tos-cn-i-dcdx/e33ad9ed8d9749a28fed202afadcd900~tplv-resize:640:0.png’,
‘rank’: 1,
‘min_price’: 6.58, ‘max_price’: 8.58,
‘last_rank’: 1,
‘count’: 56156,
‘sub_brand_name’: ‘比亚迪’, ‘price’: ‘6.58-8.58万’,}
操作步骤:
1.完善上次的内容输出;sub_brand_name rank
2.发现还有4个没有加上去,在参数页面;https://www.dongchedi.com/auto/params-carIds-x-9824
3.是将数据存放到csv文件,用carData[]列表存放数据;需要定义一个列表;
局部代码:
for index,car in enumerate(pageJson):
print('正在爬取第%d'%(index+1)+'条数据')
#定义一个列表文件
carData=[]
carData.append(car['brand_name'])
carData.append(car['series_name'])
carData.append(car['image'])
carData.append(car['count'])
carData.append(car['min_price'])
carData.append(car['max_price'])
carData.append(car['sub_brand_name'])
carData.append(car['rank'])
#测试:打印列表内容,看下顺序是否和temp.csv字段一致;
print(carData)
break
利用xpath技术的分析
4.分析页面
对应的“中型车”的文本信息