1.背景
在使用python爬取页面数据时,经常会遇到解析页面数据,有一个非常好用的插件工具
是:xpath插件
2.安装与使用步骤
步骤1:准备xpath插件,并解压
步骤2:添加扩展程序
点击扩展程序后:
点击:加载已解压的扩展程序
安装成功后:
关闭浏览器,重新打开浏览器就可以使用了
步骤3:使用ctrl+shift+x
随便打开一个网页(本文中打开的是百度网页)
按ctrl+shift+x,如果出现如下图,说明安装成功
步骤4:验证
以打开豆瓣读书为例:
地址:豆瓣读书
输入: //body/div[@id="db-nav-book"]/div/div/ul/li/a
结果如下: