背景
大家在实际的工作中可能会遇到这样的场景,查看某个统计的页面数据,其中一些数据是表格形式展示的,比如这是国家统计局关于人口统计的数据:
你想将表格内容下载下来根据自己的需要进行二次加工,但是页面没有提供下载功能或者需要你登陆才能下载。那么重点来了~~
操作步骤
本质还是借助python的pandas模块【数据分析的利器】来进行数据处理,环境说明:
python:3.6.5
安装pandas模块:pIp install pandas
第一步:登陆目标网页,我们还是以国家统计局的人口统计数据为例https://data.stats.gov.cn/easyquery.htm?cn=C01
第二步:拷贝网页的源代码,按照以下操作步骤保存到本地,名称为stats.html