Hello大家好,我是你们的南枫学长,咱们今天来学——爬虫之MySql数据入库。
话不多说,导入咱们的老朋友:
Pymysql就是我们Python里面的mysql库,主要功能就是用来连接MySql数据库,那么下载还是一样的操作去进行下载哈。
下载安装好之后,我们首先先使用到pymsql.connect方法去连接到mysql数据库,然后通过host=’localhost’来找到数据库服务器地址。User=’root’就是数据库名。Password=’jensen’是数据库密码。Db=’py_spider’就是我们需要连接的数据库名。Curor=db.cursor()是从数据库连接对象里面获取到一个游标对象,用来执行SQL语句。
设置url
这个url会返回一个json数据,所以我们可以使用get请求并且来获取json数据。
初始化数据列表。创建一个空列表,用来存储从json数据里面提取到的数据
遍历json数据,并提取所需要的信息。遍历json_data里面的每一个元素,再去提取每个元素(我就不一一的去打出来了哈),再把这些值呢,存储到一个新字典(data_dict)里面去,并且添加到data_list列表中。
打印看一下数据对不对
定义一个SQL语句,用在咱们数据库里面去创建一个名字叫:FaDianChang的表,并且去尝试执行SQL语句以创建表。
还偷摸写了个异常处理,这块就不用解释了吧!
如果成功,那么就会打印“表创建成功…”,如果失败,那就会捕获异常,并且打印“表创建失败”。
遍历数据列表,插入到数据库里面去:
定义SQL语句(其实就是数据库的增删改查里面的增),插入到对应的表里面去。
最后关闭数据库连接: