python读取文件数据写入到数据库中,并反向从数据库读取保存到本地

学python,操作数据库是必不可少的,不光要会写python代码,还要会写SQL语句,本篇文章主要讲如何把本地txt文件中的数据读取出来并写入到对应的数据库中,同时将数据库单个表中的数据读出来保存在本地txt文件中。

话不多说,我们开始吧!

微信图片_20221126112304.png

读取文件数据写入到数据库

image.png

读取文件数据并封装

有两个txt文件,一个是普通文本格式,一个是json格式,部分数据截图见本篇文章的最后附录部分。一个是2011年的1月份销售数据,一个是2011年的2月份销售数据,我们需要分别读出这两个文件的数据并写入同一个表中。

1月份数据是普通文本,使用逗号分割数据记录,从前到后分别是(日期,订单id,销售额,销售省份);

2月份数据是JSON数据,同样包含 (日期,订单id,销售额,销售省份)

根据面向对象的思想,我们可以设计一个FileReader类,进行数据的读取,我们读取到的数据也可以封装到一个类里面,叫做数据封装类,也就是每一条数据都可以得到一个具体的类对象;

(1)数据定义的类

设计一个类,完成数据封装,新建一个python文件,名为:data_define.py,根据数据的分析,成员变量包含 date, order_id, money, province

 
# 数据定义的类
class Record:
    def __init__(self, date, order_id, money, province):
        self.date = date    # 订单日期
        self.order_id = order_id    # 订单ID
        self.money = money      # 订单金额
        self.province = province    # 销售省份

    def __str__(self):
        return f"{self.date}, {self.order_id}, {self.money}, {self.province}"

(2)定义文件相关的类

设计一个抽象类,定义文件读取的相关功能,并使用子类实现具体功能,因为文件的数据格式不同,我们读取文件的具体实现逻辑也不一样,所以定义一个抽象类,通过子类去实现具体数据的具体读取方法。

新建一个python文件,名为:file_define.py,先定义一个抽象类FileRecord用来做顶层设计,确定有哪些功能(read_data方法)需要实现,并分别定义TextFileRecord类和JsonFileRecord类,继承FileRecord类,复写父类的read_data方法,

具体代码如下:

 
from data_define import Record
import json


# 先定义一个抽象类用来做顶层设计,确定有哪些功能需要实现
class FileRecord:
    def read_data(self) -> list[Record]:
        # 读取文件的数据,读到的每一条数据都转换为Record对象,将他们都封装到List内并返回即可
        pass


class TextFileRecord(FileRecord):
    def __init__(self, path):
        self.path = path  # 定义成员变量记录文件路径

    # 复写(实现抽象方法)父类的方法
    def read_data(self) -> list[Record]:
        f = open(self.path, "r", encoding="UTF-8")
        record_list: list[Record] = []
        for line in f.readlines():
            line = line.strip()  # 消除读取到的每一行数据中的\n
            data_list = line.split(",")
            record = Record(data_list[0], data_list[1], int(data_list[2]), data_list[3])
            record_list.append(record)
        # print(record_list)
        f.close()
        return record_list


class JsonFileRecord(FileRecord):
    def __init__(self, path):
        self.path = path  # 定义成员变量记录文件路径

    # 复写(实现抽象方法)父类的方法
    def read_data(self) -> list[Record]:
        f = open(self.path, "r", encoding="UTF-8")
        record_list: list[Record] = []
        for line in f.readlines():
            data_dict = json.loads(line)
            record = Record(data_dict["date"], data_dict["order_id"], data_dict["money"], data_dict["province"])
            record_list.append(record)
        # print(record_list)
        f.close()
        return record_list


if __name__ == '__main__':
    # 测试读取文本文件
    text_file_record = TextFileRecord("G:\资料\2011年1月销售数据.txt")
    lin1 = text_file_record.read_data()
    for l1 in lin1:
        print(l1)

    # 测试读取json文件
    json_file_record = JsonFileRecord("G:\资料\2011年2月销售数据JSON.txt")
    lin2 = json_file_record.read_data()
    for l2 in lin2:
        print(l2)

运行结果:

image.png

(3)合并数据

新建一个python文件main.py,读取数据并将1月份数据和2月份数据合并

 
from file_define import FileRecord, TextFileRecord, JsonFileRecord
from data_define import Record

text_file_record = TextFileRecord("G:\资料\2011年1月销售数据.txt")
json_file_record = JsonFileRecord("G:\资料\2011年2月销售数据JSON.txt")
jan_data: list[Record] = text_file_record.read_data()  # 读取1月份数据并保存到jan_data
feb_data: list[Record] = json_file_record.read_data()  # 读取2月份数据并保存到feb_data
all_data: list[Record] = jan_data + feb_data  # 合并两个月份的数据
# print(all_data)

合并数据之后的结果:

image.png

构建数据库链接并写入数据库

我们首先需要导包:from pymysql import Connection,我在代码中分别创建了sell数据库和orders表,其实可以直接通过数据库可视化工具创建,创建完成后直接执行insert插入语句即可,参考代码如下:

# 构建数据库链接
conn = Connection(
    host="localhost",
    port=3306,
    user="root",
    password="123456",
    autocommit=True  # 执行sql语句时自动提交
)
# 构建游标对象
cur = conn.cursor()
cur.execute("SHOW DATABASES")
database_list = []
for db in cur:
    database_list.append(db[0])
print(database_list)  # 打印出当前所有数据库
if "sell" in database_list:  # 如果数据库存在则不创建,如果不存在则创建数据库sell
    pass
else:
    creat_data_base = "CREATE DATABASE sell"
    cur.execute(creat_data_base)

conn.select_db("sell")
cur.execute("SHOW TABLES")
tab_list = []
for tab in cur:
    tab_list.append(tab[0])
print(tab_list)  # 打印当前库中的所有表
if "orders" in tab_list:  # 如果表存在则不创建,如果不存在则创建表orders
    pass
else:
    cur.execute("CREATE TABLE orders(order_date DATE,order_id VARCHAR(255),money INT,province VARCHAR(10))")
# 遍历所有数据,并执行插入语句
for record in all_data:
    sql = f"INSERT INTO sell.orders(order_date,order_id,money,province) VALUES ('{record.date}','{record.order_id}',{record.money},'{record.province}')"
    print(sql)
    cur.execute(sql)

# 关闭数据库链接
cur.close()

运行代码成功之后,可在数据库中看到,数据已经正常写入orders表中:

image.png

从数据库读取数据并保存到本地

相对写入数据来说,读取数据保存到本地更加简单,先从数据库读取数据,然后处理数据,之后保存到本地文件即可。

(1)保存为txt文件

代码如下

from pymysql import Connection
from data_define import Record

# 构建数据库链接
conn = Connection(
    host="localhost",
    port=3306,
    user="root",
    password="123456",
    autocommit=True  # 执行sql语句时自动提交
)
# 构建游标对象
cur = conn.cursor()
cur.execute("select * from sell.orders")  # 读取orders表中的所有数据

record_list = []
for data in cur:
    record = Record(data[0], data[1], data[2], data[3])
    record_list.append(record)  # 将读取的每一数据封装成一个Record对象并添加到record_list列表中

f = open("E:\sell_orders_data.txt", 'w')  # 文件存在,则直接覆盖文件中的内容写入,不存在,先创建文件再写入数据
for sell_data in record_list:
    # 只能写入str类型的,则把读取的Record对象转化为str,每个字段用","分割
    str_data = str(sell_data.date) + "," + sell_data.order_id + "," + str(sell_data.money) + "," + sell_data.province
    f.write(str_data)
    f.write("\n")
f.close()

查看保存的txt文件:

image.png

(2)保存为excel文件

代码如下:

import xlwt
# 写入到excel文件中
# 调用xlwt模块中的Workbook方法来创建一个excel表格类型文件,style_compression设置是否压缩,赋值为0表示不压缩。
book = xlwt.Workbook(encoding='utf-8', style_compression=0)
# 用book对象调用add_sheet方法来建立一张sheet表,这里面的第一个参数很明显就是设置sheet表格的名称,第二个参数cell_overwrite_ok用于确认同一个cell单元是否可以重设值,这里赋值为True就表示可重设值。
sheet = book.add_sheet('销售数据表', cell_overwrite_ok=True)
# 用一个元组col自定义列的数量以及各列的属性名
col = ('销售日期', '订单ID', '销售额', '省份')
# 写入表头
for i in range(0, 4):
    sheet.col(i).width = 5000  # 设置宽度
    sheet.write(0, i, col[i])
datastyle = xlwt.XFStyle()  # 创建一个样式对象,初始化样式
datastyle.num_format_str = 'yyyy-mm-dd'  # 设置日期格式
# 循环record_list数据并写入
for row in range(1, len(record_list) + 1):
    sheet.write(row, 0, record_list[row - 1].date, datastyle)  # 如果不加datastyle,写出来的日期列格式是不对的
    sheet.write(row, 1, record_list[row - 1].order_id)
    sheet.write(row, 2, record_list[row - 1].money)
    sheet.write(row, 3, record_list[row - 1].province)

book.save('E:\订单销售额.xls')

f.close()

查看保存的excel文件:

image.png

附录

image.png

image.png

行动吧,在路上总比一直观望的要好,未来的你肯定会感 谢现在拼搏的自己!如果想学习提升找不到资料,没人答疑解惑时,请及时加入扣群: 320231853,里面有各种软件测试+开发资料和技术可以一起交流学习哦。

最后感谢每一个认真阅读我文章的人,礼尚往来总是要有的,虽然不是什么很值钱的东西,如果你用得到的话可以直接拿走:

这些资料,对于【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴上万个测试工程师们走过最艰难的路程,希望也能帮助到你!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/545406.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

测试人必看,11个非技术高频面试问题

大家都知道,测试岗位可是保证产品质量的重要一环。除了技术能力,面试官还会关注你的其他方面的素质。包括沟通能力、团队协作、解决问题等方面。 今天,咱们就来聊聊这些看似简单,实则暗藏玄机的非技术问题。 1、请你做一下自我介…

Linux系统编程---文件系统

一、文件存储 一个文件主要由两部分组成,dentry(目录项)和inode inode本质是结构体,存储文件的属性信息,如:权限、类型、大小、时间、用户、盘块位置… 也叫做文件属性管理结构,大多数的inode都存储在磁盘上。 少量…

Docker镜像,什么是Docker镜像,Docker基本常用命令

docker镜像 1.1什么是镜像,镜像基础 1.1.1 镜像的简介 镜像是一种轻量级,可执行的独立软件包,也可以说是一个精简的操作系统。镜像中包含应用软件及应用软件的运行环境,具体来说镜像包含运行某个软件所需的所有内容,…

免费领!赛盈分销联合UseePay发布《2024全球户外家居电商市场分析报告》

随着全球化的浪潮愈演愈烈,家居行业正在经历着深刻的变革与转型。过去几年,随着消费升级和科技创新的推动,家居行业呈现出以下几个明显趋势: 智能化与互联网家居 智能家居产品不断涌现,人们对于智能、便捷的家居生活…

Nacos 入门篇---服务端如何处理客户端的服务注册请求?(三)

一、引言 ok呀,上个章节我们讲了Nacos客户端的服务自动注册,今天我们来看看服务端接收到了客户端的服务注册请求,服务端都做了哪些事情~ 二、目录 目录 一、引言 二、目录 三、回顾上节内容: 四、Nacos 服务代码入…

react antd 实现修改密码(原密码,新密码,再次输入新密码,新密码增加正则复杂度校验)

先看样子 组件代码: import React, { useState, useEffect } from react import { Row, Col, Modal, Spin, Input, Button, message, Form } from antd import { LockOutlined, EyeTwoTone, EyeInvisibleOutlined } from ant-design/icons import * as Serve from …

改进 Elastic Agent 和 Beats 中的事件队列

作者:Fae Charlton, Alexandros Sapranidis 内部改进如何降低 Elastic 8.13 中的内存使用。 在 8.12 版本中,我们引入了性能预设 —— 一种更简单的方法,用于调整 Elastic Agent 和 Beats 以适应各种场景。这提高了常见环境的性能&#xff0…

喜讯|我司再次获得国家发明专利,硬核科技研发成果呈加速度增长

热烈祝贺 璞华软件成功获得国家发明专利 我司自主研发成果《一种工伤案件裁决书的生成方法及装置》(专利号:ZL 2019 1 1170975.8)成功获得国家发明专利,2024年4月成功获得专利证书。 发明人:高志凯;杨德…

微商商城源码小程序好用么?

商城APP作为电子商务行业的重要组成部分,已经成为了人们购物的主要方式之一。为了在竞争激烈的市场中脱颖而出,开发一款专业且思考深度的商城APP方案显得尤为关键。本文将从专业性和思考深度两个方面,探讨商城APP的开发方案。 一、专业性的重…

BGI | STCellBin:动植物组织细胞分割

简介 STCellbin 利用细胞核染色图像作为桥梁来获取与空间基因表达图谱对齐的细胞膜/壁染色图像。通过采用先进的细胞分割技术,可以获得准确的细胞边界,从而获得更可靠的单细胞空间基因表达谱。此次更新的增强功能为细胞内基因表达的空间组织提供了宝贵的…

uc网盘推广拉新渠道

​近期,UC网盘拉新项目在收益上展现出了一些明显的优势,这些优势对于推广者来说是非常吸引人的。以下是对这些优势的详细分析: 上手容易:与其他项目相比,UC网盘的报备审核过程相对宽松,速度也更快。在快节奏…

Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey

Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey PDF: https://arxiv.org/pdf/2403.14608.pdf 1 概述 大型模型在多个领域取得了显著进展,但它们的大规模参数带来了高昂的计算成本。这些模型需要大量资源来执行,尤其是在针…

【python】__name__函数的用法详解!

上一篇中,说到了__init__函数的使用,__init__函数是在类中实现,它在创建对象时自动执行,用于初始化对象的属性。今天我们来说一下__name__函数,__name__函数的主要作用为: 1.执行python脚本 2.导入到别的…

哪种裤子比较百搭?显高显瘦的男生裤子分享

选到合适的裤子才能穿得好看以及舒服。可是市面上也出现了不少各种裤子质量达不到标准的负面新闻,为了能够选到合适的裤子,我自费购买了多个品牌的裤子测评。之后我知道很多网红品牌为了压低成本,用料和做工都很差,于是我总结了五…

Python和Java哪个更适合后端开发?

Python和Java都是强大的后端开发语言,它们各自有鲜明的特点和适用场景。选择哪一个更适合后端开发,主要取决于具体的项目需求、团队技术栈、个人技能偏好以及长期发展考虑等因素。 下面是两者在后端开发中的优势和劣势: 「Python&#xff1…

TCP/IP协议—TCP

TCP/IP协议—TCP TCP协议TCP通信特点TCP技术概念TCP定时器 TCP头部报文TCP连接三次握手(建立连接)四次挥手(释放连接)连接状态 TCP协议 传输控制协议(TCP,Transmission Control Protocol)是一种…

《柳叶刀》子刊:突破性临床试验,证实粪菌移植治疗帕金森病的潜力

帕金森病(Parkinson’s Disease,PD),是一种复杂的神经退行性疾病,也是世界上第二常见的神经退行性疾病,仅次于阿尔茨海默病(AD),影响着约1%-2%的65岁及以上老人。随着全球…

Ribbon-负载均衡原理解析(案例)

简介:负载均衡,英文名称为Load Balance,其含义就是指将负载(工作任务)进行平衡、分摊到多个操作单元上进行运行,例如FTP服务器、Web服务器、企业核心应用服务器和其它主要任务服务器等,从而协同…

明厨亮灶厨师帽佩戴检测的难点与优化方式 Yolov5+bytetrack

随着国家一系列食品安全政策的出台,厨房的安全卫生问题逐渐被人们重视。其中,工作人员是否佩戴厨师帽是很关键的一环。人们希望能通过一种方式实现自动化的检测,但目前市场上大部分“明厨亮灶系统”或“未佩戴厨师帽检测系统”都无法满足用户…

【UE5.1】使用MySQL and MariaDB Integration插件——(1)连接MySQL

效果 步骤 1. 在虚幻商城下载“MySQL and MariaDB Integration”插件 2. 购买安装后,我们将插件添加到一个新工程中,打开新工程可以看到已经添加了插件 3. 新建一个蓝图,选择父类为“MySQLDBConnectionActor” 这里命名为该蓝图为“BP_MySQL…