python文件操作(Windows路径,内置os库)+ 正则表达式(语法与re库)

文章目录

  • 前言
    • 1 Windows路径
      • (1)绝对路径 (Absolute Path)
      • (2)相对路径 (Relative Path)
  • 一、python文件的读写操作
    • 1 读写
      • (1)打开文件
        • file = open('test1.txt','r',encoding='utf-8') --- 打开文件
      • (2)读取文件内容
        • content = file.read() --- 读取全部内容,返回字符串
        • lines = readlines(): 读取所有行并返回一个包含每行内容的列表(逐行读取)
      • (3)写入内容
        • 写入新文件或覆盖文件 (write) - w
        • 追加内容 (append) - a
      • (4)file.close() : 关闭文件
      • (5)with open('test1.txt','r',encoding='utf-8')as f 语句
    • 2 二进制读写模式
  • 二、os 内置路径操作库
    • os.path.realpath(__file__):获取当前执行的脚本文件的绝对路径。
    • os.path.abspath(path): 把相对路径转成绝对路径。
    • os.getcwd():获取当前工作目录的绝对路径。
    • os.path.dirname(path): 返回path上一级的绝对路径
    • os.path.basename(path):返回路径path中的文件名或者目录名
    • os.listdir(path): 返回指定目录中的文件和子目录列表。
    • os.makedirs(path,exist_ok=True) --- 在给定路径创建目录
    • os.path.join(path1, path2,...): 将多个个路径组合成一个完整的路径。
    • os.path.exists(path): 检查路径是否存在。
    • os.path.isfile(path): 检查是否为文件。
    • os.path.isdir(path): 检查是否为目录。
    • os.remove(path): 删除指定文件。
    • os.rmdir(path): 删除指定空目录,必须是空目录;不是递归的删除,所以者函数屁用没有
  • 三、正则表达式
    • 1 正则表达式语法
    • 2 re 正则表达式处理库
      • (1)匹配对象obj获取信息的方法
        • • group(): 返回匹配的字符串。
        • • start(): 返回匹配的起始位置。
        • • end(): 返回匹配的结束位置。
        • • span(): 返回一个元组,包含匹配的起始和结束位置。
      • (2)返回第一个匹配到的信息
        • re.search(pattern, string): 在字符串中搜索模式,如果成功匹配,则返回第一个匹配对象obj。
      • (3)返回所有匹配结果
        • re.findall(pattern, string) :返回的是包含所有匹配字符串组成的列表
        • re.finditer(pattern, string):返回的是包含所有匹配项信息的迭代器,迭代器里面每一项都是一个匹配对象obj
      • (4)替换文本
        • re.sub(pattern, repl, string): 在字符串中查找匹配的模式,并用替换字符串替换它们。 并返回替换后的文本
      • (5)根据匹配拆分
        • re.split(pattern, string): 根据模式将字符串拆分为列表。返回拆分的列表
      • (6)练习:综合案例:编写一个软件的文本查找功能,要求全文查找所有符合条件的匹配项
  • 总结


前言

先介绍本部分的前置知识 ---- Windows路径知识。

1 Windows路径

在 Windows 操作系统中,处理文件和目录时,绝对路径和相对路径是两个非常重要的概念。理解和正确使用它们有助于高效地管理文件系统。以下是对 Windows 绝对路径和相对路径的详细说明以及在 Python 中的用法。

(1)绝对路径 (Absolute Path)

绝对路径是指从磁盘的根目录开始,完整地指向文件或目录的路径。它不依赖于当前的工作目录,无论在哪个位置,绝对路径始终指向同一个文件或目录。

Windows 中的绝对路径格式

在 Windows 中,绝对路径通常以驱动器号开头,后跟路径中的每个目录,使用反斜杠 (\) 分隔。例如:

C:\Users\JohnDoe\Documents\example.txt
  • C: 是驱动器号。
  • \Users\JohnDoe\Documents\example.txt 是从驱动器根目录到目标文件的完整路径。

在 Python 中,绝对路径可以直接使用。例如:

file_path = r"C:\Users\JohnDoe\Documents\example.txt"
with open(file_path, 'r') as file:
    content = file.read()
    print(content)

注意:

  • 使用 r 字符串前缀,表示原始字符串,避免反斜杠作为转义字符(如 \n)。
  • 也可以使用双反斜杠 (\\) 来避免转义问题:
file_path = "C:\\Users\\JohnDoe\\Documents\\example.txt"

(2)相对路径 (Relative Path)

相对路径是相对于当前工作目录的路径。它表示文件或目录相对于某个参考点的位置。

Windows 中的相对路径格式

在 Windows 中,相对路径通常不包括驱动器号,而是从当前工作目录或参考点开始。例如,如果当前工作目录是 C:\Users\JohnDoe,相对路径 .\Documents\example.txt 实际上表示 C:\Users\JohnDoe\Documents\example.txt

  • . 表示当前目录。
  • .. 表示上一级目录。
    相对路径的使用主要就是这两个点点的使用,下面用一个具体的文件结构来说明:
C:\
│
├── Users\
│   ├── JohnDoe\
│   │   ├── Documents\
│   │   │   ├── Project\
│   │   │   │   ├── report.txt
│   │   │   │   ├── data\
│   │   │   │   │   ├── analysis1.csv
│   │   │   │   │   ├── analysis2.csv
│   │   │   │   └── results\
│   │   │   │       ├── summary.docx
│   │   │   │
│   │   │   ├── Notes.txt
│   │   │
│   │   └── Pictures\
│   │       ├── vacation.jpg
│   │
│   ├── JaneDoe\
│   │   └── Downloads\
│   │       └── movie.mp4
│
└── Program Files\
    └── App\
        └── app.exe

假设我们当前的工作目录是 C:\Users\JohnDoe\Documents\Project\data
那么:

  • C:\Users\JohnDoe\Documents\Project\data\analysis1.csv的相对路径就可以写为 .\analysis1.csv,当前工作目录下面的文件路径也可以直接文件名就是相对路径analysis1.csv
  • C:\Users\JohnDoe\Documents\Project\report.txt的相对路径就可以写为 ..\report.txt
  • C:\Users\JohnDoe\Documents\Notes.txt的相对路径就可以写为..\..\Notes.txt
  • C:\Users\JohnDoe\Pictures\vacation.jpg的相对路径就可以写为 ..\..\..\Pictures\vacation.jpg

【注】:python中获取当前工作目录的函数 os 库里面含有。

一、python文件的读写操作

先介绍本节会用到的常见参数:
常用参数有:

  • file: 文件的路径或名称。
  • mode: 打开文件的模式,如只读(‘r’)、写入(‘w’)、追加(‘a’)、读写(‘r+’)等。
  • encoding: 文件的编码方式,如 ‘utf-8’。

常见模式说明:

  • ‘r’:只读模式,文件必须存在。
  • ‘w’:写入模式,文件不存在则创建,存在则清空。
  • ‘a’:追加模式,文件不存在则创建。
  • ‘b’:二进制模式,与其他模式结合使用,例如 ‘rb’ 表示以二进制读取。

1 读写

假设有以下txt文本在test1.txt中:
在这里插入图片描述

(1)打开文件

file = open(‘test1.txt’,‘r’,encoding=‘utf-8’) — 打开文件

(2)读取文件内容

content = file.read() — 读取全部内容,返回字符串
f = open('test1.txt','r',encoding='utf-8')
data = f.read()
f.close()
print(type(data))
# 可以看到返回的类型是str
print(data)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/711742.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

HTML静态网页成品作业(HTML+CSS)—— 明星吴磊介绍网页(5个页面)

🎉不定期分享源码,关注不丢失哦 文章目录 一、作品介绍二、作品演示三、代码目录四、网站代码HTML部分代码 五、源码获取 一、作品介绍 🏷️本套采用HTMLCSS,未使用Javacsript代码,共有5个页面。 二、作品演示 三、代…

uni-app前端,社区团购系统搭建部署

目录 前言: 一、社区团购模式: 二、社区团购系统功能: 三、总结: 前言: 区团购系统是一种利用互联网技术和组织力量,通过线上线下结合的方式,为社区居民提供方便快捷的商品和服务采购平台。…

Qwen2的各模型性能、占用显存和推理速度比较(摘自官方文档)

Qwen2的各模型性能、占用显存和推理速度比较(摘自官方文档) 性能 推理速度(从大到小) 72B 57B-A14B 7B 1.5B 0.5B

邮件钓鱼--有无SPF演示--Swaks

目录 临时邮箱网址: Swaks 简单使用说明:(kali自带) 操作流程: 无SPF:(直接伪造发信人) 演示1 演示2 演示3 ​编辑 有SPF:--演示 临时邮箱网址: http://24mail.chacuo.net/ https://www.linshi-email.com/ Swaks 简单使用说明:(kali自带) -t –t…

【PPT教程】一键重置幻灯片背景的方法,新建幻灯片带默认背景

目的是替换18届的研电赛ppt背景为19届 这里写目录标题 1.设计->设置背景格式2.图片或纹理填充->插入3.选择需要替换为背景的照片4.点击下方的应用到全部 1.设计->设置背景格式 2.图片或纹理填充->插入 3.选择需要替换为背景的照片 4.点击下方的应用到全部 此时全部…

MySQL----慢查询日志

慢日志 MySQL可以设置慢查询日志,当SQL执行的时间超过我们设定的时间,那么这些SQL就会被记录在慢查询日志当中,然后我们通过查看日志,用explain分析这些SQL的执行计划,来判定为什么效率低下。 查看相关信息 show va…

kaggle竞赛实战10——特征优化

特征优化思路: 在完成常规流程后,如果不知道怎么办,可以针对文本or时间序列特征进行进一步处理 首先,我们注意到,每一笔信用卡的交易记录都有交易时间,而对于时间字段和文本字段,普通的批量创…

SAP BOM项目类别N非库存项目简介

在BOM的项目类别中用的最多的就是L类型的库存管理,还有T类型的文本类型,但是在实际业务中也会存在物料不做库存管理,但是物料需要进行成本的管控,进入对应的工单成本中,比如在电子行业中需要烧录的正版软件,或者是电脑制造行业中需要预装的正版的Windows系统,购买的软件…

sql优化之利用聚簇索引减少回表次数:limit 100000,10

1. 问题描述 产品:我要对订单列表页做一个分页功能,每页10条数据,商家可以根据金额过滤订单 技术:好的,我写一个sql实现分页,x表示偏移页数,自测limit 10,10耗时200ms: SELECT * …

程序员基本功之git的使用

阿里网盘-资料链接 文章目录 git分布式版本控制工具git的基本概念开发过程中的问题常见的版本控制工具git分布式版本控制工具特点git系统所定制的若干目标git的工作流程图 GIT的安装和常用命令**创建本地git仓库步骤****本地git仓库的使用**git log详解 git分布式版本控制工具…

java:spring actuator扩展原有info endpoint的功能

# 项目代码资源&#xff1a; 可能还在审核中&#xff0c;请等待。。。 https://download.csdn.net/download/chenhz2284/89437506 # 项目代码 【pom.xml】 <dependencies><dependency><groupId>org.springframework.boot</groupId><artifactId&…

ssm162基于SSM的药房药品采购集中管理系统的设计与实现+vue

药房药品采购集中管理系统的设计与实现 摘 要 互联网发展至今&#xff0c;无论是其理论还是技术都已经成熟&#xff0c;而且它广泛参与在社会中的方方面面。它让信息都可以通过网络传播&#xff0c;搭配信息管理工具可以很好地为人们提供服务。针对药房药品采购信息管理混乱&…

MacOS安装redis

文章目录 前言一、介绍二、下载三、安装四、启动五、配置六、Redis 可视化工具下载七、配置详解八、常用命令总结 前言 Redis因其高性能和低延迟而成为现代应用程序的理想选择&#xff0c;尤其适合需要快速读写操作的场景。随着技术的不断发展&#xff0c;Redis继续在性能、功…

学习笔记——网络管理与运维——SNMP(SNMP版本)

二、SNMP版本 1、SNMP版本 SNMP共有三个版本&#xff1a;SNMPv1、SNMPv2c和SNMPv3。 (1)SNMPv1 1990年5月&#xff0c;RFC1157定义了SNMP的第一个版本SNMPv1。RFC1157提供了一种监口控和管理计算机网络的系统方法。SNMPv1基于团体名认证&#xff0c;安全性较差&#xff0c;…

5.数据仓库与数据挖掘期末复习

ETL的含义Extract 、 Transformation、Load。ODS的全称Operational Data Store。 DW全称 Data WarehourseDM全称是Data Mart数据仓库数据抽取时所用到技术是增量、全量、定时、调度STAGE层作用是提供业务系统数据文件的临时存储ODS层作用ods提供业务系统细节数据长期沉淀MID层…

系统架构师考点--计算机硬件

大家好。今天我总结一下计算机硬件的一些考点。 一、中央处理单元&#xff08;CPU&#xff09; 我们知道&#xff0c;计算机的基本硬件系统由运算器、控制器、存储器、输入设备和输出设备5大部件组成。其中运算器、控制器等部件被集成在一起统称为中央处理单元(Central Proce…

挑战5分钟内基于Springboot+SpringMVC+Mybatis-plus快速构建web后端三层架构

目标 在清晨的代码编辑器上&#xff0c;一场新的挑战即将开始。程序员们肃立于安静的办公室&#xff0c;眼神专注地盯着屏幕&#xff0c;等待着编译器的一声提示。 随着编译器输出的激动人心的"start!"的提示&#xff0c;战斗的序幕拉开了。Bug如潮水般涌来&#x…

C++ bfS

岛屿的最大面积 . - 力扣&#xff08;LeetCode&#xff09; 1.刚开始mn又加了int 2.bfs里符合条件了&#xff0c;不push&#xff0c;&#xff0c;&#xff0c;在写什么几把 class Solution { public:int dx[4] {0, 0, 1, -1};int dy[4] {1, -1, 0, 0};bool vis[50][50];int…

Centos7安装jdk8或11以及切换方案

目录 jdk安装 安装OpenJDK11 安装OpenJDK8 配置默认的 Java 版本 验证 全局环境变量&#xff08;选配&#xff09; 个人版&#xff08;自己可以用&#xff0c;公司不建议&#xff09; 公司版本 /etc/profile 和 ~/.bash_profile 区别 前言-与正文无关 生活远不止眼前的苦…

解决 kali 中使用 vulhub 拉取不到镜像问题

由于默认情况下&#xff0c;访问的镜像是国外的&#xff0c;而从 2023 年开始&#xff0c;docker 的镜像网站就一直访问不了&#xff0c;所以我们可以把镜像地址改成国内的阿里云镜像地址。 1、在 cd /etc/docker/目录下创建或修改daemon.json文件 sudo touch daemon.json 2、在…