python自动化办公(二)

上接python自动化办公(一)

文章目录

  • 文件和目录操作
    • 使用shutil库
    • 文件查找
      • glob
      • fnmatch
      • hashlib

文件和目录操作

使用shutil库

shutil库也是Python标准库,它可以处理文件、文件夹、压缩包,能实现文件复制、移动、压缩、解压缩等功能。

函数说明
copy复制文件和权限
copy2复制文件和元数据
copyfile将一个文件的内容复制到另外一个文件当中
copyfileobj将一个文件的内容复制到另外一个文件当中
copytree复制整个文件目录
move递归地移动文件或目录,原文件或目录就不存在了
rmtree删除一个目录以及目录内的所有内容
make_archive创建压缩包并返回文件路径
unpack_archive解压缩文件

复制文件是比较复杂的事情。文件主要由两部分组成,一部分是文件的数据,另一部分是用来描述该文件的元数据。元数据指文件的访问时间、修改时间、作者等信息。所以复制文件时要弄清楚是仅复制内容还是同时要复制元数据。

# shutil.copyfile(A,B)仅仅是复制A文件的内容到B文件。A和B必须是文件,不可以是目录。B文件得有写入权限
shutil.copyfile('./python_zen.txt','./copy01.txt')
#手动新建文件夹copyfiles
#复制文件到某个文件夹
shutil.copy('./copy01.txt','./copyfiles/')
#整体复制文件夹
shutil.copytree('./copyfiles/','./copyfiles01/')
#移动文件
shutil.move('./copyfiles01/copy01.txt','./copyfiles/copy02.txt')
#整体移动目录,移动目录本身
shutil.move('./copyfiles01/','./copyfiles/')

在os模块里,os.rmdir方法和os.removedirs方法都要求被删除的目录非空,否则会报错。而shutil.rmtree方法不管目录是否非空,都直接删除整个目录。

#删除整个目录
shutil.rmtree('./copyfiles/copyfiles01/')
#删除单个文件
import os
os.unlink('./copy01.txt')
#压缩
#参数分别为(保存)压缩包路径及名称,格式,要压缩文件的路径
shutil.make_archive('./压缩包','zip',base_dir='./copyfiles/')

更多参数可以直接网上搜,这应该够用了

#解压
#压缩包路径及名称,解压至指定文件夹
shutil.unpack_archive('./压缩包.zip','./解压文件')

文件查找

glob

glob是Python自带的一个文件操作相关模块,用它可以查找符合条件的文件。

import glob
#匹配条件,*匹配任意个字符,?匹配单个字符,[]匹配指定范围字符如[0-9]
glob.glob('*.txt')

在这里插入图片描述

fnmatch

fnmatch也是Python自带的库,是专门用来进行文件名匹配的模块,使用它可以完成更为复杂的文件名匹配。

#找出目标文件夹里所有结尾带数字的文件
import os,fnmatch
for foldName,subfolders,filenames in os.walk('./'):
    for filename in filenames:
        if fnmatch.fnmatch(filename,'*[0-9].*'):
            print(filename)

在这里插入图片描述
fnmatchcase和fnmatch函数类似,只是fnmatchcase函数强制区分字母大小写。

以上两个函数都返回True或者False,filter函数则返回匹配的文件名列表。

fileList=[]
for foldName,subfolders,filenames in os.walk('./'):
    for filename in filenames:
        fileList.append(filename)
print('fileList:\n',fileList)
print(fnmatch.filter(fileList,'*[0-9].*'))

在这里插入图片描述

hashlib

如果要找出重复文件,重复文件可能有不同的文件名,不能简单用文件名和文件大小来判断。从科学角度,最简单的办法就是通过MD5来确定两个文件是不是一样的。
Python自带的hashlib库里提供了获取文件MD5值的方法。

import hashlib
m=hashlib.md5()
f=open('./python_zen.txt','rb')
m.update(f.read())
f.close()
md5_value=m.hexdigest()
print(md5_value)

在这里插入图片描述

#文件树状图
import os
def filetree(path,depth):
    if depth==0:
        print('文件夹:'+path)
    for file in os.listdir(path):
        print('|    '*depth+'+--'+file)
        directory=path+'/'+file
        if os.path.isdir(directory):
            filetree(directory,depth+1)
filetree('./',0)

在这里插入图片描述

# 手动随意创建一个空文件夹,删除空文件夹
import os,shutil
path='./'
for file in os.listdir(path):
    directory=path+file
    if os.path.isdir(directory) and len(os.listdir(directory))==0:
        print(directory,os.listdir(directory))
        shutil.rmtree(directory)
# 删除重复文件
import os,shutil,hashlib
path='./重复文件'
list=[]
print('重复文件文件夹内容:')
for foldName,subfolders,filenames in os.walk(path):
    for filename in filenames:
        print(foldName,filename)
print('重复文件为:')
for file in os.listdir(path):
    fileName=path+'/'+file
    m=hashlib.md5()
    with open(fileName,'rb') as mfile:
        m.update(mfile.read())
    md5_value=m.hexdigest()
    if md5_value in list:
        print(fileName)
        os.unlink(fileName)#删除重复文件
    else:
        list.append(md5_value)

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/653.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Vue基础23之路由第二节

Vue基础23路由路由的query参数src/router/index.jsDetail.vueHomeMessage.vue路由的query参数命名路由src/router/index.jsHomeMessage.vueApp.vue总结路由的params参数src/router/index.jsHomeMessage.vueDetail.vue总结路由 路由的query参数 src/router/index.js //该文件专…

Gehpi的网络布局

Gehpi的网络布局1. 力引导布局2. 辅助布局布局是网络可视化中的重要概念,指将点和边通过某种策略进行排布,应尽可能满足以下4个原则: 节点均匀分布在有限的区域内避免边的交叉和弯曲保持边的长度一致整体布局能反映图内在的特性 Gephi的布局…

卷积神经网络

目录卷积神经网络概述神经网络原理卷积神经网络卷积层怎么控制输出数据?如何抓取特征池化层归一化层全连接层局部感受野权值共享多卷积核池化子采样多卷积层卷积神经网络的训练前向传播BackForward反向传播权值更新过程中的卷积网络结构层的排列规律层的尺寸设置规律…

web3:区块链共识机制系列-POS(Proof of Stake)股权证明算法

web3相关学习一并收录至该博客:web3学习博客目录大全 前情衔接:web3:区块链常见的几大共识机制及优缺点 目录前言算法公式与原理算法公式运作原理以Peer Coin为例缺陷优点缺点特点分类发展历程casper协议1.什么是无成本利益关系问题2.引入casper协议解决…

SpringBoot 动态操作定时任务(启动、停止、修改执行周期)增强版

前段时间编写了一篇博客SpringBoot 动态操作定时任务(启动、停止、修改执行周期,该篇博客还是帮助了很多同学。 但是该篇博客中的方法有些不足的地方: 只能通过前端控制器controller手动注册任务。【具体的应该是我们提前配置好我们的任务&am…

selenium(4)-------自动化测试脚本(python)

webdriverAPI 一)定位元素的方式,必问 1.1)id来定位元素,前提是元素必须具有id属性,因为有的元素是没有id的 1.2)name,元素必须有name,并且必须全局唯一 1.3)tagname,元素是一定有的,但是必须全…

HTTP 缓存的工作原理

缓存是解决http1.1当中的性能问题主要手段。缓存可能存在于客户端浏览器上,也可以存在服务器上面,当使用过期缓存可能给用户展示的是错误的信息而导致一些bug。 HTTP 缓存:为当前请求复用前请求的响应 • 目标:减少时延&#xff1…

Python+Yolov8目标识别特征检测

Yolov8目标识别特征检测如需安装运行环境或远程调试&#xff0c;见文章底部个人QQ名片&#xff0c;由专业技术人员远程协助&#xff01;前言这篇博客针对<<Yolov8目标识别特征检测>>编写代码&#xff0c;代码整洁&#xff0c;规则&#xff0c;易读。 学习与应用推荐…

3分钟看完-丄-Python自动化测试【项目实战解析】经验分享

目录&#xff1a;导读 引言 自动化测试 背景 测试团队 测试体系发展 测试平台 自动化测试现状 现状一&#xff1a; 现状二&#xff1a; 现状三&#xff1a; 现状四&#xff1a; 现状五&#xff1a; 现状六&#xff1a; 失败的背景 失败的经历 失败总结 引言 内…

Java多线程系列--synchronized的原理

原文网址&#xff1a;Java多线程系列--synchronized的原理_IT利刃出鞘的博客-CSDN博客 简介 本文介绍Java的synchronized的原理。 反编译出字节码 Test.java public class Test {private static Object LOCK new Object();public static int main(String[] args) {synchro…

动态矢量瓦片缓存库方案

目录 前言 二、实现步骤 1.将数据写入postgis数据库 2.将矢量瓦片数据写入缓存库 3.瓦片接口实现 4.瓦片局部更新接口实现 总结 前言 矢量瓦片作为webgis目前最优秀的数据格式&#xff0c;其主要特点就是解决了大批量数据在前端渲染时出现加载缓慢、卡顿的问题&#xff0…

LeetCode 112. 路径总和

LeetCode 112. 路径总和 给你二叉树的根节点 root 和一个表示目标和的整数 targetSum 。判断该树中是否存在 根节点到叶子节点 的路径&#xff0c;这条路径上所有节点值相加等于目标和 targetSum 。如果存在&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。 叶…

Python笔记 -- 文件和异常

文章目录1、文件1.1、with关键字1.2、逐行读取1.3、写入模式1.4、多行写入2、异常2.1、try-except-else2.2、pass1、文件 1.1、with关键字 with关键字用于自动管理资源 使用with可以让python在合适的时候释放资源 python会将文本解读为字符串 # -*- encoding:utf-8 -*- # 如…

Linux操作系统基础的常用命令

1&#xff0c;Linux简介Linux是一种自由和开放源码的操作系统&#xff0c;存在着许多不同的Linux版本&#xff0c;但它们都使用了Linux内核。Linux可安装在各种计算机硬件设备中&#xff0c;比如手机、平板电脑、路由器、台式计算机。1.1Linux介绍Linux出现于1991年&#xff0c…

操作技巧 | 在Revit中借用CAD填充图案的方法

在建模过程中&#xff0c;有时需要达到多种填充效果&#xff0c;而CAD中大量的二维填充图案&#xff0c;便是最直接的资源之一。 使用 填充图案之前 使用 填充图案之后 其中要用到主要命令便是对表面填充图案的添加与编辑 简单效果 如下 模型填充与绘图填充 区别 模型填…

Java for循环嵌套for循环,你需要懂的代码性能优化技巧

前言 本篇分析的技巧点其实是比较常见的&#xff0c;但是最近的几次的代码评审还是发现有不少兄弟没注意到。 所以还是想拿出来说下。 正文 是个什么场景呢&#xff1f; 就是 for循环 里面还有 for循环&#xff0c; 然后做一些数据匹配、处理 这种场景。 我们结合实例代码来…

SpringBoot+WebSocket实时监控异常

# 写在前面此异常非彼异常&#xff0c;标题所说的异常是业务上的异常。最近做了一个需求&#xff0c;消防的设备巡检&#xff0c;如果巡检发现异常&#xff0c;通过手机端提交&#xff0c;后台的实时监控页面实时获取到该设备的信息及位置&#xff0c;然后安排员工去处理。因为…

Java实现调用第三方相关接口(附详细思路)

目录1.0.简单版2.0.升级版2-1.call.timeout()怎么传入新的超时值2-2.timeout(10, TimeUnit.SECONDS)两个参数的意思&#xff0c;具体含义3.0.进阶版3-1.java.net.SocketTimeoutException: 超时如何解决4.0.终极版1.0.简单版 以下是一个使用 Java 实际请求“第三方”的简单示例代…

一眼看破五花八门的链表结构

文章目录&#x1f4d5;一&#xff1a;五花八门的链表结构&#x1f4d6;链表与数组的简单对比&#x1f4d6;单链表&#x1f4d6;循环链表&#x1f4d6;双向链表&#x1f4d5;二&#xff1a;链表VS数组性能大比拼&#x1f47f;最后说一句&#x1f431;‍&#x1f409;作者简介&am…

数据挖掘(2.1)--数据预处理

一、基础知识 1.数据的基本概念 1.1基础知识 数据是数据对象(Data Objects)及其属性(Attributes)的集合。 数据对象(一条记录、一个实体、一个案例、一个样本等)是对一个事物或者物理对象的描述。 数据对象的属性则是这个对象的性质或特征&#xff0c;例如一个人的肤色、眼球…