【Python Cookbook】S01E20 fnmatch 模块做字符串匹配

目录

  • 问题
  • 解决方案
  • 讨论

问题

在不同的操作系统下,怎样做字符串匹配?

解决方案

fnmatch() 模块提供两个函数,fnmatch() 以及 fnmatchcase() 可以用来执行做这样的匹配。

from fnmatch import fnmatch, fnmatchcase

match_res = fnmatch('foo.txt', '*.txt')
print(match_res)
match_res2 = fnmatch('foo.txt', '?oo.txt')
match_res3 = fnmatch('foo.txt', '?oo.txt')
match_res4 = fnmatch('Dat45.csv', 'Dat[0-9]*')
match_res5 = fnmatch('Dat45.csv', 'Dat[0-9].csv')
match_res6 = fnmatch('Dat45.csv', 'Dat[0-9][0-9].csv')

print(match_res2, match_res3, match_res4, match_res5, match_res6)

结果:

True True True False True

fnmatch() 函数也可以处理更多复杂场景的数据结构:

names = ['Dat1.csv', 'Dat2.csv', 'config.ini', 'foo.py', 'api.py']
matchs = [name for name in names if fnmatch(name, 'Dat*.csv')]
print(matchs)

结果:

['Dat1.csv', 'Dat2.csv']

一般来说,在不同的操作系统上,fnmatch() 的匹配模式所采用的大小写区分规则和底层文件系统相同,即根据操作系统的不同而有所不同。例如:

# On OS X (MAX)
fnmatch('foo.txt', '*.TXT')
>>> False

# On Windows
fnmatch('foo.txt', '*.TXT')
>>> True

但是如果大小写统一化很重要,那么我们除了使用 lower() 等方法统一化字符串大小写以外,还可以通过 fnmatchcase() 方法,完全根据我们提供的大小写方式来进行匹配。

fnmatch_res = fnmatch('foo.txt', '*.TXT')
fnmatchcase_res = fnmatchcase('foo.txt', '*.TXT')
print('fnmatch_res :', fnmatch_res)
print('fnmatchcase_res :', fnmatchcase_res)

结果:

在这里插入图片描述

讨论

fnmatch 模块的两个函数其实在处理非文件名式的字符串时有非常大的潜在用途:

addresses = [
    '5412 N CLARK ST',
    '1060 W ADDISON ST',
    '1039 W GRANVILLE AVE',
    '2122 N CLARK ST',
    '4902 N BROADWAY'
]

address_res1 = [addr for addr in addresses if fnmatchcase(addr, '*ST')]
print(address_res1)
address_res2 = [addr for addr in addresses if fnmatchcase(addr, '54[0-9][0-9] *CLARK*')]
print(address_res2)

结果:

['5412 N CLARK ST', '1060 W ADDISON ST', '2122 N CLARK ST']
['5412 N CLARK ST']

小结:
fnmatch 所完成的匹配操作有点介乎于简单的字符串方法和全功能的正则表达式之间。但是如果只是试着在处理数据时提供一种简单的机制以允许使用通配符,那么字符串方法,fnmatch 都是合理的解决方案。

但是如果实际上想编写匹配文件名的代码,glob 模块似乎是一个更好的选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/684098.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

MBR10100FCT-ASEMI肖特基二极管MBR10100FCT

编辑:ll MBR10100FCT-ASEMI肖特基二极管MBR10100FCT 型号:MBR10100FCT 品牌:ASEMI 封装:TO-220F 最大平均正向电流(IF):10A 最大循环峰值反向电压(VRRM)&#xff1…

Python实现定时任务的三种方案——schedule、APScheduler、Celery

schedule schedule是一个轻量级的Python库,用于定期执行任务,即定时任务调度。它提供了一种简单直观的方式来自定义任务执行的时间规则,而无需复杂的线程或进程管理知识。schedule适用于那些需要在后台定期执行某些功能的Python应用程序&…

指令工程Prompt的演变:从必须技能到AI内置功能

前言 随着人工智能(AI)技术的飞速发展,我们见证了许多领域的变革。在AI的早期,指令工程(Prompt Engineering)是一项关键技能,它允许我们更有效地与AI进行交互,指导AI完成特定的任务…

C:pro_1

涉及知识点:C语言、数据结构、文件IO 1前言 ①linux挂载U盘 为解决多张图片传输到6813传输慢的不足,采用linux挂载U盘。步骤为: ①查看U盘名字 fdisk -l ②建USB文件夹 mkdir /mnt/usb ③挂载u盘 mount /dev/sda /mnt/usb 进入/mnt/usb可以查看u盘的内容 ④…

如何去掉IDEA中烦人的警告波浪线

有时候想去掉idea中那些黄色的红色的warning波浪线,这些不是错误,并不影响执行,一直显示显得让人很烦躁,去"Editor" -> "Inspections"中一个个设置很麻烦。 可以通过设置代码检测级别来降低代码检查的严格…

从零开始发布你的第一个npm插件包并在多项目中使用

引言 在开源的世界里,每个人都有机会成为贡献者,甚至是创新的引领者。您是否有过这样的想法:开发一个解决特定问题的小工具,让她成为其他开发者手中的利器?今天,我们就来一场实战训练,学习如何将…

交易者要敢于“自我隔离”,建立自己和市场的“防火墙”

交易技巧与知识是可学习的,市场经验也是可积累的,但更需要形成成熟的心理,并且快速付诸实际行动,而这种行动是一个漫长的实践,追求和感悟的过程。 作为交易员每天面临着大量的胜败,责任重大、压力巨大。理性…

大模型学习之菜鸟的进阶道路

在我学习大模型之前,我一直是一个java哥,现在学习了大模型,我看视频学习,就只知道一个base llm,还有一个是instruction tuned llm,我理解了这些词汇的意义,然后进入了正式学习,那我们…

【Qt】 new成功,但是没有进入到构造函数。

NameTest工程中 nametest.cpp NameTest::NameTest() {pdata new privateAB; }NameTest::~NameTest() {if (pdata){privateAB *p (privateAB *)pData; //void *pdata nullptr;delete p;pdata nullptr;} }内部类: privateAB #include "private.h"#i…

vs2015Professional英文版和中文版的安装教程(附安装包)

英文版 下载安装包 1、Visual Studio 2015 With Update 3 Community 32位64位英文社区版下载地址: http://download.microsoft.com/download/b/e/d/bedddfc4-55f4-4748-90a8-ffe38a40e89f/vs2015.3.com_enu.iso 镜像名称:en_visual_studio_community_…

图片像素缩放,支持个性化自定义与精准比例调整,让图像处理更轻松便捷!

图片已经成为我们生活中不可或缺的一部分。无论是社交媒体的分享,还是工作文档的编辑,图片都扮演着至关重要的角色。然而,你是否曾经遇到过这样的问题:一张高清大图在上传时却受限于平台的大小要求,或者一张小图需要放…

Python用于简化数据操作和分析工作库之DaPy使用详解

概要 在数据科学和机器学习领域,处理和分析数据是关键的一步。Python 的 DaPy 库提供了一组强大的工具,用于简化数据操作和分析工作。DaPy 旨在提供高效且直观的 API,使得数据处理变得更加便捷。本文将详细介绍 DaPy 库,包括其安装方法、主要特性、基本和高级功能,以及实…

【MMdetection】2.自定义数据训练

1.废话 因为MMdetection里面提供了非常多的模型和配置文件供我们选择,这样做对比实验非常方便。 在标准数据集上训练预定义的模型 — MMDetection 3.3.0 文档 官方文档在此。 openMMlab提供了各种经典网络和配置文件系统使得MMdetection的上手难度有一点,不熟悉官方常规操…

AI绘画入门基础之描述关键词(提示词)需要遵循什么逻辑?

简单来说总结为一句话:就是告诉AI,你要画什么东西,东西长什么样,用什么画法绘画。 1. 概念性与详细性: 使用这么多AI绘画工具创作图片以来,其实有时候根据一些中文概念词语也能生成一些不错的画风图片&a…

python篮球队员招募 2024年3月青少年编程电子学会python编程等级考试二级真题解析

目录 python篮球队员招募 一、题目要求 1、编程实现 2、输入输出 二、算法分析 三、程序代码 四、程序说明 五、运行结果 六、考点分析 七、 推荐资料 1、蓝桥杯比赛 2、考级资料 3、其它资料 python篮球队员招募 2024年3月 python编程等级考试级编程题 一、题目…

ultralytics solutions快速解决方案,快速实现某些场景的图像解决方案

参考: https://docs.ultralytics.com/solutions/ 在不断更新,已经有一些场景的解决方案 ultralytics 8.2.27 一、区域统计 1、自定义区域统计数量 https://docs.ultralytics.com/guides/region-counting/ 1、自定义画框,比如矩形框四个点的坐标获取 通过cv2点击图片获…

人工智能_机器学习097_PCA数据降维算法_数据去中心化_特征值_特征向量_EVD特征值分解原来和代码实现---人工智能工作笔记0222

降维算法的原理,一会咱们再看,现在先看一下,算法 可以看到PCA算法的,原理和过程,我们先看一下代码 为了说明PCA原理,这里,我们,先来计算一下X的方差,可以看到 先把数据进行去中心化,也就是用数据,减去数据的平均值. B = X-X.mean(axis=0) 这段代码是用于计算矩阵X的每一列减去该…

Dell戴尔XPS 16 9640 Intel酷睿Ultra9处理器笔记本电脑原装出厂Windows11系统包,恢复原厂开箱状态oem预装系统

下载链接:https://pan.baidu.com/s/1j_sc8FW5x-ZreNrqvRhjmg?pwd5gk6 提取码:5gk6 戴尔原装系统自带网卡、显卡、声卡、蓝牙等所有硬件驱动、出厂主题壁纸、系统属性专属联机支持标志、系统属性专属LOGO标志、Office办公软件、MyDell、迈克菲等预装软…

【UE5.1 角色练习】11-坐骑——Part1(控制大象移动)

前言 在上一篇(【UE5.1 角色练习】10-物体抬升、抛出技能 - part2)基础上创建一个新的大象坐骑角色,并实现控制该角色行走的功能。 效果 步骤 1. 在商城中下载“African Animal Pack”资产和“ANIMAL VARIETY PACK”资产导入工程中 2. 复…

python-opencv图像分割

文章目录 二值化图像骨骼连通域分割 二值化 所谓图像分割,就是将图像的目标和背景分离开来,更直观一点,就是把目标涂成白色,背景涂成黑色,言尽于此,是不是恍然大悟:这不就是二值化么&#xff1…