Python从0到100(三十九):数据提取之正则(文末免费送书)

在这里插入图片描述

前言: 零基础学Python:Python从0到100最新最全教程。 想做这件事情很久了,这次我更新了自己所写过的所有博客,汇集成了Python从0到100,共一百节课,帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、 计算机视觉、机器学习、神经网络以及人工智能相关知识,成为学习学习和学业的先行者!
欢迎大家订阅专栏:零基础学Python:Python从0到100最新最全教程!

1 什么是正则表达式

正则表达式是一种文本模式,包括普通字符(例如,字母和数字)以及特殊字符(称为“元字符”)。这些元字符没有文字意义,它们用来定义搜索模式,这个模式可以用来检查一个字符串是否符合我们定义的规则,或者从一个文本中提取出符合规则的子串。

2 正则表达式的常见语法

知识点
  • 正则中的字符:普通字符和特殊字符。
  • 正则中的预定义字符集:如\d匹配任何十进制数字,\w匹配任何字母数字字符等。
  • 正则中的数量词:如*(零次或多次),+(一次或多次),?(零次或一次)等。
语法示例
  • .:匹配任意单个字符(除了换行符)。
  • ^:匹配输入字符串的开始位置。
  • $:匹配输入字符串的结束位置。
  • []:匹配方括号内的任意字符(例如,[abc]匹配"a"、“b"或"c”)。
  • |:逻辑或操作符(例如,cat|dog匹配"cat"或"dog")。
  • ():将多个表达式组合成一个子表达式,也可以用于捕获匹配的子字符串。

3 re模块的常见方法

方法列表
  • re.match:从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功则返回None
  • re.search:扫描整个字符串,搜索第一个位置的匹配。
  • re.findall:找出字符串中所有匹配的子串,并把它们作为列表返回。
  • re.sub:替换字符串中的一些子串。
  • re.compile:编译正则表达式,提高效率。
代码示例
import re

# 查找所有数字
result = re.findall(r'\d+', 'chuan 123 zhi 456')
print(result)  # 输出: ['123', '456']

# 替换数字为下划线
modified_string = re.sub(r'\d', '_', 'chuan 123 zhi 456')
print(modified_string)  # 输出: 'chuan _ _ zhi _ _'

# 编译正则表达式
pattern = re.compile(r'\d+', re.S)
found = pattern.findall('123 456 789')
print(found)  # 输出: ['123', '456', '789']

4 Python中原始字符串r的用法

原始字符串定义

原始字符串(raw string)通过在字符串前加上rR来定义,表示字符串中的反斜杠\不应该作为转义字符。

代码示例
# 原始字符串与普通字符串的区别
print(r'\n')  # 输出: \n
print('\n')   # 输出: (换行)

# 原始字符串的长度
print(len(r'\n'))  # 输出: 2
print(len('\n'))   # 输出: 1

5 匹配中文

代码示例
import re

# 匹配中文字符
title = u'你好,hello,世界'
pattern = re.compile(ur'[\u4e00-\u9fa5]+')
result = pattern.findall(title)

print(result)  # 输出: ['你好', '世界']

6 正则表达式的应用场景

  • 验证输入(如邮箱、电话号码等格式)
  • 搜索和替换文本
  • 从日志文件中提取信息
  • HTML/XML解析等

正则表达式是文本处理的强大工具,掌握其语法和使用方式对于编程和数据处理非常重要。

好书推荐

ChatGPT+AI文案写作实战108招
《ChatGPT AI文案写作实战108招》通过10个专题内容、108个实用技巧、240多分钟教学视频,讲解了以ChatGPT平台为代表的AI生成文案的方法,具体内容按以下两条线展开。
一是技能线:前3章内容详细讲解了ChatGPT平台的运用、向ChatGP提问的方法和高效提问的使用技巧,让读者从宏观上把握ChatGPT生成文案的技巧。
二是案例线:后7章内容包括6个文案场景和1个综合案例的AI文案生成技巧,分别为办公类文案写作、艺术类文案写作、学术类文案写作、娱乐类文案写作、媒体类文案写作、营销类文案写作和AI写作全流程案例,让读者结合具体的文案场景掌握ChatGPT生成文案的技巧。
本书案例丰富,实战性强,适合对AI文案感兴趣的读者,特别是文案策划者、文案写作人员、电商商家、新媒体编辑、广告策划者、短视频编导、作家和艺术工作者等,也可作为文学、语言、计算机等相关专业的教材。
在这里插入图片描述
购买链接:https://product.dangdang.com/29723016.html

编辑推荐

个人简历、会议发言、商业计划书、演讲稿、工作总结……
诗歌、小说、剧本、故事、散文、歌词……
调研报告、调查问卷、读书笔记……
朋友圈文案、个人自传、贺词、祝福语……
新闻稿、公众号文章、豆瓣书评、节目脚本、人物台词……
产品推广文案、测评文案、品牌故事……
各类文案写作,信手拈来!

内容简介

《ChatGPT AI文案写作实战108招》通过10个专题内容、108个实用技巧、240多分钟教学视频,讲解了以ChatGPT平台为代表的AI生成文案的方法,具体内容按以下两条线展开。
一是技能线:前3章内容详细讲解了ChatGPT平台的运用、向ChatGP提问的方法和高效提问的使用技巧,让读者从宏观上把握ChatGPT生成文案的技巧。
二是案例线:后7章内容包括6个文案场景和1个综合案例的AI文案生成技巧,分别为办公类文案写作、艺术类文案写作、学术类文案写作、娱乐类文案写作、媒体类文案写作、营销类文案写作和AI写作全流程案例,让读者结合具体的文案场景掌握ChatGPT生成文案的技巧。
本书案例丰富,实战性强,适合对AI文案感兴趣的读者,特别是文案策划者、文案写作人员、电商商家、新媒体编辑、广告策划者、短视频编导、作家和艺术工作者等,也可作为文学、语言、计算机等相关专业的教材。

作者简介

苏海,资深互联网人士,ChatGPT、文心一言等数据大模型首批使用者;对ChatGPT提问经验丰富,超过10000 组人机互动提问词研究和实战应用;运用ChatGPT进行过各类文案的写作,如办公类文案、艺术类文案、学术类文案、营销类文案等;著有畅销书《活动策划实战宝典:品牌推广 人气打造 实战案例》。

目  录

第1 章 技能入门:熟悉ChatGPT 平台的运用 001
◎ 1.1 掌握ChatGPT 的基本用法002
001 让ChatGPT 生成文案002
002 让ChatGPT 停止生成文案003
003 让ChatGPT 重新生成文案003
004 移动鼠标选择复制文案004
005 单击相应按钮复制文案005
006 输入提示词时进行换行 006
007 改写发送的指令或提示词008
◎ 1.2 掌握ChatGPT 的进阶用法009
008 用ChatGPT 生成各种图表009
009 让ChatGPT 找到合适的图片011
◎ 1.3 管理ChatGPT 的聊天窗口012
010 新建一个聊天窗口 013

前  言

人工智能在响应各行各业需求的呼声中高速发展着,不仅能够解放人们的双手,代替人类进行大量琐碎、重复的体力劳动,而且在不断升级与进化中,也可以助力人们的脑力劳动,AI 生成文案就是一个很好的例子。
ChatGPT 作为生成式AI 的主要代表,在生成文案方面有它的优势,一是通过提示词生成文案,二是联系上下文内容生成文案,这两个优势使得ChatGPT 自发布到应用之际都广受欢迎。
秉承主动识变应变求变,主动防范化解风险的精神,我们致力于探索ChatGPT 生成文案的实际应用,结合不同场景中的文案需求,通过改变提示词, 让ChatGPT 进行文案创作。在探索中,我们发现提示词是ChatGPT 生成文案的关键,因此将提示词的编写方式,即提问技巧,也即ChatGPT 生成文案的技巧, 浓缩为108 招式,汇编成此书,便于读者直接学习并掌握实用技巧,进而抢占AI 文案的高地。
综合来看,本书有以下3 个亮点。
(1)实战干货。本书提供了108 个实用的技巧和实例,涵盖了宏观上的33 招AI 生成文案技巧和微观上的75 招实际场景中的AI 生成文案技巧,让读者实打实地把握ChatGPT 的应用和AI 文案的生成。
(2)优中择优。本书选取了办公类文案写作、艺术类文案写作、学术类文案写作、娱乐类文案写作、媒体类文案写作、营销类文案写作6 大场景文案来介绍AI 生成文案的方法,且每一个案例都提供提问思路和实操技巧,让读者有选择性地、有针对性地高效学习。
(3)物超所值。书中除了介绍AI 生成文案的方法,还随书赠送了108 集教学视频、提示词和效果文件等,让读者学而无忧、学有所得。
本书内容高度凝练,由浅入深,以实战为核心,无论是初学者还是有一定经验的读者,都能够从本书中获益。
特别提示:本书在编写时,是基于ChatGPT-3.5 的界面截取的实际操作图片。需要注意的是,即使是相同的关键词,ChatGPT 每次的回复也会有差别, 因此在扫码观看教学视频时,读者应把更多的精力放在ChatGPT 关键词的编写和实操步骤上。
特别提醒:尽管ChatGPT 具备强大的模拟人类对话的能力,但由于其是基于机器学习的模型,因此在生成的文案中仍然会存在一些语法错误,读者需根据自身需求对文案进行适当修改或再加工后方可使用。
本书由苏海编著,参与编写的人员还有朱霞芳,在此表示感谢。若有与本书相关的问题需要沟通和交流,读者可扫描封底“文泉云盘”二维码获取作者联系方式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/799792.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

前端框架学习之 搭建vue2的环境 书写案例并分析

目录 搭建vue的环境 Hello小案例 分析案例 搭建vue的环境 官方指南假设你已经了解关于HTML CSS 和JavaScript的中级知识 如果你刚开始学习前端开发 将框架作为你的第一步可能不是最好的主意 掌握好基础知识再来吧 之前有其他框架的使用经验会有帮助 但这不是必需的 最…

基于双向长短时记忆神经网络(Bi-LSTM)的数据回归预测

代码原理 1.循环神经网络 循环神经网络(Recurrent Neural Network, RNN) 是深度学习领域一类具有内部自连接的神经网络能够学习复杂的矢量到矢量的映射。一个简单的循环神经网络结构,其结构包含三部分,分别为输入层、隐藏层和输出层,如图1所…

元器件基础学习笔记——磁珠

一、磁珠的作用及构造 1.1 磁珠的作用 磁珠是一种用于抑制高频噪声的被动电子组件,通常由铁氧体材料制成,这种材料具有高电阻率和高磁导率,使其能够在高频下有效地将干扰信号以热能的形式消耗掉。在电路设计中,磁珠被广泛用于信号…

红豆Cat 1开源|项目四: 从0-1设计一款TCP版本DTU产品的软硬件全过程

TCP版本DTU产品项目概述 远程终端单元( Remote Terminal Unit,DTU),一种针对通信距离较长和工业现场环境恶劣而设计的具有模块化结构的、特殊的计算机测控单元,它将末端检测仪表和执行机构与远程控制中心相连接。 产品定义&功能描述 硬件…

同时用到,网页,java程序,数据库的web小应用

具体实现功能:通过网页传输添加用户的请求,需要通过JDBC来向 MySql 添加一个用户数据 第一步,部署所有需要用到的工具 IDEA(2021.1),Tomcat(9或10),谷歌浏览器,MySql,jdk(17) 第二步,创建java项目,提前部…

Celery 是一个简单、灵活且可靠的分布式系统——python库

目录 引言 Celery 是什么? 安装 Celery 配置 Celery 创建任务 运行 Celery Worker 调用任务 更多示例 示例 1:发送电子邮件 示例 2:图片处理 示例 3:数据处理 结论 引言 今天我们来分享一个超强的 python 库&#xf…

微信小程序下载

首先进入微信网站链接:微信公众平台 (qq.com) 下载开发工具: 下载 / 稳定版更新日志 (qq.com) 下载稳定版

AV1技术学习:Translational Motion Compensation

编码块根据运动矢量在参考帧中找到相应的预测块,如下图所示,当前块的左上角的位置为(x0, y0),在参考帧中找到同样位置(x0, y0)的块,根据运动矢量移动到目标参考块(左上角位置为:(x1, y1))。 AV1…

C语言之带环链表

带环链表是数据结构链表中的一个经典问题,这里我们研究该问题分为两个方向:链表是否带环、返回链表的入环节点。 下面我们通过两个题目来分析带环链表: 1.判断链表是否带环 141. 环形链表 - 力扣(LeetCode) 那么我们…

# Redis 入门到精通(四)-- linux 环境安装 redis

Redis 入门到精通(四)-- linux 环境安装 redis 一、linux 环境安装 redis – 基于 Linux 安装 redis 1、基于 Center 0S7 或者 unbunt-18.04 安装 Redis 1)下载安装包wget http://download.redis.io/releases/redis-?.?.?.tar.gz 如&…

Unity最新第三方开源插件《Stateful Component》管理中大型项目MonoBehaviour各种序列化字段 ,的高级解决方案

上文提到了UIState, ObjectRefactor等,还提到了远古的NGUI, KBEngine-UI等 这个算是比较新的解决方法吧,但是抽象出来,问题还是这些个问题 所以你就说做游戏是不是先要解决这些问题? 而不是高大上的UiImage,DoozyUI等 Mono管理引用基本用法 ① 添加Stateful Component …

每日复盘-20240715

20240715 六日涨幅最大: ------1--------300807--------- 天迈科技 五日涨幅最大: ------1--------300807--------- 天迈科技 四日涨幅最大: ------1--------300807--------- 天迈科技 三日涨幅最大: ------1--------300713--------- 英可瑞 二日涨幅最大: ------1--------3007…

前端Vue组件化实践:自定义加载组件的探索与应用

在前端开发领域,随着业务逻辑复杂度的提升和系统规模的不断扩大,传统的开发方式逐渐暴露出效率低下、维护困难等问题。为了解决这些挑战,组件化开发作为一种高效、灵活的开发模式,受到了越来越多开发者的青睐。本文将结合实践&…

代码随想录训练营第三十六天 1049最后一块石头的重量II 494目标和

第一题: 原题链接:1049. 最后一块石头的重量 II - 力扣(LeetCode) 思路: 首先确认这是一道01背包问题的题目,如何转换:剩下尽可能小的重量,如何剩下呢?跟分割等和子集很…

基于RAG大模型的变电站智慧运维-第十届Nvidia Sky Hackathon参赛作品

第十届Nvidia Sky Hackathon参赛作品 1. 项目说明 变电站是用于变电的设施,主要的作用是将电压转化,使电能在输电线路中能够长距离传输。在电力系统中,变电站起到了极为重要的作用,它可以完成电能的负荷分配、电压的稳定、容错保…

基坑安全:自动化监测系统的革新力量

在日新月异的基坑工程领域,基坑安全自动化监测系统犹如一位守护者,以其独特的优势,为工程的安全与质量保驾护航。该系统集先进的测量仪器、计算机技术与现代传感技术于一体,对基坑的围护结构及周边环境进行全方位、高精度的实时监…

【C++基础】初识C++(1)

目录 一、认识C 1.1 C 相关概念 1.2 C的发展 1.3 C的关键字 1.4 第一个程序 二、命名空间 2.1 namespace的定义 2.2 命名空间的使用 三、C输入和输出 四、缺省函数 五、函数重载 一、认识C 1.1 C 相关概念 1983年,Bjarne Stroustrup在C语⾔的基础上…

内网安全:权限维持的各种姿势

1.Linux权限维持 2.Windows权限维持 目录: 一.Linux权限维持: 1.webshell: 2.定时任务: 3.SUID后门: 4.SSH Key免密登录后门: 5.添加用户后门: 二.Windows权限维持 1.计划任务后门&…

NetSuite RPA技术实践

近期有同学提出一个需求。 “需要存取的報表是存貨分類帳(stock ledger),將查到的各個[Item|Location]作為一組key,分別將報表中的「期末庫存量」「期末平均成本」「期末庫存量價值」這三欄的值,在每個月月底的時候自動將這個報表的這三欄數…

rollup打包工具

rollup打包工具 在学习vite和vue3源码的时候,接触到了rollup,所以过来学习一下 什么是rollup rollup是一个模块化的打包工具,会将javascript文件进行合并。比起webpack,webpack在打包的时候会进行代码注入(保障兼容性)&#xf…