【MySQL】(基础篇七) —— 通配符和正则表达式

通配符和正则表达式

本章介绍什么是通配符、如何使用通配符以及怎样使用LIKE操作符进行通配搜索,以便对数据进行复杂过滤;如何使用正则表达式来更好地控制数据过滤。

目录

  • 通配符和正则表达式
    • LIKE操作符
      • 百分号(%)通配符
      • 下划线(_)通配符
    • 通配符使用技巧
    • 正则表达式
    • MySQL常用正则
      • 基本字符匹配
      • OR匹配
      • 匹配几个字符之一
      • 匹配范围
      • 匹配特殊字符
      • 匹配字符类
      • 匹配多个实例
      • 定位符

LIKE操作符

在之前的案例中,我们都是用确定的条件进行查找和筛选,并没有实现模糊查询,比如要查找名字中有王这个字的数据。这种需求就需要使用通配符来解决。

通配符:(wildcard) 用来匹配值的一部分的特殊字符。

搜索模式:(search pattern)由字面值、通配符或两者组合构成的搜索条件。

为在搜索子句中使用通配符,必须使用LIKE操作符。LIKE指示MySQL,后跟的搜索模式利用通配符匹配而不是直接相等匹配进行比较。

百分号(%)通配符

最常使用的通配符是百分号(%)。在搜索串中,%表示任何字符出现任意次数。

【示例】在employees表中查询first_name以al开头的条目信息

SELECT *
FROM `employees`
WHERE first_name LIKE 'al%';

运行结果:

在这里插入图片描述

通配符可在搜索模式中任意位置使用,并且可以使用多个通配符。

【示例】在employees表中查询first_name中包含la的信息

SELECT first_name
FROM `employees`
WHERE first_name LIKE '%la%';

运行结果:

在这里插入图片描述

尾空格可能会干扰通配符匹配。例如,在保存词anvil 时, 如果它后面有一个或多个空格, 则子句WHERE
prod_name LIKE '%anvil’将不会匹配它们,因为在最后的l后有多余的字符。解决这个问题的一个简单的办法是在搜索模式最后附加一个%。一个更好的办法是使用函数(后续文章会详细介绍函数用法)去掉首尾空格。

虽然似乎%通配符可以匹配任何东西,但有一个例外,即NULL。即使是WHERE first_name LIKE '%'也不能匹配用值NULL作为名字的行。

下划线(_)通配符

另一个常用的通配符是下划线(_)。下划线的用途与%一样,但下划线只匹配单个字符而不是多个字符。

【示例】查询employees表中first_name中以l开头一共四个字符的信息条目

SELECT first_name
FROM `employees`
WHERE first_name LIKE 'l___';

运行结果:

在这里插入图片描述

与%能匹配0个字符不一样,_总是匹配一个字符,不能多也不能少。

通配符使用技巧

正如所见,MySQL的通配符很有用。但这种功能是有代价的:通配符搜索的处理一般要比前面讨论的其他搜索所花时间更长。这里给出一些使用通配符要记住的技巧。

  • 不要过度使用通配符。如果其他操作符能达到相同的目的,应该使用其他操作符。
  • 在确实需要使用通配符时,除非绝对有必要,否则不要把它们用在搜索模式的开始处。把通配符置于搜索模式的开始处,搜索起来是最慢的。
  • 仔细注意通配符的位置。如果放错地方,可能不会返回想要的数据。总之,通配符是一种极重要和有用的搜索工具,以后我们经常会用到它。

正则表达式

对于基本的过滤(或者甚至是某些不那么基本的过滤),前面介绍的过滤方法+通配符就足够了。但随着过滤条件的复杂性的增加,WHERE子句本身的复杂性也有必要增加。

这也就是正则表达式变得有用的地方。正则表达式是用来匹配文本的特殊的串(字符集合)。如果你想从一个文本文件中提取电话号码,可以使用正则表达式。如果你需要查找名字中间有数字的所有文件,可以使用一个正则表达式。如果你想在一个文本块中找到所有重复的单词,可以使用一个正则表达式。如果你想替换一个页面中的所有URL为这些URL的实际HTML链接,也可以使用正则表达式实现。

所有种类的程序设计语言、文本编辑器、操作系统等都支持正则表达式。有见识的程序员和网络管理员已经关注作为他们技术工具重要内容的正则表达式很长时间了。

正则表达式用正则表达式语言来建立,正则表达式语言是用来完成刚讨论的所有工作以及更多工作的一种特殊语言。此处我也仅仅是为你介绍一些简单和常用的正则语言,更详细的内容可以关注我的博客,我后续会专门为正则语言开一个专栏。

MySQL常用正则

MySQL用WHERE子句对正则表达式提供了初步的支持,允许你指定正则表达式过滤SELECT检索出的数据。

基本字符匹配

我们从一个非常简单的例子开始。

【示例】下面的语句检索employees表中列first_name包含文本al的所有行:

SELECT first_name
FROM `employees`
WHERE first_name REGEXP 'al';

运行结果:

在这里插入图片描述

除关键字LIKE被REGEXP替代外,这条语句看上去非常像使用LIKE的语句。它告诉MySQL,REGEXP后所跟的东西作为正则表达式处理。

REGEXP 是一个用于执行正则表达式匹配的函数,它允许你在SQL查询中进行复杂的文本模式匹配。基本语法如下:

expr REGEXP pattern

这里:

  • expr 是你想要检查是否匹配正则表达式模式的表达式(通常是字段名或字符串值)。
  • pattern 是定义匹配规则的正则表达式模式。

LIKE匹配整个列。如果被匹配的文本在列值中出现,LIKE将不会找到它,相应的行也不被返回(除非使用
通配符)。而REGEXP在列值内进行匹配,如果被匹配的文本在列值中出现,REGEXP将会找到它,相应的行将被返回。这是一个非常重要的差别。

OR匹配

为搜索两个串之一(或者为这个串,或者为另一个串),使用|

【示例】检索employees表中列first_name包含文本al或ch的所有行:

SELECT first_name
FROM `employees`
WHERE first_name REGEXP 'al|ch';

运行结果:

在这里插入图片描述

匹配几个字符之一

如果你只想匹配特定的字符,可通过指定一组用[和]括起来的字符来完成,如下所示:

【示例】检索employees表中列first_name包含文本al、bl、cl的所有行:

SELECT first_name
FROM `employees`
WHERE first_name REGEXP '[abc]l';

运行结果:

在这里插入图片描述

这里,使用了正则表达式[abc]l。[abc]定义一组字符,它的意思是匹配a或b或c,因此,al和cl都匹配且返回(没有bl)。

正如所见,[]是另一种形式的OR语句。事实上,正则表达式[abc]l为[a|b|c]l的缩写,也可以使用后者。

匹配范围

集合可用来定义要匹配的一个或多个字符。例如,下面的集合将匹配数字0到9:

[0-9]

范围不一定只是数值的,[a-z]匹配任意字母字符。

匹配特殊字符

正则表达式语言由具有特定含义的特殊字符构成。我们已经看到.、[]、|和-等,还有其他一些字符。如果你需要匹配这些字符,应该使用转义为了匹配特殊字符,必须用\为前导。\\-表示查找-,\\.表示查找.

为了匹配反斜杠(\)字符本身,需要使用\\\

匹配字符类

存在找出你自己经常使用的数字、所有字母字符或所有数字字母字符等的匹配。为更方便工作,可以使用预定义的字符集,称为字符类(character class)。下表列出字符类以及它们的含义。

说明
[:alnum:]任意字母和数字(同[a-zA-Z0-9])
[:alpha:]任意字符(同[a-zA-Z])
[:blank:]空格和制表(同[\t])
[:cntrl:]ASCII控制字符(ASCII 0到31和127)
[:digit:]任意数字(同[0-9])
[:graph:]与[:print:]相同,但不包括空格
[:lower:]任意小写字母(同[a-z])
[:print:]任意可打印字符
[:space:]包括空格在内的任意空白字符(同[\f\n\r\t\v])
[:upper:]任意大写字母(同[A-Z])
[:punct:]既不在[:alnum:]又不在[:cntrl:]中的任意字符
[:xdigit:]任意十六进制数字(同[a-fA-F0-9])

匹配多个实例

目前为止使用的所有正则表达式都试图匹配单次出现。如果存在一个匹配,该行被检索出来,如果不存在,检索不出任何行。但有时需要对匹配的数目进行更强的控制。例如,你可能需要寻找所有的数,不管数中包含多少数字,或者你可能想寻找一个单词并且还能够适应一个尾随的s(如果存在),等等。

重复元字符

元字符说明
*0个或多个匹配
+1个或多个匹配(等于{1,})
0个或1个匹配(等于{0,1})
{n}指定数目的匹配
{n,}不少于指定数目的匹配
{n,m}匹配数目的范围(m不超过255)

【示例】

\\([0-9] sticks?\\)

\\(匹配),[0-9]匹配任意数字,sticks?匹配stick和sticks(s后的?使s可选,因为?匹配它前面的任何字符的0次或1次出现),``\`)匹配)。

【示例】匹配连在一起的任意4位数字。

[[:digit:]]{4}

定位符

为了匹配特定位置的文本,需要使用下表列出的定位符。

元字符说明
^文本开始
$文本结尾
[[:<:]]词的开始
[[:>:]]词的末尾

【示例】想找出以一个数(包括以小数点开始的数)开始的所有产品

^[0-9\\.]

^的双重用途: ^有两种用法。在集合中(用[和]定义),用它来否定该集合,否则,用来指串的开始处。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/698099.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

VitePress+Docker+jenkins构建个人网站

VitePress官网 VitePress | 由 Vite 和 Vue 驱动的静态站点生成器 可以理解为一个前端脚手架:快速生成个人站点 最好先大概看一遍 快速开始 | VitePress 可以在线体验一下 安装条件 node -v 检查下node版本 在D盘创建一个文件夹 例如:VitePress 进入文件夹 cmd npm ini…

xshell远程无法链接上VM的centos7

1、现象如下&#xff0c; 2.1解决办法&#xff1a;查证后发现这个默认的设置为vmnet0 2.2解决办法&#xff1a;重启win10的虚拟机网卡&#xff08;先禁用再启用&#xff09; 3.参考文章&#xff1a;Xshell连接不上虚拟机centos7_centos7的nat模式可以ping通网络,但是用xshell连…

深入浅出LLM大语言模型

一. 前言 2022年末&#xff0c;聊天程序ChatGPT的上线&#xff0c;在短短5天被注册用户就破百万。ChatGPT的爆火&#xff0c;在一夜之间&#xff0c;带领人类穿越到了真正的人工智能时代。 本文会从ChatGPT作为切入点&#xff0c;在介绍其底层的GPT模型诞生史后&#xff0c;再…

基于SSM+Jsp的交通事故档案管理系统

开发语言&#xff1a;Java框架&#xff1a;ssm技术&#xff1a;JSPJDK版本&#xff1a;JDK1.8服务器&#xff1a;tomcat7数据库&#xff1a;mysql 5.7&#xff08;一定要5.7版本&#xff09;数据库工具&#xff1a;Navicat11开发软件&#xff1a;eclipse/myeclipse/ideaMaven包…

打造精细化运维新玩法(三)

实践SLO&#xff0c;概括下就是在相对标准、统一的框架下指导和推动服务质量的数字化建设&#xff0c;形成对组织有价值的数据资产和流程规范。借用在人工智能和机器学习领域的观点&#xff0c;算法的上限受限于数据质量的好坏&#xff0c;所以从源头上建设高质量的数据非常重要…

2024年城市建设、运输与智慧交通国际会议(ICUCTST 2024)

2024 International Conference on Urban Construction, Transportation, and Smart Transportation 【1】大会信息 会议简称&#xff1a;ICUCTST 2024 大会地点&#xff1a;中国厦门 会议官网&#xff1a;www.icuctst.com 投稿邮箱&#xff1a;icuctstsub-paper.com 【2】会…

打工人和学生党的福利,NewspaceGpt使用新体验

使用地址&#xff1a;https://newspace.ai0.cn/ 个人名片 &#x1f393;作者简介&#xff1a;java领域优质创作者 &#x1f310;个人主页&#xff1a;码农阿豪 &#x1f4de;工作室&#xff1a;新空间代码工作室&#xff08;提供各种软件服务&#xff09; &#x1f48c;个人邮…

2024年智能医疗与生物医药国际会议(ICIHB 2024)

2024 International Conference on Intelligent Healthcare and Biopharmaceuticals 【1】大会信息 会议简称&#xff1a;ICIHB 2024 大会地点&#xff1a;中国珠海 会议官网&#xff1a;www.icihb.com 投稿邮箱&#xff1a;icihbsub-paper.com 【2】会议简介 2024年智能医…

C++:SLT容器-->queue

C:SLT容器-->queue 1. queue容器2. queue 常用接口 1. queue容器 先进先出队列允许从一端插入元素&#xff0c;从另一端删除元素队列中只有队头和队尾可以被外界使用&#xff0c;因此队列不允许有遍历行为队列中插入数据称为入队(push)&#xff0c;删除数据称为出队(pop) …

LeetCode 算法:缺失的第一个正数c++

原题链接&#x1f517;&#xff1a;缺失的第一个正数 难度&#xff1a;困难⭐️⭐️⭐️ 题目 给你一个未排序的整数数组 nums &#xff0c;请你找出其中没有出现的最小的正整数。 请你实现时间复杂度为 O(n) 并且只使用常数级别额外空间的解决方案。 示例 1&#xff1a; 输…

Leetcode刷题笔记8

162. 寻找峰值 162. 寻找峰值 - 力扣&#xff08;LeetCode&#xff09; 对于所有有效的 i 都有 nums[i] ! nums[i 1] 解法一&#xff1a;暴力解法 从第一个位置一直向后走&#xff0c;然后分情况即可1. 第二个元素就往下降&#xff0c;那么第一个元素就是峰顶 2. 一直遍历…

9、编写业务逻辑

9、编写业务逻辑 9.1 编写博客接口(新增和查询一起编写了) 响应实体:(随便封装的,可以根据自己的想法封装) // entity/Response package com.example.fullstackblogback.commen;import lombok.Data;import java.util.List;@Data public class Response<T> {pri…

C++: shared_ptr是线程安全的吗

导读 C面试中有时会有这样一个问题&#xff0c;shared_ptr是线程安全的吗&#xff1f;对此问题&#xff0c;我们需要从三个并发场景进行考虑&#xff0c;拷贝shared_ptr的安全性、对shared_ptr赋值的安全性和读写shared_ptr指向内存区域的安全性。 对于以上问题&#xff0c;首…

计算机网络期末考试知识点(关键词:江中)

目录 大家端午节快乐呀&#xff01;又到了一年两度的期末考试月了&#xff0c;这里给大家整理了一些复习知识点&#xff0c;大家可以边吃粽子边复习&#xff0c;事半功倍哈哈哈。祝各位期末过&#xff01;过&#xff01;过&#xff01;。 1 第一章 计算机网络体系结构 计算机…

重生之我要精通JAVA--第八周笔记

文章目录 多线程线程的状态线程池自定义线程池最大并行数多线程小练习 网络编程BS架构优缺点CS架构优缺点三要素IP特殊IP常用的CMD命令 InetAddress类端口号协议UDP协议&#xff08;重点&#xff09;UDP三种通信方式 TCP协议&#xff08;重点&#xff09;三次握手四次挥手 反射…

python科研做图系列之时序图的绘制——对比折线图

参考知乎 折线图 我需要从两个不同的excel都读取第一列作为时间列,第二列作为编码列。 在同一张图上画出两条时间序列的折线图 横坐标是分钟,纵坐标是编码 帮我画的好看一些,记得解决中文乱码问题 英文版折线图 ,先搞个英文版,导师要求中文的话,再换成中文版 impor…

redis 03 RDB AOF

1.数据库状态 2.为什么会出现RDB 3.什么是RDB 5.1 5.2 6 6.1 6.2 6.2.1 6.2.2 6.2.3 7 8. 8.1 9 9.1 9.2 9.3 9.4 9.5 1.服务器父进程 2.重写的时候会创建子进程

深入理解Vue3.js响应式系统基础逻辑

如果您觉得这篇文章有帮助的话&#xff01;给个点赞和评论支持下吧&#xff0c;感谢~ 作者&#xff1a;前端小王hs 阿里云社区博客专家/清华大学出版社签约作者/csdn百万访问前端博主/B站千粉前端up主 此篇文章是博主于2022年学习《Vue.js设计与实现》时的笔记整理而来 书籍&a…

收音机的原理笔记

1. 收音机原理 有线广播&#xff1a;我们听到的声音是通过空气振动进行传播&#xff0c;因此可以通过麦克风&#xff08;话筒&#xff09;将这种机械振动转换为电信号&#xff0c;传到远处&#xff0c;再重新通过扬声器&#xff08;喇叭&#xff09;转换为机械振动&#xff0c…

c++(运算符重载 静态成员)

思维导图&#xff1a; 复习&#xff1a; class Person {friend const Person operator(const Person &L,const Person &R);friend bool operator>(const Person &L,const Person &R);friend Person &operator(Person &L,const Person &R);frie…