[MySQL] MySQL中的数据类型

在MySQL中，数据类型用于定义表中列的数据的类型。在前面的几篇文章中，我们也会看到有很多的数据类型，例如：char、varchar、date、int等等。本篇文章会对常见的数据类型进行详细讲解。希望会对你有所帮助！

文章目录

一、常见的数据类型及分类

二、数值类型

2、1 整型

2、1、1 tinyint

2、1、2 bit

2、2 浮点型

2、2、1 float

2、2、2 decimal

三、字符串类型

3、1 char

3、2 varchar

3、3 char 和 varchar 比较

四、日期与时间类型

五、枚举与集合类型

5、1 enum

5、2 set

5、3 查找

🙋‍♂️ 作者：@Ggggggtm 🙋‍♂️

👀 专栏：MySQL 👀

💥 标题：MySQL中的数据类型💥

❣️ 寄语：与其忙着诉苦，不如低头赶路，奋路前行，终将遇到一番好风景 ❣️

一、常见的数据类型及分类

我们先来看一下MySQL中大体上都会有哪些数据类型。具体如下图：

其中上述的是值类型包含了整型和浮点型，文本、二进制类型主要是字符串类型。下面我们在具体分类描述一下：

整数类型（Integer Types）：

TINYINT：范围为-128到127或0到255（无符号），用于存储较小的整数值，如存储性别或状态信息。
SMALLINT：范围为-32768到32767或0到65535（无符号），用于存储较小的整数值，如存储年龄或计数值。
MEDIUMINT：范围为-8388608到8388607或0到16777215（无符号），适用于中等大小的整数值存储。
INT：范围为-2147483648到2147483647或0到4294967295（无符号），适用于一般整数值存储。
BIGINT：范围为-9223372036854775808到9223372036854775807或0到18446744073709551615（无符号），用于存储大整数值，如存储ID或计数值。

浮点数类型（Floating-Point Types）：

FLOAT：用于存储单精度浮点数，约占用4个字节的空间。
DOUBLE：用于存储双精度浮点数，约占用8个字节的空间。
DECIMAL：用于精确的十进制数值存储，适用于货币或其他需要精确计算的场景。

日期与时间类型（Date and Time Types）：

DATE：用于存储日期，格式为'YYYY-MM-DD'，如'2023-11-13'。
TIME：用于存储时间，格式为'HH:MM:SS'，如'12:30:00'。
DATETIME：用于存储日期和时间，格式为'YYYY-MM-DD HH:MM:SS'，如'2023-11-13 12:30:00'。

字符串类型（String Types）：

CHAR：用于存储固定长度的字符串，如CHAR(10)可以存储长度为10的字符串。
VARCHAR：用于存储可变长度的字符串，如VARCHAR(255)可以存储长度最大为255的字符串。
TEXT：用于存储较长的文本数据，例如文章内容或备注信息。

枚举和集合类型：

枚举（ENUM）类型：枚举类型允许您从一组预定义的选项中选择一个单独的值。在创建表结构时，你可以指定枚举类型的字段允许的值列表
集合（SET）类型：集合类型允许您从一组预定义的选项中选择多个值，这些值之间使用逗号分隔。与枚举类型不同，集合类型允许您选择多个选项，而不仅限于一项。

其他类型：

BOOLEAN：在MySQL中没有专门的BOOLEAN类型，通常使用TINYINT(1)来表示布尔值，0表示false，1表示true。

下面我们看一些实际的例子来理解这些数据类型。

二、数值类型

2、1 整型

整型包括如下几种：

他们最根本的区别就是所占用空间大小不同，也因此导致了能够存储的数据范围不同。我们不妨来测试一下各个整型。

2、1、1 tinyint

我们先来测试一下tinyint的取值范围。我们先来创建一个表：

我们尝试着插入一些数据，如下图所示：

再插入合法的范围内是能够正常进行插入的。但是一旦超过的tinyint的取值范围，就会不让你插入。并且当不是整型时，也会不让你插入。

在C/C++中，int tmp = ‘a’最多会发出提醒，并不会报错，本质上发生了隐式类型转换。char a = 200也并不会报错，会发生截断。即使你存储的数据超出了指定类型的取值范围，也并不会报错，而是发出警告并且存储溢出后进行调整的值。

在数据库中并不像C/C++那样，而是有着严格的要求。mysql的数据类型中，符合条件才会让你操作，不符合条件直接不让你操作。在mysql的数据类型中，除了能够满足各种应用场景，还有一个特别重要的用途：数据类型本质就是一种约束！怎么理解约束呢？约束的谁呢？约束就是强制你必须按照规则去做，约束的就是使用者。倒逼使用者，必须遵守规则!

我们再来简单测试一下无符号的tinyint。具体如下图：

我们尝试着向表中的tmp1列中插入一些数据，如下图：

我们在查看表t1的数据时，发现有NULL。那么NULL和空字符串' '是一样的吗？答案是不一样的。NULL和空字符串' '代表着不同的含义：

NULL：在数据库中表示缺少值或未知值。当一个字段的值未知或者不适用时，可以使用NULL来表示。NULL不等于任何其他值，包括空字符串。

空字符串' '：表示一个空的字符串值。当一个字段需要有值，但是没有具体数值或字符时，可以使用空字符串来表示。空字符串是一个有效的值。

在mysql中，字符串可用单引号 ' '来引用，也可用双引号 " "来引用。例如 'It's a good day' 和 "It's a good day" 都是合法的字符串表示。一般情况下在mysql中都是用单引号 ' ' 的。

其他整型就不再过多解释，我们需要记住其所占用的大小和取值范围，同时也应该会使用即可。

2、1、2 bit

bit类型也是一种数值类型。bit类型是用于存储二进制数字的数据类型。它可以用来表示位值为0或1的数值，比如开关状态、标志位等。我们先来看一下其使用方法。如下图：

如上图，我们创建了一个t2表。其中包含了列a，数据类型为int；列b，数据类型为bit(10)。括号内的10的意思就是我们指定有几个比特位。那么b的大小是10个比特位。我们再来测试一下，如下图：

确实能够插入成功。10个bit能够存储的数据范围是0~1023。确实正如上图所示。我们再来查看一下表中的数据。如下图：

怎么表中存储的并不是我们所插入的数据呢？存储是按照我们所插入的数据进行存储的，但是bit类型在显示时，是按照ASCII码对应的值进行显示的。具体如下图：

需要注意的是，虽然bit类型可以用于存储任意大小的二进制数，但是在实际应用中，bit通常只用于存储较小的数值。这是因为bit类型的空间效率相对较低，对于较大的数值，使用其他数据类型可能会更加合适。

2、2 浮点型

2、2、1 float

float 用于存储近似值的浮点数，它表示单精度浮点数。由于浮点数是以二进制形式表示的，可能存在精度损失的情况。下面我们看具体实例来理解其用法。具体如下图：

上图中我们创建了一个名字为t3的表。其中包含了一个字段a，其类型为float（4，2）。float的语法格式为 float(M, D)，其中 M 表示总位数，D 表示小数点后的位数。例如，float(4, 2) 表示总共 4 位，其中 2 位为小数位。下面我们插入一些数据看一下，如下图：

那要是插入长度大于4的数据呢？我们再看如下图：

正如上图所示，当小数位数大于两位时，会进行四舍五入。四舍五入就会产生进位，但必须保证进位后的小数也能够满足两位，也就是整数部分不得超过两位。我们看到float（4，2）的取值范围是 -99.994 ~ 99.994。

我们再来看一下无符号的float。如下图：

我们再来插入一些数据，如下图：

但是负数就不能在进行插入了，如下图：

其实我们这里发现，float（M，D）中的M和D限制了我们的数据范围，其次就是有符号和无符号的区别。float可以表示最大值为3.402823e+38的正或负实数，所占用的字节为4字节。

在MySQL中，如果不指定float类型的总位数和小数点数后的位数，默认情况下float类型的总位数为其最大取值范围。具体如下图：

从上图中我们也能看到，float一旦数据较大，就会有精度损失。一般情况下提供约6位精度。这意味着float类型可以存储大约6位有效数字的数据，但实际精度可能受到存储数据时的舍入误差的影响。我们接下来再看decimal类型。

2、2、2 decimal

decimal用于精确存储数字，它表示定点数，能够保证精度不会丢失。decimal的语法格式为 DECIMAL(M, D)，其中 M 表示总位数，D 表示小数点后的位数。例如，DECIMAL(10, 2) 表示总共 10 位，其中 2 位为小数位。其用法用float一样的。如下图：

通过上图我们也能看到，decimal类型精度并不会丢失。decimal与float都是用来存储浮点数的，用法也是相同。不同的是，decimal类型存储的数字是精确的，不会丢失精度。decimal占用的空间为8字节。

三、字符串类型

3、1 char

char类型在mysql中是一个经常使用的类型。具体使用如下图：

上图中定义了一个名字为str的字段，其属性为char（5），也就是最多可存储5个字符。我们插入数据来看一下：

我们也能看到，一旦插入的字符长度超过5，就不会让你插入。注意，在mysql中，char（5）中的5是指的5个字符，并不是5个字节。所以我们也可以最多插入5个汉字。如下图：

在不同编码中，一个字符所占的字节个数是不同的。比如utf8中一个字符占3个字节，而gbk中一个字符占2个字节。char（5）就是指能够最多插入5个字符。这样用户在使用时就不用去关心字节数的问题了。

char也是有字符长度上限的。char的字符长度上限是255。我们看如下图：

当我们修改char的长度为256时就会报错，并不允许我们进行修改操作。

3、2 varchar

varchar也是用来存储字符的数据类型。使用方法与char相同。我们先看一下其具体使用例子。如下图：

那么varchar 和 char 有什么区别呢？就char（10）和 varchar（10）来说明，无论char中实际存储的字符串长度是多少，char始终占用10个字符长度的存储空间。但是varchar是一种可变长度的字符类型，意味着它只占用实际存储数据所需的存储空间。我们在varchar中只存储5个字符的话，那么varchar只占用5个字符长度的空间。

关于 varchar(len)，len 到底是多大，这个 len 值，和表的编码密切相关：

varchar长度可以指定为0到65535之间的值，但是有1 - 3 个字节用于记录数据大小（varchar是变长的），所以说有效字节数是 65532。
当我们的表的编码是utf8时，varchar(n)的参数n最大值是65532/3=21844（因为utf中，一个字符占用3个字节），如果编码是gbk，varchar(n)的参数n最大是65532/2=32766（因为gbk中，一个字符占用2字节）。

我们看如下例子：

我们看到当我们设置varchar的字符长度为21845时，就提示我们超过最大长度了。提示中给出的是65535个字节，并且包含了记录长度的字节数据。

3、3 char 和 varchar 比较

我们不妨来对比一下 char 和 varchar的区别。

CHAR数据类型：

CHAR是一种固定长度的字符类型，意味着它始终占用固定数量的存储空间。
当定义一个CHAR列时，您需要指定该列的固定长度。例如，CHAR(10)表示该列将始终存储10个字符。
无论实际存储的字符串长度是多少，CHAR始终占用指定长度的存储空间。
CHAR适合存储长度固定的字符串，例如邮政编码或固定长度的标识符。

VARCHAR数据类型：

VARCHAR是一种可变长度的字符类型，意味着它只占用实际存储数据所需的存储空间。
当定义一个VARCHAR列时，您需要指定该列可存储的最大长度。例如，VARCHAR(100)表示该列可以存储最多100个字符，但实际存储的字符串长度可以少于100个字符。
VARCHAR适合存储长度可变的字符串，例如用户输入的文本或变长的描述信息。

主要区别：

存储方式：CHAR是固定长度的，而VARCHAR是可变长度的。这意味着在使用CHAR时，数据将按固定长度存储；而使用VARCHAR时，额外的空间将被用来存储数据长度信息。
性能：CHAR由于固定长度和提前分配的空间，其性能通常比VARCHAR要快。特别是当已知要存储的字符串长度时。而VARCHAR因为其灵活性（读取时需要先读取存储字符串的长度，再访问指定长度的空间），可能稍慢一些。
空间使用：CHAR使用固定的空间来存储数据，因此可能会因为并没有使用全部空间而造成空间的浪费。但VARCHAR使用额外空间来存储数据长度信息，相对来说空间利用率较高。
可变字段：如果一个字段的数据长度可能会有所不同，使用VARCHAR可能会更好，因为它允许更大的数据长度。

选择使用哪种类型取决于你的具体需求。如果你知道要存储的字符串的长度，并且长度是固定的，CHAR可能是一个好选择。然而，如果你不确定字符串的长度，或者需要更大的灵活性，使用VARCHAR可能更合适。

四、日期与时间类型

我们在前面的文章使用过到data类型。该类型就是属于日期类型的。常见的日期类型有：

date：日期格式为 'YYYY-MM-DD'，占用三字节。
datetime：时间日期格式为 'YYYY-MM-DD HH:MM:SS'，占用八字节。
timestamp：时间戳，从1970年开始的。格式为 'YYYY-MM-DD HH:MM:SS'，占用四字节。

下面我们通过一个实例来看一下其具体使用方法。如下图：

通过上图可看出，timestamp时间戳是不允许为空的，并且他是有默认值的。默认值就是当前的时间戳。我们插入数据看一下：

我们看到并没有插入时间戳时会自动插入和更新的。这里的更新是指的每当对表进行修改操作时，时间戳就会更新。

在使用这些数据类型时，需要根据实际需求选择合适的类型。如果只需要存储日期，选择DATE类型；如果需要存储日期和时间，选择DATETIME或TIMESTAMP类型，根据需要考虑是否需要自动更新功能。TIMESTAMP常用于的就是评论时记录时间或者发表内容时的时间。

五、枚举与集合类型

5、1 enum

enum类型是一种字符串对象的类型，用于定义一个列可以包含的可能值的有限列表。语法：enum('value1', 'value2', ...)。其中，'value1', 'value2'等是列允许的枚举值。我们直接看一个实际的例子。如下图：

当我们再插入数据时，插入hobby属性时，就可以从我们的枚举列表中进行选择其中一个进行插入。如下图：

如上图所示，插入的数据并不是枚举中的属性值，就会报错。出于效率考虑，这些值实际

存储的是 “ 数字 ” ，因此这些选项的每个选项值依次对应如下数字： 1,2,3,.... 最多 65535 个；当我们添加枚举值时，也可以添加对应的数字编号（ 枚举中仍然何以使用下标进行选择所要插入的数据）。如下图：

但是需要注意的一点是：枚举中的第一个元素下标是从1开始的，并不是从0开始的。

5、2 set

通过对上述的枚举的理解后，我们发现在很多情况下一个人的爱好会有很多，并不是只有一个。但是枚举类型只能一次选一个。这时候我们就可以使用set类型。

SET是一种字符串对象，用于定义一个列可以包含的可能值的多选列表。语法：SET('value1', 'value2', ...)。其中，'value1', 'value2'等是列允许的多选值。我们可以直接通过之前学的对表进行修改，把hobby的类型改成set。具体如下图：

我们再来插入一些数据，具体如下图：

通过上图可以看到，再插入数据时我们可以从set集合中一次选多个数据进行插入，也可一次只选一个数据。set集合设定只是提供了若干个选项的值，最终一个单元格中，设计可存储了其中任意多个值；而且出于效率考虑，这些值实际存储的也是“数字”，因此这些选项的每个选项值依次对应如下数字：1,2,4,8,16,32，.... 最多64个。我们再来通过数字进行插入，具体如下图：

注意，3是1和2相加的结果，7是1和2和4相加的结果。我们可对应set集合进行查看。

虽然可以用数字添加枚举，但是不建议在添加枚举值，集合值的时候采用数字的方式，因为不利于阅读，且后期维护成本较高。

5、3 查找

如上图，我们想要选出喜欢打篮球的人该怎么做呢？看看下面这种方法是不是你所想到的，如下：

但是发现一个问题：还有很多人也是喜欢篮球的，但是并没有将他们筛选出来。那要怎么做呢？这时候我们需要学习一下find_in_set()的使用了。

find_in_set()是 MySQL 中的一个函数，用于在逗号分隔的字符串列表中查找指定的字符串。它的作用是在一个逗号分隔的字符串列表中查找指定的值，并返回该值在列表中的位置。使用方法：
FIND_IN_SET(search_string, string_list)
其中：

search_string是要查找的字符串。
string_list是逗号分隔的字符串列表，它包含要搜索的多个字符串。

返回值：

如果search_string在string_list中找到，则返回它在列表中的位置（从 1 开始）。
如果未找到，则返回 0。

我们看如下例子：