MySQL中, 自增主键和UUID作为主键有什么区别?

首先我们来看看, 存储自增主键和uuid的数据类型

        我们知道, mysql中作为主键的通常是int类型的数据, 这个 数据从第一条记录开始, 从1开始主键往后递增, 例如我有100条数据, 那么根据主键排序后, 里面的记录从上往下一次就是1, 2, 3 ... 100, 但是UUID就不一样了, UUID是根据特殊的算法, 来生成唯一的一个字符串, 他的长度高达128个比特位, 而标准的UUID格式为:xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx (8-4-4-4-12), 每一个x都是 0-9 或 a-f 范围内的一个十六进制的数字, 因此他需要使用字符串格式来进行存储, 标准的uuid的长度是32个字符, 外加两个短线, 也就是34个字符

        在mysql中对int类型值的处理速度是比字符串的速度要快的, 因此在速度上, 是肯定比不过自增主键的, 我们在比较UUID, 然后对这些UUID进行一个排序的, 是一个字符一个字符的进行比较的, 例如有两个UUID, 那么就是从第一个字符比较, 如果第一个字符相等, 就比较下一个字符的大小, 以此类推, 直到比较完了, 那么两个字符串就想等, 如果存在字符的大小区别, 那么就根据不同的这个字符进行排序, 以此类推.

        所以你是用UUID进行存储, 那么相比于自增的主键, 那么你就要花费额外的空间来存储这些UUID, 在插入主键或者是uuid的时候, 会有一个插入顺序的问题, 对于主键, 如果你不指定主键的值, 然后给这个主键设置自增值, 那么在插入的时候, 就会按照最大主键值的下一位插入, 这个时候就会性能很高, 为什么这么说呢? 

        因为mysql底层是一个数据页为一个基本的读写单元, 一个数据页可以存放16kb的数据, 你可以理解为数据页里面的记录是一个链表, 假如此时你不是按主键自增的顺序插入, 并且你插入的主键对应的数据页刚好满了装不下了, 此时的话, 你就需要将一个页拆分为两页, 这个就造成了不必要的性能消耗. 如果你按照自增的形式插入, 那么他们就会以此在最后一个数据页里面插入, 如果不够了, 就创建新的数据页, 而不是将一个页差分为两个, 然后拷贝数据.   

         但是如果你是使用的UUID作为主键, 那么就没有这个功能, 你的字符串id是有序的, 但是你不能保证, 你下一个生成的uuid, 就一定是最大的, 因此被分页的可能性就会很高. 同时每一个主键的占用的空间大了, 那么一个数据页装的数据记录也会变少, 页面增多, 所以在对这些记录进行操作, 将数据页读取到内存中的时候, 读取的页数页随之增多. io成本随之增多.

        在存储和性能方面, 还是自增主键更胜一筹.

说了这么多仿佛都是UUID的缺点, 那UUID做主键就么没有有点吗?

        有点肯定是有的 , 例如UUID的长度很长, 并且是随机生成的, 他的主键的复杂性很高, 并且没有规律, 你不能够通过数据分析来预测下一个主键id是多少,这种不可预测性对于需要保密性的应用场景较为适用。

        还有另外一种场景, 假如现在有这样一个需求, 我需要将一个自增主键的表, 导入另外一个和当前表结构相同的表, 但是这个表已经存了很多数据, 这个时候我将其插入, 就会导入失败, 因为两个表前面几部分的id是重合的, 因此会插入失败. 同样的当你去拆分数据库的时候, 也可以很好的拆分, 并且避免id的重复导致数据的错乱.

        此时如果你使用的是UUID, 那么就可以避免这个问题.

总结

在MySQL中,使用自增主键(AUTO_INCREMENT)和UUID作为主键的主要区别体现在以下几个方面:

  1. 唯一性
    • 自增主键:确保主键的唯一性,每次插入新行时,数据库会自动为主键生成一个唯一的、比之前插入的最大主键值大1的整数值。
    • UUID:具有极高的唯一性,基于一定算法(如随机数生成器或时间戳)生成,几乎不可能重复。UUID由32位16进制数表示,共128位(标准的UUID格式为:xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx)。
  2. 数据类型和存储
    • 自增主键:只适用于整数类型的主键列(如INT、BIGINT等),存储空间相对较小。
    • UUID:虽然也是字符串类型,但由于其长度较长(32个字符),存储空间相对较大。
  3. 插入性能
    • 自增主键:在插入新行时,数据库可以很容易地将新行插入到索引的末尾,减少了页分裂或移动数据的频率,从而提高了插入性能。
    • UUID:由于UUID是随机生成的,插入时位置具有不确定性,可能导致无序插入和内存碎片,插入性能相对较差。
  4. 索引和查询性能
    • 自增主键:由于其递增的特性,非常适合用作聚集索引(Clustered Index),能够优化查询性能。同时,较小的索引大小也可以减少内存消耗,更好地适应于内存缓存。
    • UUID:由于UUID的无序性,可能导致索引碎片化,影响查询性能。同时,较大的索引大小也可能增加内存消耗。
  5. 可预测性
    • 自增主键:主键值是可预测的,因为它们是按顺序生成的。
    • UUID:主键值是不可预测的,因为它们是随机生成的。这种不可预测性对于需要保密性的应用场景较为适用。
  6. 删除和重新插入
    • 自增主键:在删除并重新插入数据后,可能会出现主键值“跳跃”的现象,即新插入的主键值可能会比之前删除的主键值大很多。
    • UUID:UUID在删除和重新插入数据时,主键值不会受到影响,因为它们是随机生成的。

         自增主键和UUID在MySQL中各有优缺点,选择哪种方式作为主键取决于具体的应用场景和需求。例如,在需要高性能插入和查询的场景下,自增主键可能更合适;而在需要保证主键全局唯一性和不可预测性的场景下,UUID可能更合适。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/646840.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于Zookeeper的分布式锁

分布式锁的介绍 在Java的多线程部分,我们知道如果在单个jvm进程中,多个线程之间同时访问一个资源,此时会有多线程的安全问题。为了解决这个线程安全的问题,我们可以使⽤“锁”来实现。但是,多个jvm进程之间如果同时访问…

Topk问题以及二叉树的三种层序遍历和基本操作

一、Topk问题 1、问题描述 TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。 比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。 2、思路 对于Top-K问题,能想到的最简单直接的…

Go微服务: Nacos的搭建和基础API的使用

Nacos 概述 文档:https://nacos.io/docs/latest/what-is-nacos/搭建:https://nacos.io/docs/latest/quickstart/quick-start-docker/有很多种搭建方式,我们这里使用 docker 来搭建 Nacos 的搭建 这里,我们选择单机模式&#xf…

重学java 46.集合 ① Collection集合

事常与人违,事总在人为 —— 24.5.26 集合 知识导航 1.集合的特点以及作用 2.使用collection接口中的方法 3.使用迭代器迭代集合 4.ArrayList以及LinkedList的使用 5.使用增强for遍历集合 一、单列集合框架的介绍 1.长度可变的容器:集合 2.集合的特点 a.…

App推广新境界:Xinstall助你轻松突破运营痛点,实现用户快速增长!

在移动互联网时代,App已经成为企业营销不可或缺的一部分。然而,如何有效地推广App,吸引并留住用户,成为了众多企业面临的难题。今天,我们将为您揭秘一款神奇的App推广工具——Xinstall,它将助您轻松突破运营…

音视频开发8 音视频中SDL的使用,SDL 在windows上环境搭建,SDL 使用 以及 常用 API说明,show YUV and play PCM

1.SDL简介 SDL(Simple DirectMedia Layer),是一个跨平台的C语言多媒体开发库。 支持Windows、Mac OS X、Linux、iOS、Android 提供对音频、键盘、鼠标、游戏操纵杆、图形硬件的底层访问 很多的视频播放软件、模拟器、受欢迎的游戏都在使用…

我的前端封装之路

最近有粉丝提问了我一个面试中遇到的问题,他说面试的时候,面试官问我:你在以前的项目中封装过组件吗?或者做过npm公共库吗?遇到过什么问题吗?当时自己突然觉得好像没什么可回答的啊,但面试结束想…

【Torch学习笔记】

作者:zjk 和 的区别是逐元素相乘,是矩阵相乘 cat stack 的区别 cat stack 是用于沿新维度将多个张量堆叠在一起的函数。它要求所有输入张量具有相同的形状,并在指定的新维度上进行堆叠。

LabVIEW直方图应用解析

概述 在LabVIEW中,直方图是一种重要的工具,用于分析和展示数据的分布情况。它通过将数据分成若干区间并绘制对应频数,可以帮助用户了解数据的集中趋势、离散程度和分布形态。本文将详细介绍LabVIEW中直方图的使用方法、适用场合、实际意义及…

解决使用ServletUtil.write方法下载接口文件中文乱码问题

文章目录 前言代码片段如下:一、问题分析二、解决办法总结 前言 在开发过程中遇到的一个小问题,实现一个下载模板的接口,我选择了使用hutool包的ServletUtil.write方法去进行文件下载,但调试过程中下载出来的文件名是乱码的&#…

DEM、DSM和DTM之间的区别及5米高程数据获取

在日常的学习工作中我们经常会遇到DEM、DSM和DTM等术语,它们的含义类似,甚至相互替换。那么它们之间有什么区别?这里我们对这些术语进行介绍。 DEM(数字高程模型,Digital Elevation Model): 定义…

JavaFX安装与使用

前言 最近学习了javafx,开始时在配置环境和导包时遇到了一些麻烦,关于网上很多方法都尝试过了,现在问题都解决了,和大家分享一下我是怎么实现javafx的配置,希望大家可以通过这个方法实现自己的环境配置! 🙈个人主页: 心.c 🔥文章专题:javafx &#x1f49…

5月26号总结

目录 刷题记录(Codeforces Round 947 (Div. 1 Div. 2)前三题) 1.A. Bazoka and Mochas Array 2.B. 378QAQ and Mochas Array 3.C. Chamo and Mochas Array 刷题记录(Codeforces Round 947 (Div. 1 Div. 2)前三题) 1.A. Bazok…

【开源可视化报表设计器】借力实现高效率流程化办公!

进行数字化转型、实现流程化办公,这些应该是目前很多企业都想要实现的目标吧。那么,利用什么样的软件平台可以实现?低代码技术平台拥有可视化界面、灵活操作、好维护等众多优势特点,可以借助低代码技术平台、开源可视化报表设计器…

H5扫描二维码相关实现

H5 Web网页实现扫一扫识别解析二维码,就现在方法的npm包就能实现,在这个过程中使用过html5-qrcode 和 vue3-qr-reader。 1、html5-qrcode的使用 感觉html5-qrcode有点小坑,在使用的时候识别不成功还总是进入到错误回调中出现类似NotFoundExc…

用Prometheus全面监控MySQL服务:一篇文章搞定

简介 在现代应用中,MySQL数据库的性能和稳定性对业务至关重要。有效的监控可以帮助预防问题并优化性能。Prometheus作为一款强大的开源监控系统,结合Grafana的可视化能力,可以提供全面的MySQL监控方案。 设置Prometheus 安装Prometheus 使…

JVM学习-方法区(元空间)

运行时数据区结构图 从线程共享与否角度来看 栈、堆、方法区的交互关系 方法区 《Java虚拟机规范》中明确说明:“尽管所有的方法区在逻辑上属于堆的一部分,但一些简单的实现可能不会选择去进行垃圾收集或者进行压缩”,但对于HotSpotJVM而…

Qt 概述

Qt 背景介绍 什么是 Qt Qt 是⼀个 跨平台的 C 图形⽤⼾界⾯应⽤程序框架 。它为应⽤程序开发者提供了建⽴艺术级图形界⾯所需的所有功能。它是完全⾯向对象的,很容易扩展。Qt 为开发者提供了⼀种基于组件的开发模式,开发者可以通过简单的拖拽和组合来实…

绘唐3模型怎么放本地sd安装及模型放置位置 及云端sd部署

绘唐3模型怎么放本地sd安装及模型放置位置 及云端sd部署 资料里面授权方式: https://qvfbz6lhqnd.feishu.cn/wiki/CcaewIWnSiAFgokOwLycwi0Encf 云端和模型之间存在某种关联性。云端通常用于存储和管理大量数据,并提供计算和资源的服务。模型是对数据进…

Shell字符串变量

目标 能够使用字符串的3种方式 掌握Shell字符串拼接 掌握shell字符串截取的常用格式 能够定义Shell索引数组和关联数组 能够使用内置命令alias,echo,read,exit,declare操作 掌握Shell的运算符操作 Shell字符串变量 介绍 字符串(String)就是一系…