Mysql基础篇

1 数据库的三大范式

第一范式:强调的是列的原子性,即数据库表的每一列都是不可分割的原子数据项。

第二范式:在第一范式的基础上,消除非主属性对主属性的部分函数依赖。要求实体的非主键完全依赖于主键。所谓完全依赖是指不能存在仅依赖主键一部分的属性。

第三范式:在第二范式的基础上,任何非主键不依赖于其它非主键。非主属性必须直接依赖于主属性,不能间接依赖主属性。

2、SQL语句主要分为哪几类?

数据定义语言DDL (Data Ddefinition Language) CREATE,DROP,ALTER,主要为以上操作即对逻辑结构等有操作的,其中包括表结构,视图和索引。

数据查询语言DQL(Data Query Language) SELECT,这个较为好理解,即查询操作,以select关键字,各种简单查询,连接查询等,都属于DQL。

数据操纵语言DML (Data Manipulation Language)INSERT,UPDATE,DELETE主要为以上操作,即对数据进行操作的,DQL与DML共同构建了常用的增删改查操作。

数据控制功能DCL(Data Control Language)GRANT,REVOKE,COMMIT,ROLLBACK主要为以上操作即对数据库安全性完整性等有操作的,可以简单的理解为权限控制等。

3 MySQL存储引擎 to memory

MySQL支持多种存储引擎,比如InnoDB、MyISAM、Memory、 Archive等等.在大多数的情况下,直接选择使用InnoDB引擎都是最合适的,InnoDB也是 MySQL的默认存储引擎。

MyISAM和InnoDB的区别有哪些:

  • InnoDB支持事务,MyISAM不支持。

  • InnoDB支持外键,MyISAM不支持。

  • InnoDB是聚集索引,数据文件是和索引绑在一起的,必须要有主键,通过主键索引效率很高;MyISAM是非聚集索引,数据文件是分离的,索引保存的是数据文件的指针,主键索引和辅助索引是独立的。

  • InnoDB不支持全文索引,而MyISAM支持全文索引,查询效率上MyISAM要高。

  • InnoDB不保存表的具体行数,MyISAM 用一个变量保存了整个表的行数。

  • InnoDB支持行级锁(row-level locking)和表级锁,默认为行级锁;MyISAM采用表级锁(table-level locking)。

4 SQL约束

NOT NULL:用于控制字段的内容一定不能为空(NULL)。

UNIQUE:控件字段内容不能重复,一个表允许有多个Unique 约束。

PRIMARY KEY:也是用于控件字段内容不能重复,但它在一个表只允许出现一个。

FOREIGN KEY:用于预防破坏表之间连接的动作,也能防止非法数据插入外键列,因为它必须是它指向的那个表中的值之一。

5 主键和外键

主键:表中经常有一个列或多列的组合,其值能唯一地标识表中的每一行,这样的一列或多列称为表的主键,通过它可强制表的实体完整性。一个表只能有一个 PRIMARY KEY约束,而且PRIMARY KEY约束中的列不能接受空值。

外键:在一个表中存在的另一个表的主键称此表的外键。

6 char和varchar的区别

char:定长,存取效率高,一般用于固定长度的表单提交数据存储,例如:身份证号,手机号,电话,密码等,长度不够的时候,会采取右补空格的方式。

varchar:不定长,更节省空间,需要用一个或者两个字节来存储数据的长度。具体规则是:如果列的最大长度小于或等于255字节,则只使用1个字节表示,否则使用2个字节。

在内存中的操作方式,varchar也是按最长的方式在内存中进行操作的。比如:进行排序的时候,varchar(100)是按100这个长度来进行的。

varchar由于行是变长的,在UPDATE时可能使行变得比原来更长,会导致分裂页和产生碎片。

7 IN 和 Exists 用法及区别

7.1 基本用法

IN:后面的子查询 是返回结果集的,换句话说执行次序和Exists()不一样.子查询先产生结果集,然后主查询再去结果集里去找符合要求的字段列表去.符合要求的输出,反之则不输出.

Exists:后面的子查询被称做相关子查询, 他是不返回列表的值的.只是返回一个true或false的结果(这也是为什么子查询里是 "select 1 "的原因,当然也可以select任何东西) 其运行方式是先运行主查询一次。再去子查询里查询与其对应的结果,如果是true则输出,反之则不输出.再根据主查询中的每一行去子查询里去查询。

7.2 运行过程

Exists执行顺序如下:   1.首先执行一次外部查询   2.对于外部查询中的每一行分别执行一次子查询,而且每次执行子查询时都会引用外部查询中当前行的值。   3.使用子查询的结果来确定外部查询的结果集。(如果外部查询返回100行,SQL 就将执行101次查询,一次执行外部查询,然后为外部查询返回的每一行执行一次子查询。但实际上,SQL的查询 优化器有可能会找到一种更好的方法来执行相关子查询,而不需要实际执行101次查询。)

IN的执行过程如下:

1.首先运行子查询,获取子结果集

2.主查询再去结果集里去找符合要求的字段列表,.符合要求的输出,反之则不输出。

7.3 区别

7.3.1 IN和Exists

IN是把外表和内表作hash 连接,而Exists是对外表作loop循环,每次loop循环再对内表进行查询。一直以来认为Exists比IN效率高的说法是不准确的。 如果查询的两个表大小相当,那么用IN和Exists差别不大。如果两个表中一个较小,一个是大表,则子查询表大的用Exists,子查询表小的用IN: 例如:表A(小表),表B(大表):   select * from A where cc in (select cc from B) 效率低,用到了A表上cc列的索引;   select * from A where exists(select cc from B where cc= A .cc) 效率高,用到了B表上cc列的索引。 相反的:   select * from B where cc in (select cc from A) 效率高,用到了B表上cc列的索引;   select * from B where exists(select cc from A where cc=B .cc) 效率低,用到了A表上cc列的索引。

7.3.2 not IN 和not Exists

  not IN 和not Exists如果查询语句使用了not in 那么内外表都进行全表扫描,没有用到索引;而not extsts 的子查询依然能用到表上的索引。所以无论那个表大,用not Exists都比not IN要快。

7.3.3 in 与 = 的区别

  select name from student where name in (‘A’,‘S’,‘D’,‘F’); 与   select name from student where name=‘A’ or name=‘S’ or name=‘D’ or name=‘F’ 的结果是相同的。

8 drop delete truncate的区别

9 InnoDB存储原理

页(page): (16k)最小io单元;

区(regoin): (1m)64个页,大小刚好为1MB,存储引擎空间申请的最小单位;

段(segment): 每个段有32个碎片页,段中的空间首先保存在这32个页中,超出容量后再以区的方式申请空间,段的这种页和区混合管理的方式,是出于对存储空间尽量节约的角度考虑;

表空间(table space):存储引擎逻辑结构最高层,由各个段组成,数据段,索引段,回滚段;碎片页从碎片区中申请,碎片区不属于任何段,碎片区直属于表空间。

10 InnoDB存储引擎的内存结构由4部分组成

从MSQL5.5版本开始,默认使用的就是InnoDB存储引擎,它擅长处理事务,具有自动崩溃恢复的特性,使用非常广泛。

  • Buffer Pool:缓冲池,作用就是用来缓存表数据和索引数据,减少磁盘IO操作,提升效率。

  • Change Buffer:写缓冲区,是针对二级索引页(辅助索引)的更新优化措施。

  • Log Buffer: 日志缓冲区,用来缓存写入磁盘上log文件(Redo、Undo)的数据,日志缓冲区的内容会定期的刷新到磁盘Log文件中。主要作用是:用来优化每次更新操作之后都要写入redo log产生的磁盘IO的。

  • Adaptive Hash Index:自适应Hash索引。InnoDB不支持手动创建哈希索引的,但是InnoDB会进行自调优,如果判断建立自适应哈希索引能够提升查询效率,InnoDB就会在自己的内存中创建相关的Hash索引。自适应指的是不需要人工手动干预,InnoDB会根据自己的需求去创建自适应Hash索引。

11 Mysql页的读取

物理读取:将磁盘中的页读取到缓冲池中。

逻辑读取:从缓冲池中读取指定的页,若逻辑读取的页不在缓冲池中,则首先通过物理读取将磁盘中的页加载到缓冲池中。

随机预读:判断某个区域内的页是否为热点数据,若满足条件则认为该区域内的页都可能需要被访问,提前进行读取操作,因其实顺序读取,可提高数据库读取性能。区域默认32个页,阈值默认为9,即32个页中的9个页为热点数据,根据LRU position来判断。

线性预读:访问的页是区域边界(32个页的第一个或最后一个)且第一次被访问,且该32个页中的12个页都已经被顺序地访问,则触发线性预读,顺序地读取之后或之前的32个页。

12 replace into和insert on duplicate key update的区别

在项目中,我们经常会遇到当数据库存在某条记录时,则更新数据,若不存在则插入数据的情况。

replace into和on duplcate key update都是只有在primary key或者unique key冲突的时候才会执行"更新操作”。

如果数据存在,replace into则会将原有数据删除,再进行插入操作,这样就会有一种情况,如果某些字段有默认值,但是replace into语句的字段不完整,则会设置成默认值,主键id会变更。

而on duplicate key update则是执行update后面的语句。

13 UNION ALL和UNION的区别

返回结果

union all是直接连接,取到得是所有值,记录可能有重复;

union是取唯一值,记录没有重复。

排序

union将会按照字段的顺序进行全量排序;所谓全量排序即先按照第一个字段排序,然后按照第二个字段排序,依次类推。

union all只是简单的将两个结果合并后就返回。

效率

从效率上说,union all 要比union快很多,所以,如果可以确认合并的两个结果集中不包含重复数据且不需要排序时的话,那么就使用union all。

14 主键使用自增ID还是UUID

推荐使用自增ID,不要使用UUID。

因为在InnoDB存储引擎中,主键索引是作为聚簇索引存在的,主键索引的B+树叶子节点上存储了主键索引以及全部的数据(按照顺序),在插入过程中尽量减少页分裂,即使要进行页分裂,也只会分裂很少一部分。并且能减少数据的移动,每次插入都是插入到最后。总之就是减少分裂和移动的频率。

如果是UUID,由于到来的ID与原来的大小不确定,会造成非常多的数据插入,数据移动,然后导致产生很多的内存碎片,进而造成插入性能的下降。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/574335.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux进程间通讯

文章目录 Linux进程间通讯1、进程间通信介绍1.1、进程间通信目的1.2、进程间通信发展1.3、进程间通信分类 2、管道2.1、什么是管道2.2、匿名管道2.2.1、标准输入stdin和标准输出stdout通信2.2.2、父子进程通信2.2.3、父子进程通信现象2.2.4、父子进程通信特性2.2.5、进程池 2.3…

【window环境、Linux环境、QT三种方法实现TCP通信】

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、Windows环境下实现TCP通信1.服务器2.客户端3.运行 二、Linux环境下实现TCP通信1.服务端2.客户端 三、Qt实现TCP通信1.服务端1.客户端 总结 前言 大多数项目…

RAG文本解析工具open-parse

简介 对于RAG来说,将文本有效的分块(chucking)是很重要的一件事,open-parse是一个用来分块pdf的开源工具,它主要基于视觉驱动(Visually-Driven)的方式来将文档分块,也就是说它不仅仅是按照段落或者字数来对文档分块,而…

easyx 按键信息

前言 看看代码吧 ExMessage msg { 0 }; bool button(int x, int y, int w, int h, const char* text) {//绘制按钮setfillcolor(RGB(230, 231, 232));fillroundrect(x, y, x w, y h, 5, 5);if ((msg.x > x && msg.x<x w && msg.y>y && …

为什么要分库分表?(设计高并发系统的时候,数据库层面该如何设计?)

目录 1.分表 2.分库 说白了&#xff0c;分库分表是两回事儿&#xff0c;大家可别搞混了&#xff0c;可能是光分库不分表&#xff0c;也可能是光分表不分库&#xff0c;都有可能。 我先给大家抛出来一个场景。 假如我们现在是一个小创业公司(或者是一个 BAT …

java反序列化之URLDNS链学习

一、前言 近来学习java反序列化&#xff0c;听p神所说这个URLDNS利用链比较好理解&#xff0c;故决定由此进入学习的第一篇。 URLDNS是Java反序列化中比较简单的一个链&#xff0c;由于URLDNS不需要依赖第三方的包&#xff0c;同时不限制jdk的版本&#xff0c;所以通常用于检…

hertzbeat 源码阅读记录

关于自定义标签的说明 EmailValid.java HostValid PhoneNumValid 枚举值说明&#xff1a;

【OpenGL实践08】现代渲染管线在GLUT和Pygame和Qt.QOpenGLWidget上各自的实现代码

Qt.QOpenGLWidget进行现代渲染管线实验效果 一、说明 据说QOpenGLWidget是用来取代QGLWidget的继承者&#xff0c;我们试图将GLUT上的旧代码改成QOpenGLWidget&#xff0c;本以为差别不大&#xff0c;轻易搞定&#xff0c;经实践发现要付出极大努力才能完成。经多次实验发现G…

Java面试八股之Java中为什么没有全局变量

Java中为什么没有全局变量 Java中没有传统意义上的全局变量&#xff0c;这是因为Java语言设计遵循面向对象的原则&#xff0c;强调封装性和模块化&#xff0c;以及避免全局状态带来的副作用。 封装性&#xff1a; 全局变量违反了面向对象编程中的封装原则&#xff0c;即隐藏对…

【ZYNQ】zynq启动模式及程序固化

一、前言 由于zynq含有arm cpu ,其启动模式由ps主导&#xff0c;与纯逻辑的fpga不相同&#xff0c;此处做一个记录。 二、zynq启动模式 关于zynq的启动模式详细内容可以参考官方文档&#xff1a;ug585-Zynq 7000 SoC Technical Reference Manual&#xff0c;第六章。 2.1 启…

帮助中心系统搭建不再是难题,这几个工具来帮你

在面临客户服务挑战时&#xff0c;有效的帮助中心系统是提升用户满意度和解决问题效率的关键。幸运的是&#xff0c;搭建一个功能全面的帮助中心不再是什么难事。下面&#xff0c;我要为你介绍三款能够帮忙打造帮助中心的超实用工具&#xff0c;让你的客户支持体验迅速升级。 1…

网页使用之如何返回json/xml

后端返回json数据给前端进行渲染的方式比较熟悉&#xff0c;至于返回html页面&#xff0c;返回xml的方式接触逐渐减少&#xff0c;来在项目中熟悉这一点。 返回文本数据 json姿势的返回实属最简单的方式&#xff0c;在SpringBoot应用中&#xff0c;有两种简单的方式 1.直接在…

S32K的JLINK与PE接线方法与刷程序失败问题

S32K的JLINK与PE接线方法与刷程序失败问题 1、PE的接线方法2、JLINK的接线方法3、刷程序失败问题 1、PE的接线方法 2、JLINK的接线方法 3、刷程序失败问题 出现如下问题&#xff1a; Secure Debug might be enabled on this device.lf so.please unlock the device via PEmic…

一段音频驱动照片唱歌,EMO模型上线通义APP

把一段音频、一张照片输入AI模型&#xff0c;就能让图中人物开口唱歌说话&#xff0c;让奥黛丽赫本唱《上春山》、陶俑仕女说英文RAP、爱因斯坦说中文段子。不久前&#xff0c;这款名为EMO的模型因为阿里通义实验室的一篇论文火遍海内外&#xff0c;模型的产品化进程也广受关注…

运动耳机哪个牌子性价比高?推荐五款高性价比运动耳机

跑步、健身、游泳……无论你的运动喜好是什么&#xff0c;一款好的运动蓝牙耳机都能为你的运动体验加分。然而&#xff0c;市面上的运动蓝牙耳机品牌众多&#xff0c;如何选择一款既舒适又实用的产品呢&#xff1f;本文将为你提供一些选购运动蓝牙耳机建议&#xff0c;并为你推…

企业规模扩大,SD-WAN实现跨省快速组网

随着数字化时代的飞速发展&#xff0c;企业面临着前所未有的挑战与机遇。5G、VoIP、AI和物联网等新技术的兴起&#xff0c;不仅改变了商业格局&#xff0c;也对企业网络提出了更高的要求。随着企业规模的不断扩大&#xff0c;企业如何搭建跨省的、高性能、超融合、简化运维的组…

解决Jmeter 4.x 请求到elasticsearch 中文乱码的问题

文章目录 前言解决Jmeter 4.x 请求到elasticsearch 中文乱码的问题 前言 如果您觉得有用的话&#xff0c;记得给博主点个赞&#xff0c;评论&#xff0c;收藏一键三连啊&#xff0c;写作不易啊^ _ ^。   而且听说点赞的人每天的运气都不会太差&#xff0c;实在白嫖的话&#…

MOS产品在光伏逆变器上的应用与数据分析

2023年全球光伏装机量表现优异&#xff0c;根据BloombergNEF统计数据&#xff0c;2023年全球光伏新增装机量444GW&#xff0c;同比增长76.2%&#xff0c;其中约一半新增装机量来自中国。 中国光伏新技术迭代不断&#xff0c;产业链降本增效加速。根据CPIA数据&#xff0c;2022年…

Linux网络-DNS域名解析服务

目录 一.DNS相关介绍 1.DNS是什么 2.DNS系统的分布式数据结构 根域 顶级域 二级域 子域 主机 3.服务器类型 主域名服务器 从域名服务器 缓存域名服务器 转发域名服务器 二.DNS域名解析 1.DNS域名解析方式及功能 2.DNS域名解析查询方式 2.1.递归查询&#xff0…

【LLM多模态】Qwen-VL模型结构和训练流程

note 观点&#xff1a;现有很多多模态大模型是基于预训练&#xff08;和SFT对齐&#xff09;的语言模型&#xff0c;将视觉特征token化并对齐到语言空间中&#xff0c;利用语言模型得到多模态LLM的输出。如何设计更好的图像tokenizer以及定位语言模型在多模态LLM中的作用很重要…