1.数据库基础知识
关系型数据库是什么?
关系型数据库是基于关系模型的数据库,使用表格来存储数据,表格之间可以通过键建立关系。
数据库的ACID特性是什么?
原子性(Atomicity):事务要么全部完成,要么全部不完成。
一致性(Consistency):事务完成后,数据库处于一致的状态。
隔离性(Isolation):事务在隔离的环境中进行,互不影响。
持久性(Durability):事务完成后的数据变化是持久的,即使系统崩溃也不会丢失。
数据库的范式是什么?
范式是规范化数据库的设计规则,常见的有第一范式(1NF)、第二范式(2NF)、第三范式(3NF)和BC范式(BCNF)。规范化有助于减少数据冗余和依赖异常。
2.MySQL核心概念
MySQL的默认存储引擎是什么?
默认存储引擎是InnoDB,支持事务和外键约束。
锁机制
什么是数据库锁?为什么需要锁? 数据库锁用于控制并发访问,防止多个事务同时修改同一数据,确保数据一致性。锁机制避免了脏读、不可重复读和幻读等问题。
MySQL中的锁类型有哪些?
共享锁(S锁):允许读操作,阻止写操作。
排他锁(X锁):允许写操作,阻止读和写操作。
行锁和表锁的区别?
行锁:锁定具体行,粒度小,适合高并发,资源消耗大。
表锁:锁定整个表,粒度大,资源消耗小,适用于OLAP。
MyISAM和InnoDB的区别差异?
InnoDB:支持事务和外键,锁粒度细(行锁),适合高并发写操作。
MyISAM:不支持事务和外键,锁粒度粗(表锁),适合高并发读操作。
索引如何提高查询速度? 索引允许快速查找数据,避免全表扫描,减少IO和CPU开销。
什么是索引?
索引是数据库中用于加快查询速度的数据结构。
MySQL常见索引类型?
B-Tree索引
适用场景:适用于范围查询、排序和分组操作。例如,当查询条件使用WHERE id > 100,或使用ORDER BY和GROUP BY时,B-Tree索引能显著提高效率。
特点:支持范围查询,是MySQL中最常用的索引类型。
哈希索引
适用场景:适用于快速等值查找,例如WHERE id = 5。在内存中的查找或特定应用中效果显著。
特点:仅支持等值查询,不支持范围查询,且在某些存储引擎中使用有限。
前缀索引
适用场景:适用于长字段的等值或范围查询,如长字符串字段。通过减少索引大小提高查询速度。
特点:需谨慎选择前缀长度,避免冲突过多影响性能。
联合索引
适用场景:适用于多字段查询或排序,如同时使用两个字段作为条件。
特点:提高复合查询效率,避免回表查询。
覆盖索引
适用场景:查询结果仅需索引中的部分字段,如SELECT id FROM table WHERE name = ‘Alice’。
特点:直接从索引获取数据,节省I/O,提升性能。
全文索引
适用场景:适用于全文检索,如搜索引擎、博客、论坛中的文本搜索。
特点:支持复杂的文本查询,需选择合适的存储引擎。
覆盖索引的优势?
查询所有列在索引中,避免访问表数据,提升性能。
索引设计原则?
高选择性。
避免过多索引。
注意顺序。
使用联合索引。
索引最优选择?
根据查询条件、选择性和覆盖性选择。
覆盖索引的优势? 查询所有列在索引中,避免访问表数据,提升性能。
3. SQL优化
如何优化一条慢查询语句?
检查执行计划(EXPLAIN)。
确保索引被正确使用。
避免全表扫描。
优化JOIN操作,尽量使用等值连接。
避免在WHERE子句中使用函数或类型转换。
分页优化,使用limit和offset。
什么是慢查询日志?如何启用?
慢查询日志记录执行时间超过指定阈值的查询。启用方法是配置slow_query_log=1和long_query_time=阈值。
如何避免全表扫描?
确保查询条件上有索引。
避免在WHERE子句中使用=以外的运算符(如<, >, !=)。
避免使用SELECT *,只选择需要的列。
4. 数据库设计
如何设计一个高并发的数据库?
选择合适的存储引擎(如InnoDB)。
使用读写分离和分库分表。
优化索引和查询语句。
配置合适的缓冲区和缓存(如InnoDB Buffer Pool)。
使用连接池管理数据库连接。
什么是水平扩展和垂直扩展?
垂直扩展:通过升级硬件(如增加内存、CPU)来提升性能。
水平扩展:通过增加服务器数量来分担负载(如分库分表)。
如何设计一个高可用的数据库架构?
主从复制(Master-Slave):实现读写分离和数据冗余。
主主复制(Master-Master):实现高可用性和负载均衡。
使用数据库集群(如Galera Cluster)。
配置自动故障转移(如使用Keepalived或HAProxy)。
5.事务与锁
什么是事务?事务的隔离级别有哪些?
事务是数据库中一系列的数据库操作,这些操作要么全部完成,要么全部不完成。常见的隔离级别有:
读未提交(Read Uncommitted)
读已提交(Read Committed)
可重复读(Repeatable Read)
串行化(Serializable)
什么是死锁?如何避免?
死锁是指两个或多个事务互相等待对方释放锁,导致都无法继续执行。避免方法包括:
使用一致的锁顺序。
使用较短的事务。
隔离级别选择合适的级别。
使用锁超时机制。
什么是MVCC?
MVCC(多版本并发控制)是一种机制,用于在支持多版本的数据库中实现高并发。InnoDB使用MVCC来实现可重复读隔离级别。
乐观锁与悲观锁的区别?
乐观锁:假设数据不被修改,通过版本号或时间戳检测冲突。
悲观锁:假设数据会被修改,直接加锁。
MySQL默认隔离级别?
可重复读(InnoDB默认)。
脏读、不可重复读、幻读?
脏读:读未提交数据。
不可重复读:同一事务多次读结果不同。
幻读:同一事务内新数据被读取。
解决幻读的方法?
使用可重复读或串行化隔离级别,或使用一致性非锁定读。
6.性能监控与调优
如何监控MySQL的性能?
使用SHOW STATUS和SHOW PROCESSLIST命令。
使用性能模式(Performance Schema)。
使用第三方工具(如Percona Monitoring and Management)。
如何调优MySQL配置?
调整缓冲区大小(如InnoDB Buffer Pool)。
配置合适的线程池大小。
优化日志配置(如binlog和slowlog)。
配置合适的连接数和超时时间。
优化慢查询?
分析查询、添加索引、优化SQL、减少全表扫描。
索引失效原因?
数据类型不匹配、函数运算符、范围查询。
优化表结构?
选择合适类型、平衡归一化、避免大数据类型。
MySQL主从复制?
主库写,从库复制并应用日志,用于读写分离和高可用。
主从复制原理?
主库记录二进制日志,从库通过I/O线程读取并SQL线程执行。
处理复制延迟?
优化主库性能,调整复制线程,分区表,分库分表。
主从复制常见问题?
延迟、主键冲突、数据不一致、网络问题。
监控复制状态?
使用SHOW SLAVE STATUS,检查线程状态和延迟。
7.高级主题
什么是分区表?如何分区?
分区表是将表的数据分成不同的物理存储段,每个段称为一个分区。常见的分区方式有范围分区、列表分区、哈希分区和键分区。
什么是存储过程和函数?
存储过程是一组预编译的SQL语句,可以在数据库中存储并重复执行。函数是可以在SELECT语句中使用的存储过程。
什么是触发器?
触发器是响应数据库事件(如插入、更新、删除)而自动执行的数据库对象。
提高高可用性?
主从复制、负载均衡、HAProxy、Galera Cluster。
处理高并发性能?
优化查询、索引、连接池、读写分离、分库分表。
水平扩展与垂直扩展?
水平扩展:增加节点。
垂直扩展:升级硬件。
高并发系统设计?
缓存、分库分表、负载均衡、异步处理。
处理热点问题?
避免热点、分布式锁、缓存热点数据、分片。
8.实际问题
如何处理数据库的慢查询?
分析慢查询日志。
检查索引是否被正确使用。
优化查询语句。
考虑分库分表或读写分离。
调整数据库配置。
如何处理数据库的备份和恢复?
使用mysqldump进行逻辑备份。
使用物理备份工具(如Percona XtraBackup)。
配置二进制日志(binlog)用于点恢复。
定期测试备份的恢复过程。
如何处理数据库的主从复制延迟?
检查网络延迟。
优化主库的性能。
增加从库的数量或分库分表。
使用并行复制(如启用多线程复制)。
9.面试常见问题
你最擅长的MySQL优化技巧是什么?
我擅长通过分析执行计划和慢查询日志,优化索引和查询语句,同时调整数据库配置以提升性能。
如何处理数据库的高并发问题?
我会通过读写分离、分库分表、优化索引和查询语句,以及配置合适的缓冲区和缓存来处理高并发问题。
你遇到过哪些比较棘手的数据库问题?如何解决的?
曾经遇到过一个高并发场景下的死锁问题,通过分析锁等待链路,调整事务的锁顺序和隔离级别,最终解决了问题。