秋招Java后端开发冲刺——非关系型数据库篇(Redis)

在这里插入图片描述

一、非关系型数据库

1. 主要针对的是键值、文档以及图形类型数据存储。
2. 特点

特点说明
灵活的数据模型支持多种数据模型(文档、键值、列族、图),无需预定义固定的表结构,能够处理各种类型的数据。
高扩展性设计为水平扩展,能够轻松地通过增加更多节点来处理大量的数据和高并发请求。
高性能通过优化特定类型的查询和数据操作,通常比关系型数据库在大规模数据处理时表现更好。
分布式架构天生支持分布式存储和计算,能够跨多个节点和数据中心实现数据的分布和冗余。
弱一致性为了提高性能和可用性,通常采用最终一致性模型,而不是关系型数据库的强一致性模型。
灵活的事务支持事务支持通常较为灵活,有些NoSQL数据库提供有限的事务支持,有些则支持ACID事务。
易于使用简单的API接口和查询语言,使开发者能够快速上手和使用。
丰富的类型支持能够存储和处理多种数据类型,包括JSON、XML、二进制数据等。
高可用性通过数据复制和分区,实现高可用性和数据冗余,保证系统在部分节点失效时仍能正常运行。
适应多种应用场景特别适合于大数据分析、实时应用、社交网络、物联网等需要处理大量非结构化数据的场景。

3. 代表:HBase、Cassandra、MongoDB、Redis

二、Redis

Redis是一个基于 C 语言开发的开源 NoSQL 数据库,使用key-value键值对存储数据,且由于其数据存储在内存中,速度很快,在开发中使用广泛。

(一)数据类型

1. 五种基础数据类型
五种基础数据类型包括:String(字符串)、List(列表)、Set(集合)、Hash(散列)、Zset(有序集合)

  • String:是一种二进制安全的数据类型,常用于缓存 Session、Token、图片地址、序列化后的对象,用户单位时间的请求数(简单限流可以用到)、页面单位时间的访问数
  • List:使用一个双向链表实现,常用于实现最新文章、最新动态、消息队列
  • Hash:是一个 String 类型的 field-value(键值对) 的映射表,内部实现:数组 + 链表,常用于存储对象
  • Set:是一种无序集合,实现了求交集、并集、差集等操作,常用于网站 UV 统计、文章点赞、动态点赞等场景;共同好友(交集)、共同粉丝(交集)、共同关注(交集)、好友推荐(差集)、音乐推荐(差集)、订阅号推荐(差集+交集) 等场景;抽奖系统、随机点名等场景
  • Sorted Set:增加了一个权重参数 score,底层使用跳表实现,使得集合中的元素能够按 score 进行有序排列,常用于各种排行榜,优先级任务队列

2. 三种特殊数据类型
包括:HyperLogLog(基数统计)、Bitmap (位图)、Geospatial (地理位置)

  • Bitmap:存储的是连续的二进制数字(0 和 1),常用于用户签到情况、活跃用户情况、用户行为统计(比如是否点赞过某个视频)。
  • HyperLogLog:是一种有名的基数计数概率算法,常用于数据量巨大的统计场景:热门网站每日/每周/每月访问 ip 数统计、热门帖子 uv 统计等
  • Geospatial index(地理空间索引,简称 GEO):基于 Sorted Set 实现,主要用于存储地理位置信息。

3. 其他数据类型
包括: Bloom filter(布隆过滤器)、Bitfield(位域)

  • Bloom filter(布隆过滤器):由一个初始值为零的bit数组和多个哈希函数构成,用来快速判断集合中是否存在某个元素,常用于解决缓存穿透问题
  • Bitfield(位域):是一种对Redis中的字符串类型进行扩展的数据类型,用于对字符串中任意偏移进行修改等操作。
(二)应用

在这里插入图片描述

(三)常见面试问题

1. 为什么快

  • Redis 基于内存存储数据,内存的访问速度比磁盘快很多
  • Redis 基于 Reactor 模式设计开发了一套高效的事件处理模型,使用IO多路复用+事件派发来处理多个socket
  • Redis是单线程的,避免线程间的切换(Redis6.0之后命令回复处理器、命令请求处理器使用了多线程,命令执行还是使用的单线程)
  • Redis 内置了多种优化过后的数据类型/结构实现,性能非常高
  • Redis 通信协议实现简单且解析高效

2. 缓存读写策略
(1)Cache Aside Pattern(旁路缓存模式)

  • 读数据:从 cache 中读取数据,读取到就直接返回;否则从 db 中读取数据返回,再把数据放到 cache 中
  • 写数据:先更新db,再删除缓存
    (2)Read/Write Through Pattern(读写穿透)(以cache服务器为主)
  • 读数据:从 cache 中读取数据,读取到就直接返回 ;否则先从 db 加载,写入到 cache 后返回响应
  • 写数据:先查 cache,cache 中不存在,直接更新 db;cache 中存在,则先更新 cache,然后 cache 服务自己更新 db
    (3)Write Behind Pattern(异步缓存写入)
  • 只同步更新缓存,不直接更新 db,而是改为异步批量的方式来更新 db
  • db 的写性能非常高,非常适合一些数据经常变化又对数据一致性要求没那么高的场景,比如浏览量、点赞量

3. key过期删除策略

  • 惰性删除:使用时才检查删除(内存消耗大)
  • 定期删除:周期性地随机从设置了过期时间的 key 中抽查一批,然后逐个检查这些 key 是否过期,过期就删除 key(周期时间确定较难)
  • 延迟队列:把设置过期时间的 key 放到一个延迟队列里,到期之后就删除 key(需要额外的资源维护队列)
  • 定时删除:每个设置了过期时间的 key 都会在设置的时间到达时立即被删除(每个key都要维护一个定时器,资源消耗大)
    :Redis采用惰性+定期删除的方式

4. Redis 的内存淘汰策略(内存不足时触发)

  • volatile-lru(least recently used):从已设置过期时间的数据集中挑选最近最少使用的数据淘汰。
  • volatile-ttl:从已设置过期时间的数据集中挑选将要过期的数据淘汰
  • volatile-random:从已设置过期时间的数据集中任意选择数据淘汰。
  • volatile-lfu(least frequently used):从已设置过期时间的数据集中挑选最不经常使用的数据淘汰
  • allkeys-lru(least recently used):从数据集中移除最近最少使用的数据
  • allkeys-random:从数据集中任意选择数据淘汰。
  • allkeys-lfu(least frequently used):从数据集中移除最不经常使用的数据淘汰
  • no-eviction(默认内存淘汰策略):不淘汰数据,当内存不足以容纳新写入数据时,新写入操作会报错

5. 生产问题(缓存三兄弟)
(1)缓存穿透

  • 请求的 key 不存在于缓存中,会导致大量查询请求直接到了数据库,导致数据库崩溃
  • 解决方式
    ① 缓存无效值(内存不友好)
    ② 布隆过滤器(使用一个较大的 bit 数组来保存所有可能请求的key的哈希值,每次请求时计算key对应的哈希值,如果哈希值对应的位置为true才去缓存中查找)
    (2)缓存击穿
  • 请求的key对应的是热点数据 ,但缓存中的那份数据已经过期,导致大量请求落在数据库上
  • 解决方法:
    ① 设置热点数据永不过期或者过期时间比较长(内存不友好)
    ② 提前预热(推荐):针对热点数据提前预热,将其存入缓存中并设置合理的过期时间比如秒杀场景下的数据在秒杀结束之前不过期
    ③ 加锁:在缓存失效后,通过设置互斥锁确保只有一个请求去查询数据库并更新缓存
    (3)缓存雪崩
  • 缓存中的key在同一时间大量失效,导致大量的请求都直接落到了数据库上,对数据库造成了巨大的压力/Redis服务器宕机
  • 解决方式:
    ① key设置随机失效时间
    ② 提前预热
    ③ 多级缓存:设置多级缓存,例如本地缓存+Redis 缓存的二级缓存组合
    ④ Redis 集群:采用 Redis 集群,避免单机出现问题整个缓存服务都没办法使用

6. Redis集群
(1)主从复制

  • 主节点写,多个从节点读
  • 主从数据同步原理
    ① 全量同步:初始同步都采用全量同步
    ② 增量同步:一般是slave重启或者后期数据变化
  • 实现高并发
    (2)哨兵模式
  • 使用哨兵检测集群中各个服务器的状态(心跳机制),并在主节点宕机后重新选择主节点
  • 哨兵选主规则:优先级、与主节点断开时间(小)、offset值(大)、id(小)
  • 可能会出现脑裂问题(网络问题导致),解决方法是:设置最少的从节点数量/缩短主从数据同步的延迟时间/达不到要求就拒绝请求
  • 实现高可用
    (3)分片集群
  • 多个master、多个slave,多个master之间通过ping检测彼此健康状态;客户端请求可以访问任意节点,最终会根据Redis中的路由转发到正确节点
  • 实现海量数据存储,以及高并发写

7. 持久化机制
(1)快照RDB

  • 通过创建快照来获得存储在内存里面的数据在某个时间点上的副本
  • 优点:
    ① RDB 文件存储的内容是经过压缩的二进制数据,文件很小,适合做数据的备份,灾难恢复
    ② 使用 RDB 文件恢复数据,直接解析还原数据即可,不需要一条一条地执行命令,速度非常快
  • 实现原理:bgsave命令开始时主进程会fork一个子进程,子进程复制主进程的页表,将对应的内存数据写入磁盘
  • 对数据丢失容忍度更高,追求启动速度
    (2)只追加文件AOF
  • 将每一条Redis执行命令写入到 AOF 缓冲区中,然后再写入到 AOF 文件中,最后根据持久化方式( fsync策略)的将系统内核缓存区的数据同步到硬盘中
  • 优点
    ① 实时性更好
    ② AOF 以一种易于理解和解析的格式包含所有操作的日志,可以直接进行操作和分析
  • 对数据的安全性、完整性要求更高
  • 持久化策略
    ① appendfsync always:主线程调用 write 执行写操作后,后台线程( aof_fsync 线程)立即会调用 fsync 函数同步 AOF 文件(刷盘),fsync 完成后线程返回
    ② appendfsync everysec:主线程调用 write 执行写操作后立即返回,由后台线程( aof_fsync 线程)每秒钟调用 fsync 函数(系统调用)同步一次 AOF 文件
    ③ appendfsync no:主线程调用 write 执行写操作后立即返回,让操作系统决定何时进行同步刷盘
  • AOF文件重写(当文件较大时):由一个子进程将数据库状态写入新的AOF文件中,重写期间,Redis 还会维护一个 AOF 重写缓冲区,该缓冲区会在子进程创建新 AOF 文件期间,记录服务器执行的所有写命令。当子进程完成创建新 AOF 文件的工作之后,服务器会将重写缓冲区中的所有内容追加到新 AOF 文件的末尾。
    :该操作不不需要对原有AOF文件进行任何的读取,写入,分析
    (3)混合方式
  • AOF 重写的时候就直接把 RDB 的内容写到 AOF 文件开头
  • 优点:可以结合 RDB 和 AOF 的优点, 快速加载同时避免丢失过多的数据
  • 缺点:AOF 里面的 RDB 部分是压缩格式不再是 AOF 格式,可读性较差

8. Redis实现延时
(1)Redis 过期事件监听

  • 原理:在pub/sub 模式下,监听 key 的过期事件 channel,就可以拿到过期的 key 的消息,进而实现了延时任务功能
  • 存在问题
    ① 时效性差,key过期后的删除是惰性删除+定期删除结合,而这个发布者是要在key删除时才发布消息到channel
    ② 丢消息:当没有订阅者时,消息会被直接丢弃,在 Redis 中不会存储该消息
    ③ 多服务实例下消息重复消费
    (2)Redisson 内置的延时队列
  • 原理:基于 Redis 的 SortedSet 来实现,将需要延迟执行的任务插入到 SortedSet 中,并给它们设置相应的过期时间作为分数,Redisson 使用 zrangebyscore 命令扫描 SortedSet 中过期的元素,然后将这些过期元素从 SortedSet 中移除,并将它们加入到就绪消息列表中

9. Redis实现分布式锁
(1)SETNX(SET if Not eXists)命令实现分布式锁
(2)使用Redisson实现的分布式锁

  • 基于lua脚本完成加锁、设置过期时间等操作,使用watch-dog给锁续期
  • 不能实现主从一致性,使用红锁可以,但性能极差

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/748529.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

8.计算机视觉—增广和迁移

目录 1.数据增广数据增强数据增强的操作代码实现2.微调 迁移学习 Transfer learning(重要的技术)网络结构微调:当目标数据集比源数据集小得多时,微调有助于提高模型的泛化能力。训练固定一些层总结代码实现1.数据增广 CES上的真实故事 有一家做智能售货机的公司,发现他们…

如何实现灌区闸门控制自动化?宏电“灌区哨兵”为灌区闸门控制添“智慧”动能

闸门控制站是节水灌溉工程中的重要组成部分。随着科技的不断进步和农田水利现代化的发展,传统的闸门控制和管理手段已经不能满足现代农业的发展要求。以宏电“灌区哨兵”为核心的闸门自动化控制系统,能有效解决灌区闸门距离远、数量多、不易操作、不好监…

Java操作Word文档

文章目录 Java操作Word文档引言1、技术选型结论 2、基础文本填充2.1 引入依赖2.1.1. poi2.1.2. poi-ooxml2.1.3. poi-ooxml-schemas 总结2.2 业务思路2.3 业务层 OfficeService2.4 通用工具类 OfficeUtils2.5 控制层 OfficeController 3、表格3.1 准备模板3.2 业务层 OfficeSer…

激光雷达数据处理与典型案例分析实践技术应用

激光雷达技术以其高精度、高效率的特点,已经成为地表特征获取、地形建模、环境监测等领域的重要工具。掌握激光雷达数据处理技能,不仅可以提升工作效率,还能够有效提高数据的质量和准确性,为决策提供可靠的数据支持。 随着激光雷…

烟火监测报警摄像机

当今社会,随着城市化进程的加快和人们生活水平的提高,烟火监测报警摄像机作为一种新型智能安防设备,正逐步在各个领域得到广泛应用,其在保障公共安全和预防火灾中的作用日益凸显。烟火监测报警摄像机利用先进的视觉识别技术和智能…

电脑怎么更改网络ip地址?四招助你轻松搞定

在数字化时代的浪潮中,电脑已成为我们日常生活和工作中不可或缺的工具。然而,随着网络技术的飞速发展,网络安全问题也日益凸显。为了保护个人隐私和网络安全,我们有时需要更改电脑的IP地址。本文将详细介绍如何轻松更改电脑的网络…

[Ant Design Vue 树控件Tree]内存溢出报错

使用ant design vue控件时发现报错,但是数据展示时没有问题的; 具体报错信息:Maximum call stack size exceeded 经排查,是我的目录下数据过多,差不多有小一万的数据; 查看官方文档,使用虚拟滚…

win11 下载 Chromium 源码并编译

环境准备: win11操作系统 16G内存 100G硬盘 能够翻墙的代理 python 3.9.x 本文只是列举主要过程,具体细节自己去研究。 1.安装vs2022 自行百度下载安装,注意win11要安装2022,不要安装2019 2.下载安装depot_tools 自行百…

机器学习Python代码实战(二)分类算法:k-最近邻

一.k-最近邻算法步骤 1.选择适当的k值。它表示在预测新的数据点时要考虑的邻居数量。 2.计算距离。计算未知点与其他所有点之间的距离。常用的距离计算方法主要有欧氏距离,曼哈顿距离等。 3.选择邻居。在训练集中选择与要预测的数据点距离最近的k个邻居。 4.预测…

当大模型开始「考上」一本

参加 2024 河南高考,豆包和文心 4.0 过了一本线,但比 GPT-4o 还差点。 今天的大模型,智力水平到底如何? 2024 年高考陆续出分,我们想要解开这个过去一年普罗大众一直争论不休的话题。高考是衡量人类智力和学识水平的…

【数据建模】微分方程与动力系统

文章目录 微分方程与动力系统1. 微分方程的理论基础1.1 函数、导数与微分1.2 一阶线性微分方程的解1.3 二阶常系数线性微分方程的解 2. 使用python求解微分方程2.1 求解微分2.2 求解定积分2.2.1 quad函数求解2.2.2 梯型法则求解 3. 使用Scipy和Sympy解微分方程3.1 使用sympy求解…

记录一个80端口被占用导致软件打不开的问题

今天有个电脑,安装完我们的软件后,在浏览器上面打不开。但是我看虚拟机里面的配置啥的都很正常,我感觉不是软件挂了,应该是系统哪里的配置出了问题,导致软件打不开。 跟做软件的联系了,他让我直接访问虚拟机…

酷开系统丨开启家庭智能教育让学习成为一种乐趣

在数字化时代,孩子们接触的信息日益增多,而酷开系统洞察到了家长对孩子成长环境的关切。酷开系统,作为家庭娱乐与教育的融合平台,不仅注重提供丰富的教育资源,更致力于创造一个健康、有益的学习和娱乐环境。 在酷开系…

OPenFast软件中的NRELOffshrBsline5MW_Onshore_ServoDyn.dat文件详解

我先简单概括一下,后续我再详细总结:文件“NRELOffshrBsline5MW_Onshore_ServoDyn.dat”是用于NREL 5.0 MW基准风力发电机的ServoDyn模块的输入文件。它定义了仿真控制、变桨控制、发电机和扭矩控制、偏航控制以及输出设置等各种参数。以下是主要内容的总…

Uniapp的使用

为什么要使用uniapp uniapp 可以进行多端开发,uniapp 在设计的时候就拥有许多兼容性代码,可以兼容很多的平台 如 支付宝小程序 html页面 微信小程序等,注重开发效率而不是运行效率时 ,就可以考虑一下 uniapp 当然也可以去…

mysql窗口函数选择每个窗口的第一条数据

需求 假设我们有一个名为sales的表,我们想要按product分组,并为每个产品选择销售额最高的那一天 sales表 首先给每个产品按照销售量进行排名 SELECT product,sale_date,sales_amount,ROW_NUMBER() OVER (PARTITION BY product ORDER BY sales_amount …

Langchain-Chatchat 搭建知识库教程,老奶奶都能看懂的教程

本文将在 google 实验室中使用 Langchain-Chatchat 搭建一个知识库,还可以进行聊天等功能。 由于是在 google 实验室上面跑代码,所以本地电脑什么配置都无所谓! 效果图 运行起来后可以上传各种文档文件到知识库。 Langchain-Chatchat 是什…

sheng的学习笔记-hadoop,MapReduce,yarn,hdfs框架原理

目录 搭建hadoop 下载hadoop JAVA 下载bin windows 改环境变量 将winutils.exe和hadoop.dll放到C:\Windows\System32下,然后重启 修改配置 vim core-site.xml vim hdfs-site.xml hadoop-env.sh mapred-site.xml yarn-site.xml 格式化命令 启动集群 …

浅谈 MySQL 复制架构

Author:Arsen Date:2024/06/26 目录 前言一、参数设置1.1 slave_exec_mode1.2 max_allowed_packet1.3 binlog-do-db1.4 binlog-ignore-db1.5 replicate-ignore-db1.6 replicate-ignore-table1.7 replicate-wild-ignore-table1.8 slave_compressed_protoc…

【React】变量 useState

开发需要,随便学学react。上手第一天,感觉这个JS语法很怪,没有什么逻辑性,比较抽象。随便写写笔记。 跟着网上找的项目写写感觉这个项目还不错: 分享给码友 https://zh-hans.react.dev/learn/tutorial-tic-tac-toe 参…