- 相比于其他的内存/缓存数据库,redis可以
方便的实现持久化的功能
(保存至磁盘中)
一、关系数据库与非关系型数据库
1.1 关系型数据库
一个结构化的数据库,创建在关系模型基础上一般面向于记录
SQL语句 (标准数据查询语言) 就是一种基于关系型数据库的语言
,用于执行对关系型数据库中数据的检索和操作
。
主要有Oracle、MySQL、SQLServer、Microsoft Access、DB2等非关系型数据库
1.2 非关系型数据库
除了主流的关系型数据库外的数据库,都认为是非关系型
包括Redis、MongBD、Hbase、CouhDB等
1.3 关系型数据库和非关系型数据库的区别
1.3.1 数据存储方式不同
关系型数据天然就是表格式
的,因此存储在数据表的行和列中
。数据表可以彼此关联协作存储,也很容易提取数据
。
非关系型数据不适合存储在数据表的行和列中,而是大块组合在一起
。非关系型数据通常存储在数据集中,就像文档、键值对或者图结构
。你的数据及其特性是选择数据存储和提取方式的首要影响因素。
关系型 | 依赖于关系模型E-R图,同时以表格形式的方式存储数据 |
---|---|
非关系型 | 除了以表格形式存储之外,通常会以大块的形式组合在一起进行存储数据 |
1.3.2 扩展方式不同
SQL数据库是纵向扩展,也就是说提高处理能力(增加更多的CPU),使用速度更快速的计算机,这样处理相同的数据集就更快了。因为数据存储在关系表中,操作的性能瓶颈可能涉及很多个表,这都需要通过提高计算机性能来克服。虽然SQL数据库有很大扩展空间,但最终肯定会达到纵向扩展的上限。适用于小规模的数据库或需要快速扩展的情况。
而NoSQL数据库是横向扩展的。因为非关系型数据存储天然就是分布式的,NoSQL数据库的扩展可以通过给资源池添加更多普通的数据库服务器 (节点) 来分担负载。将数据分片存储在多台服务器上,每台服务器负责处理部分数据。通过分区、分片技术来实现数据的水平划分和负载均衡。适用于大规模数据和高并发的场景。
关系 | 纵向 | 天然表格式 |
---|---|---|
非关 | 横向 | 天然分布式 |
1.3.2.1横向扩展和复制的常用用途有:
1、读操作的负载均衡。
2、写操作的负载均衡。按信息角色分发,很少更新的表放在一个服务器,频繁更新的表分割到多个服务器上面;按地理区域分割,流量直接定向到最近的服务器。
3、热备份进行灾难避免。配置专门的salve作为热备份。
4、远程复制进行灾难避免。
5、制作备份。在完全不影响master的前提下执行备份。
6、生成报表。创建数据报表会降低服务器性能,影响较大,后台作业可以专门salve执行。
横向扩展只能扩展读操作,不能扩展写操作。分片(sharding)的技术扩展写操作。
同步复制要求master必须等待所有slave的写操作完成。需要额外的同步机制来保证一致性,一般通过两阶段提交(two-phase commit)协议来实现。协议之所以慢,是因为需要4次消息传递,包括事务消息和准备请求的消息,master的提交会被阻塞直到所有slave确认事务。异步复制只需要一条事务消息即可。
异步复制其实是牺牲一致性为代价换取性能
有两个问题:1、master出现故障,事务就会消失;2、slave执行的查询可能返回旧数据。
简单拓扑和树形拓扑用于横向扩展,双主拓扑用于故障转移,环形拓扑和双主结构允许站点本地允许时还能将变更复制到其他站点。
级联复制,添加额外的slave作为中继salve,通过管理一群slave来减轻master上的复制负载。普通salve需要将变更应用到数据库,但不写入二进制日志。relay需要写入二进制日志,但不应用变更。realy使用blackhole引擎,relay会产生额外延迟。
过滤复制事件
1、master上过滤事件,master过滤器,控制哪些被写入二进制日志。无法使用PITR准确恢复数据库。binlog-do-db、binlog-ignore-db,多个数据库需要重复使用选项。
2、salve上过滤事件,slave过滤器,控制哪些在slave上执行。所有变更通过网络传送,浪费带宽。可以过滤数据库,还可以过滤单个表以及使用通配符过滤一组表。replicate-do-db、replicate-ignore-db、replicate-do-table=dbname.tablename、replicate-ignore-table=dbname.tablename、replicate-wild-do-table、replicate-wild-ignore-table。
担心网络流量,可以在master保存完整二进制日志,relay过滤,减少流量。
数据的一致性管理
mysql5.6引入了全局事务标识符(GTID),master上提交的事务做个标记,等slave获取到这个事务时才在slave上执行查询。
级联部署一致性,,第一是利用全局事务标识符来提升slave,并反复轮询slave有没有处理这个事务;第二是利用函数master-pos-wait函数将maeter到salve路径上的relay都连接起来,保证所有变化都能传递到salve。
1.3.3 对事务的支持性不同
如果数据操作需要高事务性或者复杂数据查询需要控制执行计划,那么传统的SQL数据库从性能和稳定性方面考虑是最佳选择。SQL数据库支持对事务(ACID)原子性细粒度控制,并且易于回滚事务。
虽然NoSQL数据库也可以使用事务操作,但稳定性方面没法和关系型数据库比较,所以它们真正闪亮的价值是在操作的扩展性和大数据量处理方面。
① 关系型:特别适合高事务性要求和需要控制执行计划的任务
② 非关系:此处会稍显弱势,其价值点在于高扩展性和大数据量处理方面
1.3.4 非关系型数据库产生背景
可用于应对Web2.0纯动态网站类型的三高问题。
(1) High performance-------对数据库高并发读写需求
(2) HugeStorage--------------对海量数据高效存储与访问需求
(3) High Scalability && High Availability------- 对数据库高可扩展性与高可用性需求
- 关系型数据库和非关系型数据库都有各自的特点与应用场景,两者的紧密结合将会给Web2.0的数据库发展带来新的思路。
- 让关系数据库关注在关系上,非关系型数据库关注在存储上。
- 例如,在读写分离的MySQL数据库环境中,可以把经常访问的数据存储在非关系型数据库中,提升访问速度。
MySQL高热数据 ----》 redis
web ----》 redis ----》 MySQL
CPU ----》 内存/缓存 ----》 磁盘
总结
关系型数据库:
实例–>数据库–>表(table)–>记录行(row)、数据字段(column)——》存储数据
非关系型数据库:
实例–>数据库–>集合(collection) -->键值对(key-value)
workdir=/usr/local/mysql
非关系型数据库不需要手动建数据库和集合(表)。
二、Redis简介
Redis是一个开源的
、使用C语言编写
的NoSQL 数据库。【非关系型数据库】
Redis基于内存运行
并支持持久化
(支持存储在磁盘),采用**key-value (键值对)
**的存储形式,是目前分布式架构中不可或缺的一环。
2.1 Redis服务器程序的单线程模型
Redis服务器程序是单进程模型
Redis服务在一台服务器上可以同时启动多个Redis进程,Redis的实际处理速度则是完全依靠于主进程的执行效率。若在服务器上只运行一个Redis进程,当多个客户端同时访问时,服务器的处理能力是会有一定程度的下降;若在同一台服务器上开启多个Redis进程,Redis在提高并发处理能力的同时会给服务器的CPU造成很大压力。即: 在实际生产环境中,需要根据实际的需求来决定开启多少个Redis进程。
建议可以开2个进程
1、备份
2、抗高并发的同时尽量不给CPU造成太大的压力
若对高并发要求更高一些,可能会考虑在同一台服务器上开启多个进程。若CPU资源比较紧张,采用单进程即可。
单进程快速的原因:
PS : 补充加深一点
使用 epoll(默认) + I/O多路复用机制
首先,Redis 是跑在单进程中的,所有的操作都是按照顺序线性执行的,但是由于读写操作等待用户输入或输出都是阻塞的,所以 I/O 操作在一般情况下往往不能直接返回,这会导致某一文件的 I/O 阻塞导致整个进程无法对其它客户提供服务,而 I/O 多路复用就是为了解决这个问题而出现的。
epoll 机制优势:
1. epoll 没有最大并发连接的限制,上限是最大可以打开文件的数目,这个数字一般远大于 2048, 一般来说这个数目和系统内存关系很大 ,具体数目可以 cat /proc/sys/fs/file-max 察看。
2. 效率提升, Epoll 最大的优点就在于它只管你“活跃”的连接 ,而跟连接总数无关,因此在实际的网络环境中, Epoll 的效率就会远远高于 select 和 poll 。
3. 内存拷贝, Epoll 在这点上使用了“共享内存 ”,这个内存拷贝也省略了
I/O多路复用就通过一种机制,可以监视多个描述符,一旦某个描述符就绪,能够通知程序进行相应的操作。
2.2 I/O复用技术介绍
一个线程同时追踪、管理多个连接(原本默认情况下是一个线程对应一个连接)
回调: 预先定义具体的执行过程(定义一个方法) ,等待调用,在一个线程给执行时,可以根据“触发器”“钩子” 完成回调,回调的目的是提高处理性能 和节省资源
2.3 Redis 具有以下几个优点(redis 特性(与其他nosql对比))
(1)、具有极高的数据读写速度:数据读取的速度最高可达到 110000 次/s,数据写入速度最高可达到 81000 次/s。
(2)、支持丰富的数据类型:支持key-value、 Strings、Lists、 Hashes(散列值)、 Sets 及Ordered Sets 等数据类型操作。
ps:
string 字符串(可以为整形、浮点和字符型,统称为元素)
list 列表:(实现队列,元素不唯一,先入先出原则)
set 集合:(各不相同的元素)
hash hash散列值:(hash的key必须是唯一的)
set /ordered sets 集合/有序集合
(3)支持数据的持久化:可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行使用。
(4)原子性:Redis所有操作都是原子性的。
(5)支持数据备份:即master-salve 模式的数据备份。丰富的特性 – Redis还支持 publish(消息发布)/subscribe(订阅), 通知, 设置key有效期等等特性。
Redis作为基于内存运行的数据库,缓存是其最常应用的场景之一
。除此之外,Redis常见应用场景:包括获取最新N个数据的操作、排行榜类应用、计数器应用、存储关系、实时分析系统、日志记录。
支持key-value、 Strings、Lists、 Hashes(散列值)、 Sets 及Ordered Sets 等数据类型操作。
三、安装Redis和Redis命令工具
3.1 安装Redis
systemctl stop firewalld
setenforce 0yum install -y gcc gcc-c++ make
tar zxvf redis-5.0.7.tar.gz -C /opt/
cd /opt/redis-5.0.7/
make && make PREFIX=/usr/local/redis install
#由于Redis源码包中直接提供了Makefile 文件,所以在解压完软件包后,不用先执行./configure 进行配置,可直接执行make与make install命令进行安装
3.1.2 执行软件包提供的 install_server.sh 脚本文件设置Redis服务所需要的相关配置文件
cd /opt/redis-5.0.7/utils
./install_server.sh
....... #一直回车.
Please select the redis executable path [/usr/local/bin/redis-server] /usr/local/redis/bin/redis-server
#需要手动修改为 /usr/local/redis/bin/redis-server 注意要一次性正确输入
-------------------------------------------------------------------------------------
Selected config:
Port : 6379 #默认侦听端口为6379
Config file : /etc/redis/6379.conf #配置文件路径
Log file : /var/log/redis_6379.log #日志文件路径
Data dir : /var/lib/ redis/6379 #数据文件路径
Executable : /usr/local/redis/bin/redis-server #可执行文件路径
Cli Executable : /usr/local/redis/bin/redis-cli #客户端命令工具
3.1.3 把redis的可执行程序文件放入路径环境变量的目录中便于系统识别
ln -s /usr/local/redis/bin/* /usr/local/bin/
#当install_server.sh 脚本运行完毕,Redis 服务就已经启动,默认侦听端口为6379
netstat -natp | grep redis#Redis服务控制
/etc/init.d/redis_6379 stop #停止
/etc/init.d/redis_6379 start #启动
/etc/init.d/redis_6379 restart #重启
/etc/init.d/redis_6379 status #状态
修改配置 /etc/redis/6379.conf 参数
vim /etc/redis/6379.conf
bind 127.0.0.1 192.168.200.16 #70行,添加监听的主机地址
port 6379 #93行,Redis默认的监听端口
daemonize yes #137行,启用守护进程
pidfile /var/run/redis_6379.pid #159行,指定PID文件
loglevel notice #167行,日志级别
logfile /var/log/redis_6379.log #172行,指定日志文件
/etc/init.d/redis_6379 restart
3.2 Redis命令工具
redis-server: 用于启动Redis 的工具
redis-benchmark: 用于检测Redis在本机的运行效率
redis-check-aof: 修复AOF持久化文件
redis-check-rdb: 修复RDB持久化文件
redis-cli: Redis 命令行工具.rdb 和aof 是redis服务中持久化功能的两种形式RDB AOF
redis-cli 常用于登陆至redis 数据库
3.3 redis-cli 命令行工具(远程登陆)
语法: redis-cli -h host -p port -a password
-h :指定远程主机
-p :指定Redis 服务的端口号
-a :指定密码,未设置数据库密码可以省略-a选项
若不添加任何选项表示,则使用127.0.0.1:6379 连接本机上的 Redis 数据库,redis-cli -h 192.168.10.27 -p 6379
3.4 redis-benchmark 测试工具
redis-benchmark 是官方自带的 Redis 性能测试工具,可以有效的测试 Redis 服务的性能。
基本的测试语法: redis-benchmark [选项] [选项值]
-h :指定服务器主机名。
-p :指定服务器端口。
-s :指定服务器socket(套接字)
-c :指定并发连接数。
-n :指定请求数。
-d :以字节的形式指定 SET/GET 值的数据大小。
-k : 1=keep alive 0=reconnect
-r : SET/GET/INCR 使用随机key, SADD使用随机值。
-P :通过管道传输<numreq>请求。
-q :强制退出redis。 仅显示query/sec 值。
--csv :以CSV格式输出。
-l :生成循环,永久执行测试。
-t :仅运行以逗号分隔的测试命令列表。
-I : Idle模式。仅打开 N 个idle连接并等待。
#向IP地址为192.168.200.16 端口为6379 的Redis 服务器发送100个并发连接与100000 个请求测试性能
redis-benchmark -h 192.168.200.16 -p 6379 -c 100 -n 100000#测试存取大小为100字节的数据包的性能
redis-benchmark -h 192.168.200.16 -p 6379 -q -d 100#测试本机上Redis 服务在进行set与lpush操作时的性能
redis-benchmark -t set,lpush -n 100000 -q#测试本机上Redis 服务在进行set与lpush操作时的性能
3.5 Redis数据库常用命令
set:存放数据,命令格式为 set key value
get:获取数据,命令格式为 get key
# keys 命令可以取符合规则的键值列表,通常情况可以结合*、?等选项来使用。
127.0.0.1:6379> KEYS * #查看当前数据库中所有键
127.0.0.1:6379> KEYS v* #查看当前数据库中以 v 开头的数据
127.0.0.1:6379> KEYS v? #查看当前数据库中以 v 开头后面包含任意一位的数据
127.0.0.1:6379> KEYS v?? #查看当前数据库中以 v 开头 v 开头后面包含任意两位的数据
# exists 命令可以判断键值是否存在。
127.0.0.1:6379> exists teacher #判断 teacher 键是否存在
(integer) 1 # 1 表示 teacher 键是存在
127.0.0.1:6379> exists tea
(integer) 0 # 0 表示 tea 键不存在
# del 命令可以删除当前数据库的指定 key。
127.0.0.1:6379> keys *
127.0.0.1:6379> del v5
127.0.0.1:6379> get v5
# type 命令可以获取 key 对应的 value 值类型。
127.0.0.1:6379> type k1
string
# rename 命令是对已有 key 进行重命名。(覆盖)
命令格式:rename 源key 目标key
使用rename命令进行重命名时,无论目标key是否存在都进行重命名,且源key的值会覆盖目标key的值。在实际使用过程中,建议先用 exists 命令查看目标 key 是否存在,然后再决定是否执行 rename 命令,以避免覆盖重要数据。127.0.0.1:6379> keys v*
1) "v1"
2) "v22"
127.0.0.1:6379> rename v22 v2
OK
127.0.0.1:6379> keys v*
1) "v1"
2) "v2"
127.0.0.1:6379> get v1
"4"
127.0.0.1:6379> get v2
"5"
127.0.0.1:6379> rename v1 v2
OK
127.0.0.1:6379> get v1
(nil)
127.0.0.1:6379> get v2
"4"
#renamenx rename n 不进行修改 x进行修改 nx 组合: 先判断 命令的作用是对已有key进行重命名,并检测新名是否存在,如果目标key存在则不进行重命名。 (不覆盖) 命令格式: renamenx 源key 目标key
127.0.0.1 :6379> keys *
127.0.0.1:6379> get teacher
"zhangzhang"
127.0.0.1:6379> get v2
"4"
127.0.0.1:6379> renamenx v2 teacher
(integer) 0
127.0.0.1:6379> keys *
127.0.0.1 :6379> get teacher
"zhangzhang"
127.0.0.1:6379> get v2
"4"
dbsize命令的作用是查看当前数据库中key的数目。
127.0.0.1:6379> dbsize
(integer) 9
使用config set requirepass your password 命令设置密码
127.0.0.1:6379> config set requirepass 123456
#使用config get requirepass 命令查看密码(一旦设置密码,必须先验证通过密码,否则所有操作不可用)
127.0.0.1:6379> auth 123456
127.0.0.1:6379> config get requirepass
删除密码
127.0.0.1:6379> auth 123123
127.0.0.1:6379> config set requirepass ''
#以上不设置,无法重启redis
3.6 Redis 多数据库常用命令(16个库 0-15)
Redis支持多数据库,Redis 默认情况下包含16个数据库,数据库名称是用数字0-15 来依次命名的。 多数据库相互独立,互不干扰。
命令格式: select 序号
使用 redis-cli 连接Redis数据库后,默认使用的是序号为 0 的数据库。
127.0.0.1:6379> select 10 #切换至序号为10的数据库127.0.0.1:6379[10]> select 15 #切换至序号为15的数据库
127.0.0.1:6379[15]> select 0 #切换至序号为0的数据库
#多数据库间移动数据
格式: move 键值 序号127.0.0.1:6379> set k1 100
OK
127.0.0.1:6379> get k1
"100"
127.0.0.1:6379> select 1
OK
127.0.0.1:6379[1]> get k1
(nil)
127.0.0.1:6379[1]> select 0 #切换至目标数据库0
OK
127.0.0.1:6379> get k1 #查看目标数据是否存在
"100"
127.0.0.1:6379> move k1 1 #将数据库0中k1移动到数据库1中
(integer) 1
127.0.0.1:6379> select 1 #切换至目标数据库1
OK
127.0.0.1:6379[1]> get k1 #查看被移动数据
"100"
127.0.0.1:6379[1]> select 0
OK
127.0.0.1:6379> get k1 #在数据库0中无法查看到k1的值
(nil)
3.6.2 清除数据库内数据(rm -rf )
FLUSHDB :清空当前数据库数据
FLUSHALL :清空所有数据库的数据,慎用!
redis 远程数据备份 (全量、增量)
是以Shell 脚本的形式
redis_backup.sh
#!/bin/bash
TIME=$
BCDIR=
redis_server=
post
pswordredis 缓存穿透 击穿 雪崩
redis 分布式锁()nginx SSL 加秘密
nginx 暴露一些接口之类的