龙空技术网

Redis6.0新特性、剖析线程模型(单线程和多线程)

CTO技术手册 160

前言:

眼前咱们对“redis6新特性”大体比较看重,咱们都需要剖析一些“redis6新特性”的相关内容。那么小编也在网上汇集了一些关于“redis6新特性””的相关知识,希望同学们能喜欢,你们快快来学习一下吧!

一. Redis6.0 新特性

1. 多线程IO

 redis6.0引入多线程IO,只是用来处理网络数据的读写和协议的解析,而执行命令依旧是单线程,所以不需要去考虑set/get、事务、lua等的并发问题。(详细的线程模型见后面)

 多线程IO的性能提升测试可参考: (相对权威) 自己测试:

2. ACL精细化权限控制

 在Redis 5版本之前,Redis 安全规则只有密码控制 还有通过rename 来调整高危命令比如 flushdb , KEYS* , shutdown 等。

 Redis 6 则提供ACL的功能对用户进行更细粒度的权限控制 ,支持对客户端的权限控制,实现对不同的key授予不同的操作权限:

(1)接入权限: 用户名和密码 (2)可以执行的命令 (3)可以操作的 KEY

相关指令如下:

3. 支持RESP3

 RESP(Redis Serialization Protocol)是 Redis 服务端与客户端之间通信的协议。

 Redis 5 使用的是 RESP2,而 Redis 6 开始在兼容 RESP2 的基础上,开始支持 RESP3。推出RESP3的目的:一是因为希望能为客户端提供更多的语义化响应,以开发使用旧协议难以实现的功能;另一个原因是实现 Client-side-caching(客户端缓存)功能。

4. 重新设计了客户端缓存

 基于 RESP3 协议实现的客户端缓存功能。为了进一步提升缓存的性能,将客户端经常访问的数据cache到客户端,减少TCP网络交互,提升RT。

5. 提升了RDB的加载速度

 根据文件的实际组成(较大或较小的值),可以预期20/30%的改进。当有很多客户机连接时,信息也更快了,这是一个老问题,现在终于解决了。

6. 支持SSL  

 连接支持SSL,更加安全。

7. Redis Cluster proxy(集群代理)

 antirez开发了 Proxy 功能,让 Cluster 拥有像单实例一样的接入方式,降低大家使用cluster的门槛。不过需要注意的是代理不改变 Cluster 的功能限制,不支持的命令还是不会支持,比如跨 slot 的多Key操作。

8. Modules API

 Redis 6中模块API开发进展非常大,因为Redis Labs为了开发复杂的功能,从一开始就用上Redis模块。Redis可以变成一个框架,利用Modules来构建不同系统,而不需要从头开始写然后还要BSD许可。Redis一开始就是一个向编写各种系统开放的平台。

 Disque作为一个Redis Module使用足以展示Redis的模块系统的强大。集群消息总线API、屏蔽和回复客户端、计时器、模块数据的AOF和RDB等等。

参考: (redis作者)

二. 剖析线程模型

1. 灵魂拷问

(1). 为什么说redis6.0之前是单线程的?

 redis执行客户端命令的请求从: 获取 (socket 读)→解析→执行→内容返回 (socket 写) 等等都是由一个线程处理,所有操作是一个个挨着串行执行的 (主线程),这就是称redis是单线程的原因。

但是:redis从4.0开始,也有后台线程在工作,处理一些较为缓慢的操作,例如无用连接的释放、大 key 的删除等等,严格意义上来说,redis6.0之前也不完全是单线程的。

(2). 单线程非常快的原因是什么?

 A. 纯内存操作,避免大量访问数据库,减少直接读取磁盘数据,redis将数据储存在内存里面,读写数据的时候都不会受到硬盘 I/O 速度的限制,所以速度快.

 B. 单线程操作,避免了不必要的上下文切换和竞争条件,也不存在多进程或者多线程导致的切换而消耗CPU,不用去考虑各种锁的问题,不存在加锁释放锁操作,没有因为可能出现死锁而导致的性能消耗.

 C. 采用了非阻塞I/O 多路复用机制.

(3). redis在6.0之前为什么一直坚持单线程?

 官方曾做过类似问题的回复:使用Redis时,几乎不存在CPU成为瓶颈的情况, Redis主要受限于内存和网络。例如在一个普通的Linux系统上,Redis通过使用pipelining每秒可以处理100万个请求,所以如果应用程序主要使用O(N)或O(log(N))的命令,它几乎不会占用太多CPU。

 使用了单线程后,可维护性高。多线程模型虽然在某些方面表现优异,但是它却引入了程序执行顺序的不确定性,带来了并发读写的一系列问题,增加了系统复杂度、同时可能存在线程切换、甚至加锁解锁、死锁造成的性能损耗。Redis通过AE事件模型以及IO多路复用等技术,处理性能非常高,因此没有必要使用多线程。单线程机制使得 Redis 内部实现的复杂度大大降低,Hash 的惰性 Rehash、Lpush 等等 “线程不安全” 的命令都可以无锁进行。

(4). redis6.0引入多线程机制的背景是什么?

 从Redis自身角度来说,因为读写网络的read/write系统调用占用了Redis执行期间大部分CPU时间,瓶颈主要在于网络的 IO 消耗, 优化主要有两个方向:

  (1). 提高网络 IO 性能,典型的实现比如使用 DPDK 来替代内核网络栈的方式

  (2). 使用多线程充分利用多核,典型的实现比如 Memcached。

 协议栈优化的这种方式跟 Redis 关系不大,支持多线程是一种最有效最便捷的操作方式。所以总结起来,redis支持多线程主要就是两个原因:

  (1). 可以充分利用服务器 CPU 资源,目前主线程只能利用一个核

  (2). 多线程任务可以分摊 Redis 同步 IO 读写负荷

2. redis单线程模型(6.0之前)

 Redis客户端对服务端的每次调用都经历了发送命令,执行命令,返回结果三个过程。其中执行命令阶段,由于Redis是单线程来处理命令的,所有每一条到达服务端的命令不会立刻执行,所有的命令都会进入一个队列中,然后逐个被执行。并且多个客户端发送的命令的执行顺序是不确定的。但是可以确定的是不会有两条命令被同时执行,不会产生并发问题,这就是Redis的单线程基本模型。

PS:可以修改redis的最大链接数,默认为10000,如下图,如果要修改的话,直接修改配置文件重点maxclients即可。

(1). 什么是非阻塞IO?

 非阻塞 IO 在 Socket 对象上提供了一个选项Non_Blocking ,当这个选项打开时,读写方法不会阻塞,而是能读多少读多少,能写多少写多少。

 能读多少取决于内核为 Socket 分配的读缓冲区的大小,能写多少取决于内核为 Socket 分配的写缓冲区的剩余空间大小。读方法和写方法都会通过返回值来告知程序实际读写了多少字节数据。

 有了非阻塞 IO 意味着线程在读写 IO 时可以不必再阻塞了,读写可以瞬间完成然后线程可以继续干别的事了。

补充阻塞IO概念:

 当我们调用 Scoket 的读写方法,默认它们是阻塞的。

 read() 方法要传递进去一个参数 n,表示读取这么多字节后再返回,如果没有读够 n 字节线程就会阻塞,直到新的数据到来或者连接关闭了, read 方法才可以返回,线程才能继续处理。

 write() 方法会首先把数据写到系统内核为 Scoket 分配的写缓冲区中,当写缓存区满溢,即写缓存区中的数据还没有写入到磁盘,就有新的数据要写道写缓存区时,write() 方法就会阻塞,直到写缓存区中有空闲空间。

(2). 什么是IO多路复用?

背景:

 非阻塞 IO 有个问题,那就是单个线程要处理多个读写请求,处理某个客户端的的读数据的请求,结果读了一部分就返回了,线程如何知道什么时候才应该继续读数据。处理写请求的时候,如果缓冲区满了,写不完,剩下的数据何时才应该继续写?在什么时候处理什么请求?redis 单线程处理多个IO请求时就用到了IO多路复用技术。

原理:

 如下图,redis 需要处理 3 个 IO 请求,同时把 3 个请求的结果返回给客户端,所以总共需要处理 6 个 IO 事件,由于 redis 是单线程模型,同一时间只能处理一个 IO 事件,于是 redis 需要在合适的时间暂停对某个 IO 事件的处理,转而去处理另一个 IO 事件,这样 redis 就好比一个开关,当开关拨到哪个 IO 事件这个电路上,就处理哪个 IO 事件,其他 IO 事件就暂停处理了。这就是IO多路复用技术。

 以上是大致的理解下 IO 多路复用技术,在系统底层,IO 多路复用有 3 种实现机制:select、poll、epoll。

(3). 什么是文件处理器?

 A. Redis 基于 Reactor 模式开发了自己的网络事件处理器: 这个处理器被称为文件事件处理器(file event handler)

 B. 文件事件处理器使用 I/O 多路复用(multiplexing)程序来同时监听多个套接字, 并根据套接字目前执行的任务来为套接字关联不同的事件处理器。

 C. 当被监听的套接字准备好执行连接应答(accept)、读取(read)、写入(write)、关闭(close)等操作时, 与操作相对应的文件事件就会产生, 这时文件事件处理器就会调用套接字之前关联好的事件处理器来处理这些事件。

 D. 文件事件处理器以单线程方式运行, 但通过使用 I/O 多路复用程序来监听多个套接字, 文件事件处理器既实现了高性能的网络通信模型, 又可以很好地与 redis 服务器中其他同样以单线程方式运行的模块进行对接, 这保持了 Redis 内部单线程设计的简单性。

3. redis多线程模型(6.0开始)

(1). 流程如下:(如下图)

主线程获取 socket 放入等待列表将 socket 分配给各个 IO 线程(并不会等列表满)主线程阻塞等待 IO 线程(多线程)读取 socket 完毕主线程执行命令 - 单线程(如果命令没有接收完毕,会等 IO 下次继续)主线程阻塞等待 IO 线程(多线程)将数据回写 socket 完毕(一次没写完,会等下次再写)解除绑定,清空等待队列

(2). 特点如下:

IO 线程要么同时在读 socket,要么同时在写,不会同时读或写IO 线程只负责读写 socket 解析命令,不负责命令处理(主线程串行执行命令)IO 线程数可自行配置

参考:

标签: #redis6新特性