`
xiaoZ5919
  • 浏览: 400406 次
  • 性别: Icon_minigender_1
  • 来自: 安平人@北京
博客专栏
Group-logo
Netty学习笔记
浏览量:72760
社区版块
存档分类
最新评论

Redis的Aof被阻塞原因调查

 
阅读更多
背景

   Redis是单进程的,为了发挥多核的优势,我们redis集群采用在单台机器上部署多个redis实例,同时对持久化方式做了改进,采用rdb和增量的aof相结合的方式,appendfsync配置为no。那这样会有一个时段同时进行aof和rdb,当aof和rdb同时进行时,监控系统报警说某些请求Timeout,我们超时设置为2s。另外我们的机器分为两种类型,cpu配置不同,一种是4核,另外一种是12核,timeout发生在4核的机器上。
分析
   解决这个问题还是走了不少弯路的,所以在这儿和大家分享一下。经过一番分析找到一下可能导致慢的原因
  • CPU,rdb过程会有lzf compress以及crc会消耗cpu
  • bgsave的fork,fork需要copy page entry table到子进程中去,这个过程是阻塞的
  • IO问题,bgsave产生大量的IO,但这是在子进程中完成,应该不会影响主进程吧,在此处埋个伏笔


CPU问题?
因为timeout的问题主要出现在4核的机器上,12核的机器没有问题,所以首先怀疑cpu问题。我用info commandstats查看各个命令执行时间都是us级别,但4核的比12核的慢了近50%。如果是cpu撑不了,这个值应该至少在ms级别。同时profiler分析了redis执行bgsave的函数耗时。在MakeFile中添加-pg,注意编译和链接都需要加,我开始只在编译阶段加了,没有效果。
GPROF=-pg
FINAL_CFLAGS=$(STD) $(WARN) $(GPROF) $(OPT) $(DEBUG) $(CFLAGS) $(REDIS_CFLAGS)
# redis-server
$(REDIS_SERVER_NAME): $(REDIS_SERVER_OBJ)
        $(REDIS_LD) $(GPROF)  -o $@ $^ ../deps/hiredis/libhiredis.a ../deps/lua/src/liblua.a $(FINAL_LIBS)


观察都lzf和crc确实很占用cpu时间是最多的。crc采用一种增量的方式,而不是每次全量,性能应该很高。那么关闭compress和crc以后是否能解决呢?关闭以后问题依旧看来不是cpu的问题。

IO问题?
关闭aof以后问题解决,这当中也做了很多尝试,调整bgsave子进程的进程和IO有优先级,将主进程和子进程分别绑定在不同的cpu上,都不管用一度怀疑不是IO的问题。
在这里介绍几个工具
  • renice 调整进程的优先级
  • ionice 调整进程的IO优先级,当然这是针对block层的IO schedule,为啥不生效,后来才发现,ionice对async write的不起作用,cfq是将async write请求在同一请求队列中不属于进程自己的队列,write(2)一般情况是写入page cache就立马返回,而不是等待真正落入磁盘
  • taskset 将指定进程绑定到指定的cpu上

既然write(2)是buffered IO,写先到page cache中,那究竟是什么阻塞了呢?write是不是无限制地使用pagecache,这一点不清楚,这一段时间就狂看各种linux内核相关文档和看源码。
发现阻塞write(2)有几种情况:
  1. fsync(fdatasync) 会阻塞write
  2. pdflush会阻塞write
  3. 还有当dirty page超过可用内存的40%,这时候就会调用schedule_timeout阻塞200ms。write并不是仅仅copy到page cache就返回了,他还会检查dirty page的使用比例,如超过了会尝试阻塞地写入磁盘,如果此时不能完全写入,就会调用schedule_timeout从而产生iotimewait,此时使用top观察确实有90%的CPU使用是iotimewait

弯路
说说其中的弯路,由于我的粗心放过了一个重大的线索,同事告诉我一个linkhttp://www.redis.io/topics/latency,其中有一节就讲到了aof被大量IO阻塞的问题,作者提到fdatasysnc会阻塞write(2),但我们设置appendfsync为no,不会出现fdatasync和write(2)的阻塞
那究竟是什么阻塞了write呢,曾一度怀疑是dirty page超过可用内存的40%导致的拥塞等待。
但后来在一台64G内存redis只占用了7G内存的机器上遇到aof阻塞,排除了拥塞等待,那还有什么原因呢?
我查看redis的pullrequesthttps://github.com/antirez/redis/pull/1862,发现idning也遇到了类似问题,提出aof采用单独异步线程write的方案,不过作者有点不感冒没有merge,但他提出可以把文件系统的日志模式改为writeback模式不写日志,我试了会有所改观但不会解决问题。我依然知道到底是什么阻塞了write,这时候我把write的代码整体读了一篇然后用systemtap检测每一个可疑的高耗时函数
probe kernel.function("__wait_on_bit_lock").return {

  if(isinstr(execname(),"redis-server")){
       time = gettimeofday_us() - @entry(gettimeofday_us())
       if(time > 100000){
           printf("trace:%s,pid:%d,function:%s,cost:%d\n",ctime(gettimeofday_s()),pid(),probefunc(),time);
           print_stack(backtrace());
       }
  }

}

锁定在__wait_on_bit_lock,再根据调用堆栈发现有很多地方调用它,比如是read的时候,等待时候把数据从磁盘加载到page中等等。最终定位到一个可疑之处
page = __grab_cache_page(mapping,index,&cached_page,&lru_pvec);

write的时候都会先定位写那个page并尝试lock,而flush dirty page的时候也会先lock住。如果pdflush时,rdb产生大量的IO,那么他有可能尝试占用lock从而 __grab_cache_page等待很长时间。关于这一点我还不是很确定,欢迎大家帮助我确认。

解决Latency的正确流程
Redis的作者在http://www.redis.io/topics/latency,已经总结了很多种latency的情况,遇到latency一定要先看它,是否有负责自己的场景,比如我提的问题就是Latency due to AOF and disk I/O,我开始使用了pstack和strace但是都没有定位到阻塞的原因,其实strace可以定位到,但是使用方式不对导致没有捕获到真正的原因。redis2.6以后还提供了watchdog功能,通过config set watchdog打开该功能,就能在日志中打印出慢查询的堆栈。
分享到:
评论

相关推荐

    redis稳定版6.2.x with cygwin 发布包

    非阻塞,RDB-AOF混合持久化,PSYNC2.0 Redis 5 增加Stream即Redis MQ,主动碎片整理V2,集群管理器移植到C,RESP2 Redis 6 引入多线程IO,客户端缓存,权限控制,支持SSL,提升了RDB加载速度,Redis集群代理模块, ...

    redis稳定版 6.2.x with msys 发布包

    非阻塞,RDB-AOF混合持久化,PSYNC2.0 Redis 5 增加Stream即Redis MQ,主动碎片整理V2,集群管理器移植到C,RESP2 Redis 6 引入多线程IO,客户端缓存,权限控制,支持SSL,提升了RDB加载速度,Redis集群代理模块, ...

    redis 7.0.0 windows版

    5. 在ACL中,pub/sub channel默认是被阻塞的。 6. 在从节点中,TTL的时间标识的是绝对时间,不再是相对时间,从而保证了过期数据被及时删除。 7. 不再支持 gopher协议。 8. 当在配置文件中设置replica-serve-stale-...

    Redis 7.0.2 for Windows

    5. 在ACL中,pub/sub channel默认是被阻塞的。 6. 在从节点中,TTL的时间标识的是绝对时间,不再是相对时间,从而保证了过期数据被及时删除。 7. 不再支持 gopher协议。 8. 当在配置文件中设置replica-serve-...

    redisStudy.zip

    执行命令save或者bgsave save是只管保存,其他不管,全部阻塞 bgsave: redis会在后台异步进行快照操作,同时可以响应客户端的请求,但是在调用fork函数时是阻塞的,很快,可以忽略不计 执行flushall命令 但是里面...

    Redis 7.0.4 for Windows

    5. 在ACL中,pub/sub channel默认是被阻塞的。 6. 在从节点中,TTL的时间标识的是绝对时间,不再是相对时间,从而保证了过期数据被及时删除。 7. 不再支持 gopher协议。 8. 当在配置文件中设置replica-serve-stale-...

    Redis持久化RDB和AOF区别详解

    RDB是Redis内存到硬盘的快照,用于redis持久化,创建RDB二进制文件,将存储在内存中的数据,持久化的放到硬盘中,当我们需要这些数据的时候,启动载入RDB文件,数据将会被存入内存中,其实RDB就是一种快照的方式持久...

    redis基础资料

    Redis同样支持主从复制(master-slave replication),并且具有非常快速的非阻塞首次同步( non-blocking first synchronization)、网络断开自动重连等功能。同时Redis还具有其它一些特性,其中包括简单的事物支持...

    redis7.0.7 for win

    5. 在ACL中,pub/sub channel默认是被阻塞的。 6. 在从节点中,TTL的时间标识的是绝对时间,不再是相对时间,从而保证了过期数据被及时删除。 7. 不再支持 gopher协议。 8. 当在配置文件中设置replica-serve-...

    Redis V3.0 中文文档

    第 1 章Redis 介绍. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 第 2 章数据类型初探. . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...

    Redis 7.0.3 for Windows

    5. 在ACL中,pub/sub channel默认是被阻塞的。 6. 在从节点中,TTL的时间标识的是绝对时间,不再是相对时间,从而保证了过期数据被及时删除。 7. 不再支持 gopher协议。 8. 当在配置文件中设置replica-serve-...

    2019年 Redis从入门到高可用 分布式实战教程

    6-4 AOF阻塞.mp4 6-3 子进程开销和优化.mp4 6-2 fork.mp4 6-1 常见问题目录.mp4 5-9 RDB和AOF抉择.mp4 5-8 AOF实验.mp4 5-7 AOF(2).mp4 5-6 AOF(1).mp4 5-5 RDB(3).mp4 5-4 RDB(2).mp4 5-3 RDB(1).mp4 5-...

    Redis 3.0 中文版 - v1.1.pdf

    第 1 章Redis 介绍. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 第 2 章数据类型初探. . . . . . . . . . . . . . . . . . . . . . . . . . . . . ...

    Redis 用法

    Redis 用法 简单说明ppt 初学者试用。 string: =============================================================================== SET name "John Doe" GET name 批量的读写操作 MSET age 30 sex "male" MGET ...

    基于 Canal 的 MySql RabbitMQ Redis/memcached/mongodb

    数据:mysql->binlog->MQ->redis(不过期、关闭RDB、AOF保证读写性能) (nosql数据仅用crontab脚本维护) 请求:http->webserver->redis(有数据)->返回数据 (完全避免用户直接读取mysql) ->redis(无数据)->返回...

    redis-7.0.10.tar.gz

    Redis 7新特性汇总: 1. 在集群模式下显着节省内存和延迟改进 。 ...15. 当 redis 从空启动时始终创建一个基本 AOF 文件。 16. 本在 repl-diskless-load 期间继续提供数据= swapdb 以提高可用性 。

    Redis的持久化方案详解

    Redis支持RDB与AOF两种持久化机制,持久化可以避免因进程异常退出或down机导致的数据丢失问题,在下次重启时能利用之前的持久化文件实现数据恢复。 RDB持久化 RDB持久化即通过创建快照(压缩的二进制文件)的方式...

    关于Redis你可能不了解的一些事

    使用过Redis的小伙伴们可能对这些已经非常熟知了,下面我想来谈谈Redis也许并不被每个人了解的那点事。 Redis持久化机制 刚看到标题你可能会说,我知道,不就是RDB和AOF嘛。这些已经是老生常谈了。那么我们今天就...

    study-redis-server-3.0:阅读redis-server-3.0

    aof.cAOF 功能的实现。asciilogo.h保存了 Redis 的 ASCII LOGO 。bio.c 、 bio.hRedis 的后台 I/O 程序,用于将 I/O 操作放到子线程里面执行,减少 I/O 操作对主线程的阻塞。bitops.c二进制位操作命令的实现文件。...

Global site tag (gtag.js) - Google Analytics