Java自学者论坛

 找回密码
 立即注册

手机号码,快捷登录

恭喜Java自学者论坛(https://www.javazxz.com)已经为数万Java学习者服务超过8年了!积累会员资料超过10000G+
成为本站VIP会员,下载本站10000G+会员资源,会员资料板块,购买链接:点击进入购买VIP会员

JAVA高级面试进阶训练营视频教程

Java架构师系统进阶VIP课程

分布式高可用全栈开发微服务教程Go语言视频零基础入门到精通Java架构师3期(课件+源码)
Java开发全终端实战租房项目视频教程SpringBoot2.X入门到高级使用教程大数据培训第六期全套视频教程深度学习(CNN RNN GAN)算法原理Java亿级流量电商系统视频教程
互联网架构师视频教程年薪50万Spark2.0从入门到精通年薪50万!人工智能学习路线教程年薪50万大数据入门到精通学习路线年薪50万机器学习入门到精通教程
仿小米商城类app和小程序视频教程深度学习数据分析基础到实战最新黑马javaEE2.1就业课程从 0到JVM实战高手教程MySQL入门到精通教程
查看: 504|回复: 0

解决Redis/Codis Connection with master lost(复制超时)问题

[复制链接]
  • TA的每日心情
    奋斗
    4 天前
  • 签到天数: 789 天

    [LV.10]以坛为家III

    2049

    主题

    2107

    帖子

    72万

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    722638
    发表于 2021-6-7 14:29:16 | 显示全部楼层 |阅读模式

    今天在线上环境中遇到了codis-server报警,按照常规处理流程进行处理,报错步骤如下:

    1. 首先将codis-slave的rdb文件移除,并重启codis-slave
    2. 在codis-dashbord中将codis-slave移除问题codis group
    3. 将codis-slave重新加入codis group,并测试在codis-master中写入数据,查看codis-slave中能否正常读取数据

    没想到在新加入codis group同步数据时发生以下报错:

    [13029] 15 Oct 13:56:29.063 # Client id=8443510 addr=10.24.193.69:30377 fd=6 name= age=187 idle=187 flags=S db=0 sub=0 psub=0 multi=-1 qbuf=0 qbuf-free=0 obl=16365 oll=3917 omem=100541448 events=rw cmd=psync scheduled to be closed ASAP for overcoming of output buffer limits. 
    

    [13029] 15 Oct 13:56:29.160 # Connection with slave 10.24.193.69:6379 lost.
    [13029] 15 Oct 13:56:30.607 * Slave 10.24.193.69:6379 asks for synchronization
    [13029] 15 Oct 13:56:30.607 * Full resync requested by slave 10.24.193.69:6379
    [13029] 15 Oct 13:56:30.607 * Starting BGSAVE for SYNC with target: disk
    [13029] 15 Oct 13:56:30.856 * Background saving started by pid 17765
    [17765] 15 Oct 13:58:26.910 * DB saved on disk
    [17765] 15 Oct 13:58:27.093 * RDB: 969 MB of memory used by copy-on-write
    [13029] 15 Oct 13:58:27.492 * Background saving terminated with success

    出现以上报错的原因是codis/redis默认配置中```repl-timeout```的时间为60s,当复制数据的时间超过60s时,codis/redis master就会认为连接超时主动断开连接,也就是```Connection with master lost```报错。当然简单的理解,复制的过程中肯定有两个参数,一个是复制时长,另一个就是每秒/每分钟复制数据占用服务器资源的大小```client-output-buffer-limit```参数就决定了客户端输出缓冲区内存使用量,所以我们可以通过调整这两个参数来解决此次问题。
    

    解决Redis/Codis同步超时问题

    我们的codis部分配置文件如下:

    repl-timeout 60
    client-output-buffer-limit slave 256mb 64mb 60
    

    上面是master上的slave客户端,默认缓冲区大小限制:当缓冲区使用超过256mb,master会尽快杀掉它;当缓冲区使用大于64mb,且小于256mb的soft limit值时,并持续时间达60秒,也会被Master尽快杀掉。

    综上所述

    解决超时问题有两种方式:

    • 修改超时时间长短repl-timeout 60
    • 修改缓冲区占用内容大小限制client-output-buffer-limit

    当数据同步完成后最好将配置修改为原配置,避免占用服务器资源过高引起其他问题

    哎...今天够累的,签到来了1...
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|手机版|小黑屋|Java自学者论坛 ( 声明:本站文章及资料整理自互联网,用于Java自学者交流学习使用,对资料版权不负任何法律责任,若有侵权请及时联系客服屏蔽删除 )

    GMT+8, 2024-9-10 19:02 , Processed in 1.005471 second(s), 29 queries .

    Powered by Discuz! X3.4

    Copyright © 2001-2021, Tencent Cloud.

    快速回复 返回顶部 返回列表