`

notify+rsync实时同步 百万级别文件

阅读更多

背景

我们公司在用inotify+rsync做实时同步,来解决分布式集群文件一致性的问题。但当web文件越来越多(百万级数量html,jpg等小 文件),同步就越来越慢,根本做不到实时,按照网上的调优方法都尝试过,问题根本没有解决。经过我一翻细致研究,终于把慢的核心问题研究明白,先总结一句 inotifywait响应不会有延迟,rsync也很快。大家同样有慢的烦恼,那是因为网上的inotify+rsync的教程都是坑。下面我们来分 析。

inotifywait 单独分析

 

执行上面命令,是让inotifywait监听/data/目录,当监听到有发生modify,create,delete,attrib等事件发生时,按%Xe %w%f的格式输出。

在/data/目录touch几个文件

观看inotify输出

知道上面的输出效果之后 我们应该想得到,可以用rsync获取inotifywait监控到的文件列表来做指定的文件同步,而不是每次都由rsync做全目录扫描来判断文件是否存在差异。

网上的inotify+rsync分析

我们来看网上的教程,我加了注释。(网上所有的教程基本都一模一样,尽管写法不一样,致命点都是一样的)

#注意看 这里的rsync 每次都是全量的同步(这就坑爹了),而且 file列表是循环形式触发rsync ,等于有10个文件发生更改,就触发10次rsync全量同步(简直就是噩梦),那还不如直接写个死循环的rsync全量同步得了。

#有很多人会说 日志输出那里明明只有差异文件的同步记录。其实这是rsync的功能,他本来就只会输出有差异需要同步的文件信息。不信你直接拿这句rsync来跑试试。

#这种在需要同步的源目录文件量很大的情况下,简直是不堪重负。不仅耗CPU还耗时,根本不可以做到实时同步。

改良方法

要做到实时,就必须要减少rsync对目录的递归扫描判断,尽可能的做到只同步inotify监控到已发生更改的文件。结合rsync的特性,所以这里要分开判断来实现一个目录的增删改查对应的操作。

脚本如下

 

每两小时做1次全量同步

因为inotify只在启动时会监控目录,他没有启动期间的文件发生更改,他是不知道的,所以这里每2个小时做1次全量同步,防止各种意外遗漏,保证目录一致。

改良后我们公司这种百万级小文件也能做到实施同步了。

下面附上inotify的参数说明

inotify介绍-- 是一种强大的、细颗粒的、异步的文件系统监控机制,*&####&*_0_*&####&*内核从2.6.13起,加入Inotify可以监控文件系统中添加、删除、修改移动等各种事件,利用这个内核接口,就可以监控文件系统下文件的各种变化情况。

inotifywait 参数说明

参数名称 参数说明
-m,–monitor 始终保持事件监听状态
-r,–recursive 递归查询目录
-q,–quiet 只打印监控事件的信息
–excludei 排除文件或目录时,不区分大小写
-t,–timeout 超时时间
–timefmt 指定时间输出格式
–format 指定时间输出格式
-e,–event 后面指定删、增、改等事件

inotifywait events事件说明

事件名称 事件说明
access 读取文件或目录内容
modify 修改文件或目录内容
attrib 文件或目录的属性改变
close_write 修改真实文件内容
close_nowrite  
close  
open 文件或目录被打开
moved_to 文件或目录移动到
moved_from 文件或目录从移动
move 移动文件或目录移动到监视目录
create 在监视目录下创建文件或目录
delete 删除监视目录下的文件或目录
delete_self  
unmount 卸载文件系统

优化 Inotify

# 在/proc/sys/fs/inotify目录下有三个文件,对inotify机制有一定的限制

 

-----------------------------
max_user_watches #设置inotifywait或inotifywatch命令可以监视的文件数量(单进程)
max_user_instances #设置每个用户可以运行的inotifywait或inotifywatch命令的进程数
max_queued_events #设置inotify实例事件(event)队列可容纳的事件数量
----------------------------

 

 

作者信息

广州 - 小朱

分享到:
评论

相关推荐

    rsync+inotify 文件同步自动配置安装

    rsync+inotify 文件同步自动配置安装shell,包含inotify3.14的源包,自动安装后可以实现/etc/init.d/rsyncd start|stop 脚本自动复制,在启动关闭时候同时启动关闭inotify监控shell脚本,请使用时认真阅读安装脚本,...

    rsync+inotify实时同步

    rsync+inotify实时同步是一种高效、实时的文件同步解决方案,尤其适合于对文件系统变化敏感的应用场景。rsync是一个强大的、开源的文件同步工具,它可以在本地或远程主机之间进行增量备份,节省了大量的网络带宽。...

    [Linux] 通过Rsync+Inotify实现本、异地远程数据实时同步

    0x0 测试环境 总部生产服务器与分部备份服务器...0x1.1 安装gcc编译器和rsync yum install gcc rsync -y 0x1.2 拷贝inotify到服务器并解压 cd /root tar xfvz inotify-tools-3.13.tar.gz 0x1.3 进入inotify 目录安装

    Java 同步方式 wait和notify/notifyall

    需要注意的是,`wait()`, `notify()`, 和 `notifyAll()` 必须在同步上下文中(synchronized代码块或方法)调用,否则会抛出`IllegalMonitorStateException`异常。此外,调用这些方法的线程必须是拥有对象锁的线程,...

    Linux 系统下安装 rsync+inotify 组件实现多个服务器之间文件实时同步

    客户端的备份文件要和服务器端的备份文件保持实时同步。 例如: 服务端 IP:192.168.2.10 客户端 IP:192.168.2.11,192.168.2.12,…,192.168.2.18 二、服务端开启rsync服务 1.CentOS7操作系统安装完成后,会有自带的...

    Linux 通过Rsync+Inotify实现本、异地远程数据实时同步功能

    - Rsync同步:Rsync根据Inotify的通知,实时地将生产服务器上的变化同步到备份服务器,实现数据的实时备份。 通过以上步骤,可以实现在Linux环境中,基于Rsync和Inotify的本地与远程实时数据同步功能,确保了数据...

    flask-line-notify:LINE Notify + Flask 的范例专案

    Flask-LINE-notify 前一阵子看到保哥写了一篇,详细的介绍整个操作流程,这个专案则是去实作整个流程的范例, 同时也是的范例程式,欢迎大家取用试玩。 LINE Notify 注册 可以参考我之前。 设定的Callback Url为...

    Java 同步锁 wait notify 学习心得

    标题和描述概述的知识点主要集中在Java的多线程机制中,特别是`wait`和`notify`方法在同步锁中的应用。这些方法对于控制线程之间的交互至关重要,尤其是在资源有限或需要确保数据一致性的情况下。 ### Java同步锁...

    通过rsync+inotify实现数据的实时备份配置

     随着应用系统规模的不断扩大,对数据的安全性和可靠性也提出的更好的要求,rsync在高端业务系统中也逐渐暴露出了很多不足,首先,rsync同步数据时,需要扫描所有文件后进行比对,进行差量传输。如果文件数量达到了...

    java之wait,notify的用法([ 详解+实例 ])

    在Java多线程编程中,wait和notify是两个非常重要的方法,它们都是Object类的方法,用于线程之间的通信和同步。下面我们将详细解释wait和notify的用法。 wait方法 wait方法是Object类的一个方法,用于让当前线程...

    IPC的MessageQ与Notify例程

    而“SysBios8_IPC_Notify”文件则可能包含了相同版本的System BIOS中关于Notify机制的实现。这里可能包含注册、取消注册事件通知,以及触发事件的相关函数。通过这个库,开发者可以轻松地在进程间设置事件监听和通知...

    淘宝消息中间件Notify

    Notify_1.4_truncate.docx Notify_1.7_client_design.doc Notify_1.7_client_develop_guide.docx ... ... Notify1.7_server_design.docx Notify1.7UserGuide.pptx Notify1.8_SEDA.docx Notify2010plan.pptx Notify...

    java+多线程+同步详解

    在一个同步块或同步方法中,线程可以调用`wait()`释放锁并进入等待状态,直到其他线程调用`notify()`或`notifyAll()`唤醒它。这些方法必须配合`synchronized`使用,否则会导致死锁。 4. **java.util.concurrent** ...

    MFC 全面解读WM_NOTIFY

    ### MFC全面解读WM_NOTIFY 在MFC(Microsoft Foundation Classes)框架中,`WM_NOTIFY`消息扮演着极其关键的角色,特别是在处理控件间通信时。本文将深入解析`WM_NOTIFY`消息的机制、应用场景以及其在MFC中的实现...

    实时监控目录和文件的变化

    以上就是使用`ReadDirectoryChangesW`、`WideCharToMultiByte`、`FILE_NOTIFY_INFORMATION`和`CreateThread`这些API实现实时监控目录和文件变化的基本流程和技术细节。在实际编程中,还需要考虑错误处理、内存管理...

    4.20170706_从机自动使能notify.zip

    这个压缩包“4.20170706_从机自动使能notify.zip”可能包含了实现这一功能的相关代码、配置文件、文档或者更新脚本。文件名中的“4”可能代表该内容是某个系列或版本的第四部分,这通常意味着它是一个逐步发展的项目...

    notify.js 好用的提示工具

    notify.js 好用的提示工具

    java+多线程+同步详解源代码学习

    - wait()、notify()和notifyAll():在同步块或同步方法中使用,用于线程间的通信。必须在持有对象锁的情况下调用,否则会抛出IllegalMonitorStateException。 - Condition接口:Lock接口的一个实现类提供,提供了...

    wait_notify_demo

    在Java中,`wait()`、`notify()`和`notifyAll()`方法都是与对象锁相关的,它们用于控制线程的同步。使用这些方法的前提是线程必须拥有对象的监视器,也就是对象锁。这是通过在synchronized块或方法中调用它们来实现...

    gpio-notify:等待gpiovalue文件的文件更改,就像使用inotify处理普通文件一样

    gpio-notify概述使用gpio-notify工具,您可以监视/ sys / class / gpio中文件的更改,就像使用inotify监视普通文件中的更改一样。 由于/ sys / class / gpio中的文件是内核创建的特殊文件,因此inotify无法识别对...

Global site tag (gtag.js) - Google Analytics