原文转自:http://liaofeng-xiao.iteye.com/blog/1990577
最直接的学习Beanstalkd的方式就是读官方协议文档:
https://raw.github.com/kr/beanstalkd/master/doc/protocol.txt
beanstalkd是一个快速的、通用目的的work queue。协议简单,是个轻量级的消息中间件。
“(Beanstalkd) is a simple, fast workqueue service. Its interface is generic, but was originally designed for reducing the latency of page views in high-volume web applications by running time-consuming tasks asynchronously.”
beanstalkd的最初设计意图是在高并发的网络请求下,通过异步执行耗时较多的请求,及时返回结果,减少请求的响应延迟。
使用场景:
* long running task
* intensive task
examples:
* send email
* processing image/video
advantages:
1. asynchronous/unblock
2. scales easy: run more workers. workers can be distributed across a number of machines
3. call functions written in other languages
How it works:
* Queues: Acts as a job buffer between producer and worker
* Daemon: when job is released to a worker
* Producer: create the job and put it to the queue
* Worker: get a job from the queue, and deal with it
Comparison:
1. Queueing with a database: not so well suited, especially with high transactions, it costs locking to ensure only on worker can get a job.
2. ActiveMQ
3. RabbitMQ: written in Erlang, brought by VMVare
4. Amazon SQS
5. Gearman, by livejournal
6. ZeroMQ
7. Sparrow
Killer Features:
* tube
* priority
* delays
* TTR
它支持优先级队列(priority queue)、延迟(delay)、超时重发(time-to-run)和预留(buried),能够很好的支持分布式的后台任务和定时任务处理。
它的内部采用libevent,服务器-客户端之间采用类似Memcached的轻量级通讯协议,因此性能很高(enque: 9000 jobs/second, worker: 5200 jobs/second)
尽管是内存队列,beanstalkd提供了binlog机制,当重启beanstalkd,当前任务的状态能够从记录的本地binlog中恢复。
tube(管道):
类似于topic,一个Beanstalkd可以支持多个tube,每个tube有自己的producer/worker,tube之间相互不影响。一个job的生命周期永远都会在同一个tube中。
job优先级:job可以有0~2^32个优先级,0代表最高优先级,小于1024的优先级beanstalkd认为是urgent。beanstalkd使用最大最小堆来实现优先级排序,任何时刻调用reserve命令,拿到的都是优先级最高的job,时间复杂度是O(longn)。
delay job: 两种方式可以实现delay:
* put with delay
* release with delay
但是,什么情况下使用delay job?
任务超时重发:time-to-run
如果一个client/worker/consumer获取到job之后,在ttr时间内没有处理完,即,没有通过delete/release/bury改变任务的reserve状态,beanstalkd认为消息处理失败。如果worker在预计在ttr时间内不能处理完job,可以发送touch命令,让beanstalkd从现在开始重新计算ttr。
buried(预留任务):
如果job因为某些原因暂时无法执行,worker可以先把job置为buried状态。buried状态的job不能被任何worker reserve。管理员可以通过peek buried查看有多少预留job,进行人工干预。kick <n>可以一次线的把n条buried job踢回到ready状态。
beanstalkd协议:
Beanstalkd采用类似Memcached的文本协议,客户端和服务器通信通过文本进行。这些通信的命令可以总结为以下三类:
1. producer
a. use <tube>
b. put <priority> <delay> <ttr> [bytes]
2. worker
a. watch <tube>
b. reserve: it will block if no job is ready. or reserve-with-timeout, set timeout to 0, beanstalkd will return a job immediately, or none.
c. delete <id>
d. release <id> <priority> <delay>
e. bury <id>
f. touch <id>
3. maintainer
a. peek job
b. peek delayed
c. peek ready
d. peek buried
e. kick <n>
状态转换图:
put with delay release with delay
----------------> [DELAYED] <------------.
| |
kick | (time passes) |
| |
put v reserve | delete
-----------------> [READY] ---------> [RESERVED] --------> *poof*
^ ^ | |
| \ release | |
| `-------------' |
| |
| kick |
| |
| bury |
[BURIED] <---------------'
|
| delete
`--------> *poof*
Beanstalkd不足:
1. 没有提供主从同步+故障切换机制,在应用中有可能成为单点的风险。在实际应用中,可以使用数据库为job提供持久化存储。
2. 和Memcached类似,Beanstalkd依赖libevent单线程事件分发机制,不能有效的利用多核cpu的性能。这一点可以通过单机部署多个实例客服。
本地体验:
1. 运行beanstalkd:beanstalkd
2. telnet localhost 11300
连上后可以发送各种命令:stats
Questions:
1. if a job runs out TTR, the worker will stop processing the job? or two workers may be working on the same job.
definitely is.
2. how to experience Beanstalkd conviently in local, for example, three terminals: producer/worker/maintainer
use telnet please(use `quit` to quit terminal), or use beanstalkc client.
producer:
telnet localhost 11300
stats-tube default
use today
put 1000 0 10 11
hello world
worker:
telnet localhost 11300
watch today
ignore default
reserve( or reserve-with-timeout 0)
bury 1000 <id>
kick <number>
delete <id>
maintainer:
stats-tube today
peek <id>
stats-job <id>
peek-ready [如果返回not-found,说明该tube还没有ready的job(使用use切换tube)
peek-delayed
job-stats <id>
kick <number>
Refers:
1. Protocol: https://raw.github.com/kr/beanstalkd/master/doc/protocol.txt, or https://github.com/kr/beanstalkd/blob/master/doc/protocol.md
2. PPT: http://alister.github.io/presentations/Beanstalkd/
3. http://nubyonrails.com/articles/about-this-blog-beanstalk-messaging-queue
Beanstalkc:
https://github.com/earl/beanstalkc/
Beanstalkc is a simple beanstalkd client librayr for Python. beanstalkd is a fast, in-memory workqueue service.
Beanstalkc depends on PyYAML, but there are ways to avoid this dependency.
Beanstalkc is pure python, and is compatible with eventlet and gevent.
Usage:
import beanstalkc
beanstalkd = beanstalkc.Connection(host="localhost", port="11300")
job = beanstalkd.reserve()
print job.body
....
job.delete()
Reference: https://github.com/earl/beanstalkc/blob/master/beanstalkc.py
tutorial: http://beanstalkc.readthedocs.org/en/latest/tutorial.html
beanstalkc好简单,只有Connection和Job两个类。
分享到:
相关推荐
Beanstalkd是一款轻量级、高性能的分布式工作队列系统,常被用于处理大量异步任务,实现系统间的解耦合。它通过提供一个简单的TCP协议接口,使得开发者能够轻松地将任务放入队列,然后由后台进程进行处理。这个系统...
**Beanstalkd测试客户端** Beanstalkd是一款轻量级、高性能的分布式工作队列系统,它可以帮助开发者构建可扩展的应用程序,通过异步处理任务来提高应用的响应速度。本项目提供了一个测试客户端,用于与Beanstalkd...
Beanstalkd是一款轻量级、高性能的分布式工作队列系统,它设计的目标是提供简单、快速且无锁的队列服务。Beanstalkd使用了类似于memcache的文本协议,使得它易于实现客户端库,包括PHP这样的脚本语言。 在PHP中,...
Beanstalkd是一款轻量级、高性能的工作队列服务器,它主要设计用于在Web应用程序中处理异步任务。这个“beanstalkd-1.4.6”安装包是Beanstalkd的1.4.6版本,提供了在服务器上部署和运行Beanstalkd服务所需的所有文件...
Beanstalkd,一个高性能、轻量级的分布式内存队列系统,最初设计的目的是想通过后台异步执行耗时的任务来降低高容量Web应用系统的页面访问延迟,支持过有9.5 million用户的Facebook Causes应用。后来开源,现在有...
Beanstalkd分布式内存队列系统 的 spring boot starter 封装 部署 beanstalkd 服务 docker run -d -p 11300:11300 schickling/beanstalkd ② 引入依赖 <groupId>com.pig4cloud.beanstalk</groupId> <artifactId>...
`laravel-async-beanstalkd` 是一个专门为Laravel框架设计的Beanstalkd异步队列驱动程序,它允许开发者充分利用Beanstalkd的优势来优化 Laravel 应用。 首先,理解Laravel的队列系统至关重要。Laravel队列允许...
Beanstalkd中文使用手册 Beanstalk,一个高性能、轻量级的分布式内存队列系统,最初设计的目的是想通过后台异步执行耗时的任务来降低高容量Web应用系统的页面访问延迟,支持过有9.5 million用户的Facebook Causes...
`go-beanstalk`作为`beanstalkd`的Go语言客户端,提供了丰富的API接口,使开发者能够方便地与`beanstalkd`进行交互。它的主要功能包括连接管理、tube(队列)操作、任务发布与消费等。例如,你可以使用`go-beanstalk...
beanstalkd分布式队列的java客户端,支持连接池,性能为原生的10-20倍。
running on linux x86 64bit
**Python使用Beanstalkd进行异步任务处理** Beanstalkd是一款轻量级的、高性能的分布式作业队列系统,常用于实现异步任务处理。它能够帮助开发者将耗时的操作从主线程中分离出来,提高应用程序的响应速度。在Python...
Beanstalkd的配置文件通常位于/etc/default/beanstalkd,其中BEANSTALKD_LISTEN_ADDR和BEANSTALKD_LISTEN_PORT配置项分别用于设置监听的IP地址和端口。通过允许所有连接(*.*.*.*)并放开-b参数,内存中的队列消息...
关于beanstalk博客中有文章介绍了beanstalkd消息队列服务端的安装,以及php里关于beanstalk扩展的安装,有两种方式,我使用的是第二种connect方法连接服务端,并使用php安装扩展不采用php类文件。当前已安装好bean...
Beanstalkd是一个高性能、轻量级的分布式内存队列系统,它的设计初衷是通过后台异步执行耗时的任务来降低高容量Web应用系统的页面访问延迟。具有如下功能特点。 高性能与轻量级:Beanstalkd是一个高效的内存队列系统...
Beanstalkd Docker存储库 使用方法: docker pull jonbaldie/beanstalkd 或者,您可以git clone仓库, make从项目根目录运行make 。 (c)2017乔纳森·巴尔迪
BeanstalkD 工人示例 这个示例项目只是 beanstalkd 工作器的一个非常快速的实现。...最后的笔记 如果你觉得这个包有用,请在 github 上Star它。 随意分叉或提供拉取请求。 任何错误报告都会受到热烈欢迎。
**beanstalkd与beanstalkd_exporter** beanstalkd是一个轻量级、高性能的作业队列服务器,主要用于处理异步任务。它采用C语言编写,设计简洁,易于部署和使用。beanstalkd的核心功能是存储和调度工作任务,使得应用...