`
xiaoyu966
  • 浏览: 258283 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

基于Gearman的MapReduce分布式计算

阅读更多

============================================================================

原创作品,允许转载。转载时请务必以超链接形式标明原始出处、以及本声明。

请注明转自:http://yunjianfei.iteye.com/blog/

============================================================================

       针对大数据的处理,我们无非采用“分而治之”的策略,2004年goole的<MapReduce: Simplified Data Processing on Large Clusters>这个论文提出并阐述了MapReduce的概念。再到之后的开源版本Hadoop的出现,以及今天的大规模使用。

 

      最近一直在做分布式计算方面的事情。一说起这个,大家难免想到hadoop,目前hadoop2.2已经非常的强大,能做非常多的事情。但是有时候针对一些业务模型显得过于庞大何臃肿。

 

     Gearman是一套非常不错的分布式处理框架,灵活的架构,轻量级的设计,强大的分发功能,以及各个语言的支持,都让人眼前一亮。

 

      最近调研的时候,在slides上发现了非常不错的资源,在这里分享给大家,主要是使用Perl + Gearman 实现了MapReduce的一个demo,这个对于我们做分布式计算和开发大有好处,希望大家好好看一下。里面是包含PPT和demo源码的。

 

      至于Gearman的学习,网上有很多的资料,或者直接去官网http://gearman.org/getting-started/ 

我这里就不再重复了。

 

    附件中基于Gearman的MapReduceDemo.rar 是包含ppt和源码的。

   mapreduce-osdi04.pdf 是google的那么mapreduce论文。

   

1
1
分享到:
评论

相关推荐

    gearman-distributed-job:熟悉Gearman的分布式工作

    Gearman是一种开源的分布式任务队列系统,它允许应用程序在多台机器上分发工作,以便充分利用计算资源,实现负载均衡和高可用性。在Java环境中,我们可以利用Gearman库来构建分布式工作流程,实现任务的异步处理和...

    Gearman C# API和示例

    在实际应用中,Gearman可以用于各种场景,例如批量数据处理、图片缩略图生成、电子邮件发送等耗时或计算密集型任务。通过 Gearman C# API,你可以轻松地将这些任务解耦,让它们在后端集群中并行处理,提高系统的整体...

    gearman-mysql-udf-0.6.tar.gz

    - **概念**:Gearman 是一种开源软件,设计用于负载均衡和分布式计算,通过工作队列来解耦任务创建者和任务执行者。 - **工作模式**:客户端提交任务到 Gearman 服务器,服务器将任务分发给等待工作的工人进程,...

    Laravel开发-php-gearman

    综上所述,Laravel 结合 PHP Gearman 提供了一个强大而灵活的解决方案,用于处理异步任务和分布式计算,极大地提升了系统的整体性能和可靠性。在实际开发中,根据项目需求,可以灵活地调整任务处理策略,实现高效的...

    gearman 文档

    ### Gearman文档与集群计算框架的关键知识点 #### 一、Gearman概述 **Gearman**是一种分布式任务调度框架,主要用于跨机器或者同一机器上的不同进程之间分发任务。它允许开发者将任务分解并分配给一组工作节点...

    Gearman环境搭建资料

    Gearman是一种分布式任务队列系统,它允许应用程序在不同的服务器之间分发工作负载,从而实现负载均衡和异步处理。本篇文章将详细讲解如何在Linux环境中搭建Gearman,包括依赖库的安装和Gearman服务的配置。 首先,...

    分布式图片处理平台解决方案

    为了解决这一问题,金山逍遥网提出了一种基于Gearman分布式计算框架的DIPS(Distributed Image Processing System)分布式图片处理平台。该平台旨在通过合理分配服务器资源,特别是那些CPU利用率较低但具备较高计算...

    Gearman中文手册,Gearman中文详解,gearman手册chm

    Gearman中文手册,gearman手册chm,Gearman中文详解,分享gearman技术心得,主要是为了分享技术,所以不要大家的资源分。

    gearman-ruby:官方! 用于Gearman分布式作业系统的Ruby库

    这是用于分布式作业系统的纯Ruby库。 需要做什么? 更多测试,一些代码清除。 这到底是什么 目前,该库对Ruby应用程序具有客户端和工作程序支持。 入门 客户 一个非常简单的客户端,它提交“睡眠”作业并等待100秒...

    Laravel开发-laravel-gearman-rpc

    在现代Web开发中,异步任务处理和分布式计算已经成为提升系统性能的关键技术。Laravel作为PHP的流行框架,提供了丰富的工具来支持这类需求。本篇文章将深入探讨如何在Laravel项目中集成Gearman,构建RPC(远程过程...

    gearman下载gearman下载

    在实际应用中,Gearman可以广泛应用于大数据处理、后台任务执行、实时计算等场景,通过其强大的异步处理能力和分布式特性,提升系统的响应速度和可扩展性。使用Gearman Java客户端,开发者可以轻松地在Java应用中...

    Gearman java APIs和一个小Demo

    Gearman 是一个分布式任务队列系统,它允许应用程序在需要时分发工作负载,并在有可用资源时异步处理这些工作。在Java中,我们可以利用 Gearman 的客户端库来与 Gearman 服务器进行交互,执行分布式任务。本篇文章将...

    基于非关系数据库的分布式负载均衡技术.pdf

    总之,基于非关系数据库的分布式负载均衡技术是一个多维度、多层次的优化技术,它结合了非关系数据库的特性、动态负载均衡策略和异步计算的优势,旨在为分布式系统提供更加高效、可靠和灵活的性能保证。通过这种方式...

    GearMAN讲解及所带来的变革

    GearMAN是一个高效的分布式任务框架,最初设计用于解决Web2.0环境中图片...无论是在高并发场景下任务分配的高效率,还是在系统稳定性、易用性方面的表现,GearMAN都为解决大规模计算任务提供了一种高效可靠的解决方案。

    net_gearman-master.zip

    在PHP的世界里,Gearman是一个强大的分布式任务处理框架,它允许开发者将任务分发到多台服务器上执行,从而实现负载均衡和异步处理。本文将深入探讨net_gearman-master.zip,这是一个专为PHP设计的Gearman客户端插件...

    Gearman Worker实例 C++ vs2008

    Gearman是一个分布式任务队列系统,它允许应用程序将工作分发到多个服务器或进程,以实现负载均衡和异步处理。在本实例中,我们关注的是如何在C++环境中,利用Visual Studio 2008(VS2008)在Windows平台上创建一个...

    Gearman中文手册最新完整版chm

    Gearman中文手册,gearman手册chm,Gearman中文详解,分享gearman技术心得,主要是为了分享技术,所以不要大家的资源分。

    php使用gearman进行任务分发操作实例详解

    1. Gearman的介绍和应用场景: Gearman是一个工作负载分发服务器和库,允许将工作分散到多个机器或者机器上的多个核心上进行异步处理。它在Web应用程序中处理耗时的后台任务时尤其有用,如文件上传、邮件发送、图片...

    gearman-1.0.2.tgz

    Gearman 是一个开源的分布式任务队列系统,它允许应用程序将耗时的任务分发到多台机器上异步处理,从而提高系统的响应速度和整体性能。`gearman-1.0.2.tgz` 是 Gearman 的一个特定版本,即 1.0.2 版本的源代码压缩包...

    gearman-java.zip_BadMagicException_Gearman java

    Gearman是一个分布式任务队列系统,它允许应用程序在任何地方运行任务,而无需关心它们在哪里运行或如何运行。Gearman-Java是Java语言对Gearman的客户端库,它提供了与Gearman服务器通信的能力,用于分发工作负载...

Global site tag (gtag.js) - Google Analytics