`
阅读更多
很多人是通过wordcount入门分布式并行计算, 该demo演示了Hadoop的经典实例wordcount的实现 输入数据:n个数据文件,每个1g大小,为了方面统计,每个文件的数据由“aaa bbb ... ccc”(由空格分割的1k单词组)不断复制组成。 输出数据:输出这n*1g个数据文件中的每个单词总数 fourinone简单实现思路,假设有n台计算机,将这n个1g数据文件放置在每台计算机上,每台计算机各自统计1g数据,然后合并得到结果 WordcountCT:为一个工头实现,它把需要处理的数据文件名称发给各个工人,然后用一个HashMap<string> wordcount的map用来装结果 WordcountWK:为一个工人实现,它按照每次读取8m的方式处理文件数据,将文件大小除以8m得到总次数,每次处理过程将字符串进行空格拆分,然后放入本地一个map里,完成后将此map发给工头 ParkServerDemo: 分布式计算过程的协同服务park 运行步骤: 1、启动ParkServerDemo(它的IP端口已经在配置文件的PARK部分的SERVERS指定) 2、运行WordcountWK, 通过传入不同的端口指定多个Worker,这里假设在同机演示,ip设置为localhost 3、运行WordcountCT,传入文件路径(假设多个工人处理相同数据文件) 思维发散:如果将以上实现部署到分布式环境里,它是1*n的并行计算模式,也就是每台机器一个计算实例,fourinone可以支持充分利用一台机器的并行计算能力,可以进行n*n的并行计算模式,比如,每台机器4个实例,每个只需要计算256m,总共1g,这样整体的速度会大幅上升,以下是就wordcount和hadoop的运行对比结果: </string>
分享到:
评论
2 楼 fourinone 2013-07-27  
datawarehouse 写道
以上没有结果啊

这里文章编辑器有点问题,修改不了内容。
建议你下载jar包去看,里面也有wordcount指南和demo
1 楼 datawarehouse 2012-10-09  
以上没有结果啊

相关推荐

    淘宝fourinone 架构原理

    【淘宝FourInOne架构原理详解】 淘宝FourInOne是一款由阿里巴巴集团自主研发的轻量级并行计算框架,它主要用于解决大规模分布式系统中的高并发、低延迟的问题,为电商平台如淘宝提供强大的数据处理能力。该框架的...

    大数据与云计算培训学习资料 Fourinone实现分布式计算 共3页.pdf

    Fourinone是淘宝自主研发的一个分布式并行计算框架,它巧妙地整合了Hadoop、ZooKeeper、MQ(消息队列)和分布式缓存这四大关键组件,为开发者提供了全面的分布式计算解决方案。 **Fourinone的功能特性:** 1. **...

    淘宝分布式并行计算四合一框架Fourinone

    《淘宝分布式并行计算四合一框架Fourinone》 ...阅读《淘宝分布式并行计算四合一框架Fourinone.pdf》文件,可以深入理解其设计理念、实现原理以及具体应用案例,对于理解和实践分布式系统有着极高的价值。

    淘宝分布式框架fourinone介绍.pptx

    【淘宝分布式框架Fourinone详解】 Fourinone是一款由淘宝开发的轻量级分布式框架,其核心目标是通过整合分布式计算、分布式缓存、一致性、消息队列和分布式文件系统等关键技术,为大型互联网应用提供强大的计算能力...

    Fourinone分布式计算框架

    - Fourinone测试基于本地文件I/O,使用Fourinone提供的FileAdapter进行本地文件读取。 - Hadoop测试基于HDFS文件I/O,blockSize为默认的64M。 - **算法说明:** - **Fourinone:** 工人按照8M buffer读取速度统计...

    淘宝分布式框架fourinone介绍.pdf

    Hadoop是目前广泛使用的另一个分布式计算框架,但与Fourinone相比,Hadoop的结构更加复杂,它不仅包含了多个jar包依赖,而且配置过程也相对繁琐。而Fourinone的设计理念是简洁和高效,它的实现方式倾向于内存计算和...

    fourinone配置文件

    fourinone号称了集成了hadoop,zk,memcache,mq于一身的四不像超级神器,...自己用socket或者NIO实现,要知道用NIO实现一个网络通讯框架是很考验技术功底。在运行的时候需要配置文件,此配置为fourinone-4.17.10配置文件

    分布式计算的fourinone四合一框架设计

    Fourinone框架是将分布式协同的技术性和故障处理的可行性,把Hadoop、Zookeeper、MQ和分布式缓存的功能合并成一个框架。Fourinone采用的是domain/node两层结构,不仅保持了Zookeeper最本质的稳定性,而且还简化Watch...

    Fourinone分布式并行计算四合一框架

    基于Fourinone可以轻松实现分布式配置信息,集群管理,故障节点检测,分布式锁,以及淘宝configserver等等协同功能。  其次, Fourinone可以提供完整的分布式缓存功能。如果对一个中小型的互联网或者企业应用,仅仅...

    fourinone源代码分析

    fourinone是一款分布式协调服务框架,它的设计思路是将任务分配者(工头)和任务执行者(工人)通过一个协调者(职介所)进行连接,实现任务的分布式处理。这个框架的核心概念包括工头进程、工人进程以及职介所服务...

    fourinone-3.04.25

    淘宝Fourinone(中文名字“四不像”)是一个四合一分布式计算框架,在写这个框架之前,我对分布式计算进行了长时间的思考,也看了老外写的其他开源框架,当我们把复杂的hadoop当作一门学科学习时,似乎忘记了我们想...

    fourinone-master.zip

    "四不像"(FourInOne)是淘宝开发的一款轻量级分布式系统框架,它以其小巧精悍的特性深受开发者喜爱,成为学习分布式系统的重要参考资料。本篇文章将围绕"fourinone-master.zip"这个压缩包,深入剖析四不像的核心...

    【Hadoop与大数据54】沈强-基于Windows Azure平台构建云应用

    本篇文章主要探讨了在Windows Azure平台上构建云应用时所使用的分布式框架——Fourinone 2.0,及其与Hadoop的比较分析。文章由一位资深Java技术专家撰写,他拥有超过十年的Java技术领域经验,曾担任淘宝网高级技术...

    学习资料:淘宝分布式并行计算四合一框架Fourinone

    学习资料:淘宝分布式并行计算四合一框架Fourinone 内容:淘宝分布式并行计算四合一框架Fourinone详细介绍;源码分析及使用说明;Fourinone分布式计算框架性能、压力、容灾测试报告;框架压缩包 本示例把分配任务的...

    Fourinone分布式计算框架性能、压力、容灾测试报告

    与Hadoop相比,Fourinone在处理上亿级别的排序任务和WordCount等基础大数据运算时表现出更优的性能。这表明Fourinone在算法优化和资源调度上可能有独特的设计,能够更好地应对大规模并行计算的需求。 其次,报告中...

    fourinone-2.05.28.rar

    淘宝Fourinone2.0提供了一个4合1分布式框架和简单易用的编程API,实现对多台计算机CPU,内存,硬盘的统一利用,从而获取到强大计算能力去解决复杂问题。Fourinone框架提供了一系列并行计算模式(农民工/包工头/职...

    高级java笔试题-fourinone:Fourinone项目

    也就是说,fourinone在一个简单的jar中集成了Hadoop、Zookeeper、Memcache、MQ四大功能! 它只有150k大小,没有任何依赖性,非常方便嵌入您的系统使用。 Fourinone 项目 Fourinone 1.0 版本:淘宝Fourinone(中文...

    fourinone分布式协调设计解析

    2. 分布式队列:FourInOne使用ZooKeeper的顺序节点实现FIFO(先进先出)队列。每个入队操作都会创建一个顺序节点,出队则是按照节点的顺序进行。这种方式既保证了队列的线性化,又能在分布式环境下实现高并发。 3. ...

Global site tag (gtag.js) - Google Analytics