`
085567
  • 浏览: 217381 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

hadoop与sector/sphere对比

阅读更多
转自http://blog.c114.net/html/71/482871-61386.html


实现语言:
hadoop: java
sector: c 和c++混合java
从实现语言看sector的速度应该会更好,java对于大数据计算来讲,内存是个灾难。

网络传输:
hadoop自己用java实现,当然最底层用的是linux的最新epoll事件驱动方式,TCP。
Sector/Sphere用的是UDT,开源的UDP传输代码。
单从速度上看UDT应该更有优势。
其实本人看好将来用SCTP实现的可靠报文传输。

文件系统:
都支持多种文件系统,都有实现自己的文件系统,最底层都用linux文件系统。同一个文件都可以有多个拷贝,所有都可以容错。
hadoop对于文件会分块存储。
sector不对文件分块。
单从文件处理来说,很难比较优劣,但是Hadoop在上面加入数据库层之后,数据库的大存储文件分块来讲会更有优势。

组网方式:
都是几个主节点,加上多个计算节点。都是客户端跟计算节点直接传输文件。都有操作shell。负载都可以自动平衡。
没有优劣。

安全:
都有安全考虑,但是sector考虑更全面。

map/reduce实现:
hadoop上面加入自己的map.reduce代码更简单。secotr用所谓UDF实现map、reduce,对于自己实现来说门槛更高。
另外hadoop提供了map实现时的默认比较类,排序类,分区类。secotr则都要自己实现,当然这样子就更灵活。

都有系统监控界面,hadoop加入jetty来实现web式监控,符合当前潮流,sector还是用文本方式监控,占用资源更少,但是不美观
分享到:
评论

相关推荐

    hadoop/etc/hadoop/6个文件

    hadoop/etc/hadoop/6个文件 core-site.xml hadoop-env.sh hdfs-site.xml mapred-site.xml yarn-env.sh yarn-site.xml

    hadoop/bin/hadoop.dll

    标题中的"hadoop/bin/hadoop.dll"指出这是一款与Hadoop框架相关的动态链接库(DLL)文件,它位于Hadoop安装目录的"bin"子目录下。在Windows操作系统中,DLL文件是程序运行所必需的组件,它们包含了可执行文件在运行...

    hadoop安装过程中的问题

    Hadoop/etc/hadoop/slaves 的IP地址要变。 5个重要的配置文件逐个检查,IP地址需要变 2.配置文件确认无错误,看日志: 从logs日志中寻找slave的namenode为什么没有起来。 3.最后发现是hdfs中存在上次的数据,删掉...

    hadoop安装与配置 Hadoop的安装与配置可以分成几个主要步骤: 1. 安装Java 2. 下载Hadoop 3. 配

    hadoop安装与配置 hadoop安装与配置 Hadoop的安装与配置可以分成几个主要步骤: 1. 安装Java 2. 下载Hadoop 3. 配置Hadoop ...编辑/usr/local/hadoop/etc/hadoop/hadoop-env.sh,设置JAVA_HOME: export JAVA_H

    hadoop-lzo-0.4.20.jar

    hadoop支持LZO压缩配置 将编译好后的hadoop-lzo-0.4.20.jar 放入hadoop-2.7.2/share/hadoop/common/ core-site.xml增加配置支持LZO压缩 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> ...

    elephantdb, 在从Hadoop导出键/值数据时,分布式数据库专用.zip

    elephantdb, 在从Hadoop导出键/值数据时,分布式数据库专用 ElephantDB 0.5.1 ( cascalog-2.x ) ElephantDB 0.4.5 ( cascalog-1.x )ElephantDB是一个专门用于从Hadoop导出键/值数据的数据库。 Elephant

    Hadoop/HDFS/MapReduce/HBase

    对Hadoop中的HDFS、MapReduce、Hbase系列知识的介绍。如果想初略了解Hadoop 可下载观看

    hadoop-lzo-master

    1.安装 Hadoop-gpl-compression ...1.2 mv hadoop-gpl-...bin/hadoop jar /usr/local/hadoop-1.0.2/lib/hadoop-lzo-0.4.15.jar com.hadoop.compression.lzo.LzoIndexer /home/hadoop/project_hadoop/aa.html.lzo

    Windows平台下Hadoop的Map/Reduce开发

    在Windows平台上进行Hadoop的Map/Reduce开发可能会比在Linux环境下多一些挑战,但通过详细的步骤和理解Map/Reduce的工作机制,开发者可以有效地克服这些困难。以下是对标题和描述中涉及知识点的详细说明: **Hadoop...

    eclipse连接hadoop插件2.6.0/5 2.7.3

    Hadoop插件为Eclipse提供了与Hadoop集群交互的功能,包括创建Hadoop项目、编写MapReduce程序、配置运行环境、调试和部署等。它简化了开发过程,使得开发者能够在本地环境中模拟Hadoop集群的行为,提高开发效率。 2...

    hadoop/bin/winutils.exe

    1. **下载**:首先,你需要从可靠的源下载与你的Hadoop版本兼容的`winutils.exe`文件。这通常可以在Hadoop的GitHub镜像或者Apache Hadoop官方网站上找到。 2. **放置位置**:将`winutils.exe`放到Hadoop的`bin`目录...

    hadoop2.2.0/2.6.0/2.7.0/2.7.1 64位安装包

    hadoop2.2.0/2.6.0/2.7.0/2.7.1 64位安装包。

    [整理]Centos6.5 + hadoop2.6.4环境搭建

    配置Hadoop的配置文件,如`etc/hadoop/core-site.xml`和`etc/hadoop/hdfs-site.xml`。这些配置包括Hadoop的临时目录、NameNode和DataNode的数据存储位置等。这里是一个基本的配置示例: ```xml <!-- core-site.xml ...

    hadoop-3.0.0.tar.gz

    Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据...

    mac hadoop2.6.0 lib/native

    mac下Hadoop native library,用于解决报错:WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform… using builtin-java classes where applicable。再次说明,本版本只适用于mac ...

    hadoop单机配置方法

    ### Hadoop单机配置详解 在大数据处理领域,Apache Hadoop是一个开源软件框架,用于分布式存储和处理大型数据集。本文将详细介绍如何在单机环境下配置Hadoop,使其能够运行基本的大数据处理任务。 #### 一、配置...

    hadoop2.6.0的源码jar hadoop-common-2.6.0-sources.jar

    下载hadoop2.6.0的源码辛苦编译成的,网上没找到编译好现成的,费了几个小时用maven编译好的带源码的jar包,中间还得安装编译protoc,可以直接供eclipse使用。

    Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04

    Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04 本教程主要讲述了在 Ubuntu 16.04 环境下安装 Hadoop 2.7.1 的步骤,包括单机模式、伪分布式模式和分布式模式三种安装方式。以下是本教程的知识点总结...

Global site tag (gtag.js) - Google Analytics