`

欢迎大家讨论hadoop性能优化

阅读更多

大家知道hadoop这家伙是非常吃内存的。除了加内存哦!

如果大家有什么好的优化方法的话,欢迎一起来讨论。

分享到:
评论
7 楼 yangfuchao418 2011-04-08  
现在hadoop多少米啊
6 楼 caoyangx 2011-04-07  
horse88sky 写道
hadoop先天不足的东西。优化什么呢?

说说不足吧
5 楼 p_x1984 2011-04-06  
可以设置mapred-site.xml。
4 楼 lance_123 2011-04-06  
LS是指NN的内存消耗吗?呵呵。。。
3 楼 gl2001wl 2011-04-06  
我倒是发现CPU吃的很多,
至于吃内存,应该看看是不是在map或者reduce任务里有创建新对象吧,不然效率很差!
2 楼 p_x1984 2011-04-06  
呵呵!怎么说?你用过他很多地方么!
1 楼 horse88sky 2011-04-06  
hadoop先天不足的东西。优化什么呢?

相关推荐

    集群Hadoop性能测试

    【集群Hadoop性能测试】是针对Hadoop分布式计算框架进行的一系列性能评估活动,目的是找出最佳配置以提升系统效率。测试方法主要通过shell自动化脚本来完成,包括生成配置文件、执行测试、记录时间以及恢复默认配置...

    大数据技术之Hadoop(优化&新特性).doc

    本文将重点讨论Hadoop在大数据处理中的优化与新特性,特别是关于数据压缩的方面。 首先,Hadoop 提供了多种数据压缩格式,包括 DEFLATE、Gzip、Bzip2、LZO 和 Snappy。每种压缩算法都有其特点。DEFLATE 是一种通用...

    Hadoop企业优化常用的调优参数.docx

    本文将详细讨论Hadoop调优的关键参数,分为资源相关参数、Shuffle性能优化参数以及容错相关参数。 1. **资源相关参数**: - `mapreduce.map.memory.mb` 和 `mapreduce.reduce.memory.mb` 分别设定MapTask和Reduce...

    20_尚硅谷大数据之MapReduce_Hadoop企业优化1

    本文主要围绕标题"20_尚硅谷大数据之MapReduce_Hadoop企业优化1"展开,讨论MapReduce优化的关键点。 首先,我们关注的是MapReduce程序效率的瓶颈,主要分为两大部分:计算机性能和I/O操作。计算机性能涉及CPU、内存...

    hadoop2.8.0 eclipse jb51

    标题“hadoop2.8.0 eclipse jb51”表明我们讨论的是Hadoop 2.8.0版本与Eclipse的集成,可能是通过jb51插件来实现。jb51可能是指JBoss Community的某个版本,也可能是一个特定的Eclipse插件或库,用于支持Hadoop开发...

    hadoop1.x与hadoop2.x配置异同

    接下来,我们将详细讨论Hadoop的安装过程,以及Hadoop1.x与Hadoop2.x之间的配置差异。 ### Hadoop的安装 #### Hadoop1.x安装 1. **下载Hadoop**:从Apache官方网站(http://www.us.apache.org/dist/hadoop/common)...

    Hadoop大数据开发与性能调优实战培训课程-Hadoop组件详解.rar

    此外,还会探讨HDFS的性能优化,如通过调整副本数量、块大小和I/O缓冲区大小来提高读写速度。 MapReduce部分,课程会介绍Map和Reduce函数的实现、JobTracker和TaskTracker的协调机制,以及shuffle和sort过程。对于...

    hadoop2.9.1 winutils.exe hadoop.dll

    标题中的"hadoop2.9.1"指的是Hadoop的版本号,这意味着我们讨论的是Hadoop 2.9.1版本。这个版本可能包含了多个优化和修复,以提供更稳定、高效的分布式存储和计算功能。 `winutils.exe`是Hadoop在Windows上的一个...

    software_hadoop.zip

    下面将详细讨论Hadoop的相关知识点。 1. **Hadoop架构**:Hadoop的核心由两个主要组件组成:HDFS(Hadoop Distributed File System)和MapReduce。HDFS是分布式文件系统,用于存储大量数据,而MapReduce则是一种...

    hadoop 索引相关记录

    标题中的“hadoop 索引相关记录”指的是在Hadoop MapReduce框架中与数据索引相关的技术。Hadoop是一个开源分布式计算框架,主要用于处理...对于想要深入理解和优化Hadoop性能的开发者来说,这是一个非常有价值的主题。

    Hadoop权威指南(英文原版)

    除了核心组件,书中还会讨论Hadoop生态系统中的其他工具和服务,如HBase(分布式数据库)、Hive(数据仓库工具)、Pig(高级数据流语言)、Oozie(工作流调度系统)、ZooKeeper(分布式协调服务)等。这些工具协同...

    Hadoop经典参考书

    此外,还会讨论Hive,一个基于Hadoop的数据仓库工具,用于数据ETL(提取、转换、加载)和分析。 预Hadoop时代的相关技术也是本书的重点之一。这可能包括早期的分布式计算框架,如GFS(Google File System)和Pregel...

    史上最全--HADOOP权威指南 第3版带目录书签 完整版

    7. **安全与隐私**:讨论Hadoop的安全特性,如HDFS的权限控制、Kerberos认证、Hadoop的安全模式以及数据加密等。 8. **实战案例**:书中提供了丰富的实际案例,帮助读者将理论知识应用到实际项目中,提升解决实际...

    高清大放送 Hadoop权威指南第3版 和 第4版 PDF

    这一版本特别强调了Hadoop在企业环境中的实际应用,包括数据处理的最佳实践、性能优化策略以及故障排查方法。此外,第三版还更新了Hadoop的新特性,如Hadoop 2.x引入的YARN,它改进了资源管理和调度机制,使得Hadoop...

    hadoop-3.1.1.tar.gz

    下面将详细讨论Hadoop 3.1.1的关键知识点。 1. 分布式文件系统(HDFS):Hadoop的核心组件之一是Hadoop分布式文件系统(HDFS),它是一个高度容错性的系统,设计用于在廉价硬件上运行。在Hadoop 3.1.1中,HDFS支持...

    hadoop-3.0.0.zip

    下面将详细讨论Hadoop 3.0.0的关键知识点。 一、Hadoop的架构 Hadoop的核心组件包括Hadoop Distributed File System (HDFS)和MapReduce。HDFS是一个分布式文件系统,能够存储和处理海量数据;MapReduce则是一种编程...

    Hadoop权威指南-Hadoop中文文档-第三版本

    书中会讨论Hadoop中的权限控制、加密和审计机制,以保护数据不被未经授权的访问。 7. **Hadoop的扩展和优化**:包括YARN的资源调度策略、HDFS的性能调优,以及如何通过Hadoop与其他技术(如NoSQL、云存储)集成来...

    Hadoop全部课件.zip

    6. **性能优化**:讨论Hadoop集群的调优技巧,如调整副本数量、优化MapReduce参数、磁盘I/O优化等,以提升系统效率。 7. **安全性与权限管理**:介绍Hadoop的安全机制,如Kerberos认证,HDFS的ACLs(Access Control...

    Hive及Hadoop作业调优

    文档内容围绕Hadoop生态系统中的两个主要组件Hive和Hadoop进行展开,对它们的工作原理、性能调优策略等方面进行了深入讨论。 首先,Hive是建立在Hadoop上的一个数据仓库工具,可以将结构化的数据文件映射为一张...

Global site tag (gtag.js) - Google Analytics