Hadoop集群优化手记

085567

浏览: 224349 次
性别:
来自: 北京

最近访客更多访客>>

zouhuiying

isy

zzr1000

bianqi

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

hadoop

Hadoop Linux

<property>
	<name>mapred.min.split.size</name>
	<value>268435456</value>
        <description>决定了每个 Input Split的最小值，也间接决定了一个Job的map 数目。
                          这里设置为256M，默认64M，有效减少了map的数量，因为在大数据量时，
                          map数量过大并不一定速度就快，而1个进程处理256M数据也是很快的</description>
</property>
<property>
	<name>mapred.compress.map.output</name>
	<value>true</value>
        <description>打开map输出压缩以节省各节点传输的流量</description>
</property>
<property>
	<name>io.sort.mb</name>
	<value>250</value>
        <description>map输出结果在内存占用buffer的大小，当buffer达到一定阈值，
                          会启动一个后台线程来对buffer的内容进行排序，然后写入本地磁盘(一个spill文件).默认100M，
                          有点小了，但并不是越大越好，尝试过调到400M，发现机器内存有点吃不消，又回调到250M</description>
</property>
<property>
	<name>mapred.reduce.parallel.copies</name>
	<value>10</value>
        <description>Reduce copy数据的线程数量，默认值是5</description>
</property>
<property>
	<name>mapred.job.shuffle.merge.percent</name>
	<value>0.8</value>
        <description>从Map节点取数据过来，放到内存，当达到这个阈值之后，
                          后台启动线程（通常是Linux native process）把内存中的数据merge sort，
                          写到reduce节点的本地磁盘；</description>
</property>

http://www.duyifan.com/?cat=1

分享到：

Hadoop常见问题及解决办法（2） | Sqoop

2011-03-16 15:21
浏览 1289
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hadoop集群优化手记

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hadoop集群优化手记

评论

发表评论

相关推荐

hadoop状态分析系统chukwa（转）

sqoop could not find any valid local directory 异常解决

Hadoop 数据类型与文件结构剖析 Sequence, Map, Set, Array, BloomMap Files

百度Hadoop分布式系统揭秘：4000节点集群

ERROR org.apache.hadoop.hdfs.server.namenode.NameNode: java.lang.NumberFormatExc

zookeeper安装

sqoop应用错误记录

Hadoop常见问题及解决办法（2）

Sqoop

海量数据处理相关资料

Hadoop中常出现的错误以及解决方法

直接使用HADOOP-RPC的编码实例

mapreduce技术的开源c语言实现

hadoop c++ 扩展

hadoop安全

RedHat上安装hadoop+hbase问题记录

redhat 5.4部署单机伪分布Hadoop集群

Interpreting the Data:Parallel Analysis with Sawzall（3）

Interpreting the Data:Parallel Analysis with Sawzall（2）

Interpreting the Data:Parallel Analysis with Sawzall（1）

最近访客更多访客>>