`

hadoop 配置机架感知

 
阅读更多

假如设备链接层次分3层,第一层交换机d1下面连多个交换机rk1,rk2,rk3,rk4,…. 每个交换机对应一个机架。

d1(rk1(hs11,hs12,…),rk2(hs21,hs22,…), rk3(hs31,hs32,…),rk4(hs41,hs42,…),…)

可以用程序或脚本完成由host到设备的映射。比如,用python,生成一个topology.py:

然后在core-site.xml中配置
<property>
<name>topology.script.file.name</name>
<value>/home/hadoop/hadoop-1.1.2/conf/topology.py</value>
<description> The script name that should be invoked to resolve DNS names to
NetworkTopology names. Example: the script would take host.foo.bar as an
argument, and return /rack1 as the output.
</description>
</property>

 

python机架脚本:

[hadoop@hs11 conf]$ cat topology.py
#!/usr/bin/env python

”’
This script used by hadoop to determine network/rack topology. It
should be specified in hadoop-site.xml via topology.script.file.name
Property.
topology.script.file.name
/home/hadoop/hadoop-1.1.2/conf/topology.py

To generate dict:
for i in range(xx):
#print “\”hs%d\”:\”/rk%d/hs%d\”,”%(i,(i-1)/10,i)

print “\”hs%d\”:\”/rk%d\”,”%(i,(i-1)/10)

Andy 2013.7.23
”’

import sys
from string import join

DEFAULT_RACK = ‘/rk0′;

RACK_MAP = {
“hs11″:”/rk1″,
“hs12″:”/rk1″,
“hs13″:”/rk1″,
“hs14″:”/rk1″,
“hs15″:”/rk1″,
“hs16″:”/rk1″,
“hs17″:”/rk1″,
“hs18″:”/rk1″,
“hs19″:”/rk1″,
“hs20″:”/rk1″,
“hs21″:”/rk2″,
“hs22″:”/rk2″,
“hs23″:”/rk2″,
“hs24″:”/rk2″,
“hs25″:”/rk2″,
“hs26″:”/rk2″,
“hs27″:”/rk2″,
“hs28″:”/rk2″,
“hs29″:”/rk2″,
“hs30″:”/rk2″,
“hs31″:”/rk3″,
“hs32″:”/rk3″,
“hs33″:”/rk3″,
“hs34″:”/rk3″,
“hs35″:”/rk3″,
“hs36″:”/rk3″,
“hs37″:”/rk3″,
“hs38″:”/rk3″,
“hs39″:”/rk3″,
“hs40″:”/rk3″,
“hs41″:”/rk4″,
“hs42″:”/rk4″,
“hs43″:”/rk4″,
“hs44″:”/rk4″,
“hs45″:”/rk4″,
“hs46″:”/rk4″,

“10.10.20.11″:”/rk1″,
“10.10.20.12″:”/rk1″,
“10.10.20.13″:”/rk1″,
“10.10.20.14″:”/rk1″,
“10.10.20.15″:”/rk1″,
“10.10.20.16″:”/rk1″,
“10.10.20.17″:”/rk1″,
“10.10.20.18″:”/rk1″,
“10.10.20.19″:”/rk1″,
“10.10.20.20″:”/rk1″,
“10.10.20.21″:”/rk2″,
“10.10.20.22″:”/rk2″,
“10.10.20.23″:”/rk2″,
“10.10.20.24″:”/rk2″,
“10.10.20.25″:”/rk2″,
“10.10.20.26″:”/rk2″,
“10.10.20.27″:”/rk2″,
“10.10.20.28″:”/rk2″,
“10.10.20.29″:”/rk2″,
“10.10.20.30″:”/rk2″,
“10.10.20.31″:”/rk3″,
“10.10.20.32″:”/rk3″,
“10.10.20.33″:”/rk3″,
“10.10.20.34″:”/rk3″,
“10.10.20.35″:”/rk3″,
“10.10.20.36″:”/rk3″,
“10.10.20.37″:”/rk3″,
“10.10.20.38″:”/rk3″,
“10.10.20.39″:”/rk3″,
“10.10.20.40″:”/rk3″,
“10.10.20.41″:”/rk4″,
“10.10.20.42″:”/rk4″,
“10.10.20.43″:”/rk4″,
“10.10.20.44″:”/rk4″,
“10.10.20.45″:”/rk4″,
“10.10.20.46″:”/rk4″,


}

if len(sys.argv)==1:
print DEFAULT_RACK
else:
print join([RACK_MAP.get(i, DEFAULT_RACK) for i in sys.argv[1:]],” “)

原来这个程序我返回的是

“hs11″:”/rk1/hs11″,

结果执行mapreduce程序时报如下错误:

Total MapReduce jobs = 1
Launching Job 1 out of 1
Number of reduce tasks is set to 0 since there’s no reduce operator
Starting Job = job_201307241502_0003, Tracking URL = http://hs11:50030/jobdetails.jsp?jobid=job_201307241502_0003
Kill Command = /home/hadoop/hadoop-1.1.2/libexec/../bin/hadoop job  -kill job_201307241502_0003
Hadoop job information for Stage-1: number of mappers: 0; number of reducers: 0
2013-07-24 18:38:11,854 Stage-1 map = 100%,  reduce = 100%
Ended Job = job_201307241502_0003 with errors
Error during job, obtaining debugging information…
Job Tracking URL: http://hs11:50030/jobdetails.jsp?jobid=job_201307241502_0003
FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask
MapReduce Jobs Launched:
Job 0:  HDFS Read: 0 HDFS Write: 0 FAIL
Total MapReduce CPU Time Spent: 0 msec
 
通过http://hs11:50030/jobdetails.jsp?jobid=job_201307241502_0002 可以看到:
Job initialization failed:

 

java.lang.NullPointerException

at org.apache.hadoop.mapred.JobTracker.resolveAndAddToTopology(JobTracker.java:2751)
at org.apache.hadoop.mapred.JobInProgress.createCache(JobInProgress.java:578)
at org.apache.hadoop.mapred.JobInProgress.initTasks(JobInProgress.java:750)

at org.apache.hadoop.mapred.JobTracker.initJob(JobTracker.java:3775)

at org.apache.hadoop.mapred.EagerTaskInitializationListener$InitJob.run(EagerTaskInitializationListener.java:90)
at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:886)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908)
at java.lang.Thread.run(Thread.java:662)

 
原来系统在配置机架敏感时,并不需要在脚本中返回设备ns或hostname,系统会自动添加。改为上面的topology.py后,系统执行正确。
分享到:
评论

相关推荐

    hadoop机架感知

    Hadoop 机架感知配置详解 Hadoop 机架感知是指在 Hadoop 集群中, Namenode 能够感知每个 Datanode 所属的机架,并根据这个信息来分配 block 副本,以确保数据的高效和容错性。 机架感知的必要性是因为,在大型...

    hadoop2.7.3 自定义实现机架感知(Java版本)

    博客Hadoop机架感知配置自主实现的jar包 http://blog.csdn.net/lemonZhaoTao/article/details/70991813

    【IT十八掌徐培成】Hadoop第04天-03.机架感知测试.zip

    1. **配置机架信息**:首先,需要在Hadoop配置文件中(如`core-site.xml`或`hdfs-site.xml`)设置`topology.script.file.name`属性,指定一个脚本来确定节点所属的机架。这个脚本可以根据实际的网络拓扑结构返回节点...

    理解hadoop集群

    Hadoop通过机架感知来了解集群中每个DataNode所在的物理位置,即所在的机架。这样做有几个好处: - 如果整个机架失效,数据不会全部丢失,因为副本被保存在不同的机架上。 - 可以保持机架内的数据传输,由于机架...

    hadoop运行环境配置步骤

    4. 修改Hadoop配置文件,如`core-site.xml`(设置NameNode地址)、`hdfs-site.xml`(设置副本数量和数据块大小)和`mapred-site.xml`(配置MapReduce相关参数)。 5. 初始化HDFS文件系统,格式化NameNode。 6. 启动...

    常见Hadoop面试题

    1. 配置机架感知可以确保数据的高可用性和可靠性。 Client 端上传文件 1. Client 端上传文件的时候,会将文件切分为 Block,依次上传。 Hadoop 面试题涵盖了 HDFS、MapReduce、Hive、HBase 等多个方面的知识点,...

    Hadoop - cluster setup

    1. **配置机架感知**:通过在`hdfs-site.xml`中配置`dfs.datanode.block.locality.wait`参数来控制DataNode何时应等待来自同一机架的数据请求。 2. **网络拓扑识别**:Hadoop通过`network.topology.script.file.name...

    【推荐】大数据时代,你不得不知的Hadoop使用技巧

    例如,Hadoop的机架感知功能允许系统根据节点所在的机架信息进行更合理的数据分配,从而提高数据处理的效率。 随着Hadoop技术的不断发展,社区中出现了许多工具和框架来简化Hadoop的使用,使得开发者和运维人员可以...

    大数据技术之Hadoop知识分享 Hadoop面试题目及其答案 Hadoop面试题目整理 Hadoop使用经验 共9页.pdf

    8. **机架感知**:配置机架感知可以提高Hadoop集群的效率和稳定性,当写入数据时,会尽量将副本分布在不同机架的DataNode上,确保数据可用性和网络效率。 9. **文件上传过程**:在客户端上传文件时,数据不经过...

    hadoop平台的搭建

    3. 修改Hadoop配置文件,如hdfs-site.xml和yarn-site.xml。 4. 初始化NameNode,格式化文件系统。 5. 启动Hadoop服务。 十三、HDFS的操作 包括创建目录、上传文件、查看文件、删除文件等,通过Hadoop命令行工具或者...

    Hadoop集群搭建.pdf

    - Hadoop支持机架感知,能提高网络通信效率,通过配置,使数据在同机架节点间优先传输。 8. **启动和停止集群**: - 使用Hadoop提供的脚本启动和停止NameNode、DataNode、JobTracker和TaskTracker等守护进程。 9...

    hadoop-EAR:Hadoop-20中的编码感知复制(EAR)原型

    其他配置机架感知配置Hadoop使用拓扑定义脚本来实现机架感知。 1.创建脚本 运行bash install.sh以安装EAR。 配置EAR位置: 配置展示位置配置预编码条带存储的位置 配置团队: 将目录配置为RAID。 IV。 穿过 我们...

    大数据云计算技术 Hadoop应用浅析(共16页).pptx

    在Hadoop的维护和问题处理上,提到了对槽位利用率的监控、作业提交数的统计、死节点的自动重启、权限管理和资源分组、NameNode的镜像备份以及机架感知。这些都是保证Hadoop集群高效稳定运行的重要措施。例如,通过...

    Hadoop快速部署工具 EasyHadoop.zip

    支持配置推送,hosts文件推送,自动生成机架感知脚本 使用方法: http://github.com/xianglei/easyhadoop 点zip图标下载,然后运行EasyHadoopCentral中的setup_centos_(x).py进行安装 标签:hadoop ...

    最新大数据Hadoop面试题!(附答案解析).pdf

    - **机架感知**:配置机架感知可以在一个机架出现问题时,仍然能保证数据的可用性和读写性能,因为它会尽量将副本放在不同机架上,提高容错性。 6. **MapReduce执行流程** - JobClient将应用程序提交到JobTracker...

    Hadoop面试100题.pdf

    - **知识点说明**:配置机架感知可以让Hadoop更好地利用网络拓扑结构,将数据块尽可能地放在同一机架内的DataNode上,以减少跨机架的数据传输延迟。正确配置机架感知涉及到设置`dfs.hosts`和`dfs.hosts.exclude`等...

    Hadoop测试题

    9. 机架感知的配置可以使得数据写入到不同机架的 DataNode 中,提高数据的可用性和可靠性。因此,正确答案是 b) 写入数据的时候会写到不同机架的 DataNode 中。 10. 客户端上传文件时,会将文件切分为 Block,然后...

    大数据hadoop的暂时性的小总结.docx

    读取时,客户端从NameNode获取文件块的位置,然后并行地从最近的DataNode读取数据,利用机架感知策略优化网络传输效率。 最后,HDFS的安全模式是NameNode启动时的一种保护状态,限制了对文件系统的修改。`hdfs ...

    hadoop-ms.docx

    5. **配置机架感知**: - **机架感知**是指Hadoop能够感知到不同DataNode所在的物理位置(如机架),从而实现更高效的网络数据传输和故障恢复。 - 如果一个机架出现问题,不会立即影响到其他机架上的数据读写操作...

Global site tag (gtag.js) - Google Analytics