`

Hadoop维护心得

 
阅读更多

2012-09-04

 

1. mapper与reducer数量

每个子任务是开启一个新的进程来进行的。因此如果不限制mapper或reducer的数量(一般reducer数量少),jobtracker会像个恶毒的老板一样,让某些节点工作到死。

 

2. include文件与exclude文件

最好配置include文件与exclude文件,使得在新插入节点与撤销节点时,能做更少的工作。

 

3. 唤醒节点

如果某些节点死掉了。登录到该节点,用hadoop-daemon start jobtracker与hadoop-daemon start datanode可以唤醒该节点。

 

4. hadoop dfsadmin命令集

除了hadoop fs命令集以外,hadoop dfsadmin命令集也是我们的好基友。

 

5. 配置一致性

hadoop在各个节点中的目录结构是要一致的。可以通过实验来验证。而且使用的配置文件也是基于namenode的配置文件。当目录结构不一致的情况下,不一致的datanode会无法启动。同时,这也代表各节点使用的JVM是应该一致的。

 

6. 安全互信

如果namenode和datanode之间的ssh登录不互信的话,启动和关闭系统的过程会相当的头痛。输密码输到不能自已。

 

7. 本地日志

各个节点的运行状况应当参考节点本机的日志信息。

  

8.hosts文件

确保所有节点的hosts文件正确。否则有可能出现这样的错误。

WARN org.apache.hadoop.mapred.ReduceTask: java.net.UnknownHostException: xx.xxx.xxxx.xxx

这是因为节点间是以服务器名来进行互相通信。没有正确的hosts文件会造成任务被卡死在某个节点上:它会不停的在文件系统里找文件块,并且四处碰壁。

分享到:
评论

相关推荐

    Hadoop学习总结.doc

    - **元数据节点内存状态**:元数据节点在内存中维护文件系统的最新状态。 - **fsimage 文件**:将元数据节点内存中的信息持久化到磁盘上的文件。 - **checkpoint 过程**: - 从元数据节点通知主元数据节点创建一个...

    Hadoop课程实验和报告——Hadoop安装实验报告

    Hadoop是一个开源的大数据处理框架,由Apache基金会开发和维护。它提供了一种可靠、可扩展、可高效的方法来存储和处理大规模数据。在本实验报告中,我们将介绍Hadoop的安装和配置过程,并结合Eclipse进行项目开发。 ...

    hadoop练习-mytest.rar

    在这个名为“hadoop练习-mytest.rar”的压缩包中,包含了作者四年大学学习Hadoop的心得体会和实践项目,通过Java语言实现了对Hadoop的操作。这个压缩包特别适合那些希望深入了解Hadoop以及如何在实际项目中应用它的...

    SQL数据库心得资源下载

    理解如何在这些现代架构中应用SQL,如使用Hadoop HBase或Google BigQuery,是现代数据库管理员必备的技能。 总之,“SQL数据库心得”这个资源包涵盖了SQL的多个重要方面,无论是初学者还是有经验的开发者,都能从中...

    hadoopprocessing-ma开发笔记

    【描述】虽然描述简洁,但我们可以推测这本笔记可能详细记录了作者在使用Hadoop进行MA(可能是数据分析或机器学习)任务时的心得体会,包含了如何设置和管理Hadoop集群,如何编写MapReduce程序,以及在处理大规模...

    CM_CDH大数据集群搭建总结.zip

    最后,`集群搭建问题总结`文档可能包含了在搭建过程中遇到的问题和解决方案,如网络配置、依赖冲突、资源分配等常见问题,这对于后期维护和优化集群具有指导意义。 综上所述,搭建一个完整的CM_CDH大数据集群是一项...

    (胡映鑫)心得体会1

    在软件设计中,质量属性如可扩展性、可用性、安全性、性能和可维护性等都是至关重要的。通过对各种可能的场景进行分析,我们可以预测和解决潜在的问题,确保系统的整体质量。在这个过程中,我学习了如何将具体的战术...

    java的一些学习心得

    22. 学习新技术:关注云计算、人工智能、大数据等领域的新技术,如Kubernetes、Spark、Hadoop等,拓宽视野。 23. 持续集成/持续部署(CI/CD):了解Jenkins、GitLab CI/CD等工具,实现自动化构建和部署,提高开发效率...

    大数据项目实训总结-大数据分析处理实践的一点心得.pdf

    通过以上的实践心得,我们可以看到大数据分析处理不仅仅是技术层面的挑战,还涉及到对业务的理解、数据结构的设计以及资源管理等多个方面。只有综合运用这些知识,才能有效地处理大数据项目中的各种问题。

    udf使用心得,吐血推荐

    本文将深入探讨UDF的使用心得,分享在实际应用中的经验与技巧。 1. **UDF的基本概念** - UDF分为两种类型:内联表值函数(Inline Table-Valued Function, ITVF)和标量值函数(Scalar-Valued Function, SVF)。...

    netty部分参考个人心得

    Netty 是一个异步事件驱动的网络应用程序框架,用于快速开发可维护的高性能协议服务器和客户端。Netty 对 JDK 自带的 NIO 的 API 进行封装,解决了 NIO 编程的各种问题,如繁杂的类库和 API、需要具备其他的额外技能...

    [详细完整版]大数据心得.doc

    ### 大数据心得知识点概述 #### 一、大数据时代的背景与意义 - **时代背景**:随着信息技术的迅速发展,互联网、移动通信等技术的进步,数据量呈现出爆炸性增长的趋势。这种现象不仅体现在日常生活中的社交媒体、...

    心得体会2

    在“心得体会2”这篇文档中,作者提到了对两篇学术文章的阅读体验,一篇是Paakkonen(2015)的文章,另一篇是Perry(1992)的文章。这两篇文章分别关注了软件架构的不同方面,揭示了软件工程领域的重要知识点。 ...

    工作心得:揭穿大数据备份的误区.pdf

    大数据平台(Hadoop、Cassandra、Couchbase和HPEVertica等)通常由工程师或开发运维团队来管理,而不是传统的数据平台(甲骨文、SQLServer等)由IT专业人员来管理。大数据备份和恢复方面存在一些常见的误解,需要...

    云计算技术介绍心得1

    云计算的产品种类繁多,包括服务器虚拟化、主机虚拟化和云桌面系统(如云晫、VmWare、Citrix和华为的解决方案)以及大数据处理工具(如Hadoop、TMALL大数据平台、Google/百度搜索和360安全云)。这些产品和服务帮助...

    HBASE 完整教程.docx

    ZooKeeper是一个分布式协调服务,它可以维护配置信息、提供命名服务、实现分布式同步等。在HBase中,ZooKeeper通过短暂节点跟踪区域服务器的状态,帮助主服务器发现可用服务器,并在服务器故障或网络分区时进行恢复...

    微软技术面试心(对你进大企业很有帮助,里面可不是瞎掰那些没有用的概念,而是很多算法,编程思路题的实战)

    对于这些领域的基础概念和技术框架的了解,如Azure、机器学习算法、大数据处理工具(如Hadoop或Spark),都有可能成为面试的话题。 最后,软技能同样重要,包括团队合作、沟通能力和项目管理。面试官会评估你是否能...

    Mesos中文手册

    文档内容由社群爱好者共同维护,贡献者可以通过邮箱、GitHub等方式提交修改建议或心得,并得到相应的署名和奖励。 Mesos简介中提到,它能够像操作一台电脑一样使用整个数据中心资源,即作为一个资源池来使用。Mesos...

Global site tag (gtag.js) - Google Analytics