`
zhangxiong0301
  • 浏览: 358957 次
社区版块
存档分类
最新评论

hadoop知识点记录

阅读更多

问题一:No nodemanager to stop

yarn-deamon.sh stop部分的脚本: 

Java代码  
  1. (stop)  
  2.   
  3.    if [ -f $pid ]; then  
  4.      TARGET_PID=`cat $pid`  
  5.      if kill -0 $TARGET_PID > /dev/null 2>&1; then  
  6.        echo stopping $command  
  7.        kill $TARGET_PID  
  8.        sleep $YARN_STOP_TIMEOUT  
  9.        if kill -0 $TARGET_PID > /dev/null 2>&1; then  
  10.          echo "$command did not stop gracefully after $YARN_STOP_TIMEOUT seconds: killing with kill -9"  
  11.          kill -9 $TARGET_PID  
  12.        fi  
  13.      else  
  14.        echo no $command to stop  
  15.      fi  
  16.    else  
  17.      echo no $command to stop  
  18.    fi  

根据上面代码。在关闭hadoop的进程的时候,会首先TARGET_PID=`cat $pid`,后面的操作都 
针对这个TARGET_PID。 
首先发送kill -0 TARGET_PID来检测这个pid存在不存在,若存在那么就使用kill  TARGET_PID 来关闭进程。 
第二个 kill -0 $TARGET_PID,意思是第一次删除失败的时候,则执行kill -9 $TARGET_PID。 
  在默认情况下,hadoop会使用/tmp目录作为临时文件存放地点,包括pid的文件.

由于/tmp会定期清除(以前认为只有在重启的时候,tmp才会清除,后来李天王提到由于tmpwatch的作用,会定期每隔240小时删除tmp的内容),会将pid清除,pid不存在的时候,就会报no *** to stop 。nodemanager的pid文件名为:yarn-${hadoop-user}-nodemanager.pid.

解决:类似问题都可以解决:在hadoop的hadoop-env.conf,yarn-env.sh或者hbase-conf.sh中修改文件中的PID配置项:HADOOP_PID_DIR,YARN_PID_DIR,HBASE_PID_DIR

 

2.reduce如何决定把拷贝过来的map结果存入内存还是存入磁盘?

         远程拷贝过程中,每次拷贝一个数据块时,若该数据块可以放入内存则放入内存,否则放入硬盘。有两个标准决定该数据块是否应该放入硬盘:(1) 数据块小于 java_heaps _size * mapred.job.shuffle.input.buffer.percent * MAX_SINGLE_SHUFFLE_SEGMENT_FRACTION(0.25) (2) 内存中有足够空间放入该数据块。

分享到:
评论

相关推荐

    大数据知识点Hadoop详细笔记

    本知识点总结了 Hadoop 的基本概念、特征、架构和组件,以及 HDFS 的设计和读写流程。 大数据的四大特征 1. Volume(大容量):指的是数据量的规模,通常在 10TB 以上。 2. Variety(多样化):指的是数据来源多、...

    hadoop学习总结(面试必备)

    本总结将深入探讨Hadoop的主要组件、工作原理以及在面试中可能遇到的相关知识点。 一、Hadoop概述 Hadoop是由Apache基金会开发的一个开源项目,它提供了一个分布式文件系统(HDFS)和一个并行计算框架(MapReduce...

    hadoop高可用安装.docx

    本文档记录了一次采用Zookeeper-3.6.1+Hadoop-3.2.1高可用环境搭建过程,涵盖了服务器规划、安装JAVA环境、安装Hadoop和Zookeeper、关闭系统防火墙、修改主机名、添加主机解析、设置免密登录、设置目录路径和配置...

    hadoop 实战 dev_03

    标题中的知识点:Hadoop实战dev_03 内容概述:本次分享是关于Hadoop实战的第三部分,专注于Hadoop系统的应用开发实例。 知识点详细说明: 1. Hadoop系统:Hadoop是一个能够存储和处理大量数据的分布式系统框架,是...

    Hadoop云计算2.0笔记第一课Hadoop介绍

    Hadoop 云计算 2.0 笔记第一课 Hadoop 介绍中,我们可以了解到 Hadoop 的生态系统特点、Hadoop 生态系统概况、Hadoop 生态系统版本衍化、下一代 Hadoop、Hadoop 学习经验等方面的知识点。 1. Hadoop 生态系统特点:...

    HADOOP 相关项目简介

    ### Hadoop相关项目知识点 #### 一、Avro:数据序列化系统 **知识点概述**: Apache Avro 是一种数据序列化系统,主要用于处理结构化的数据格式,支持丰富的数据结构,提供紧凑高效的二进制数据格式,具备容器文件...

    Hadoop学习时间轴

    根据提供的信息,我们可以详细地解析出关于Hadoop学习时间轴中的关键知识点,这些知识点主要集中在Hadoop的基础架构、MapReduce工作原理以及Hive在实际应用中的优化等方面。 ### Hadoop学习时间轴概述 Hadoop是一...

    hadoop安装记录

    以上就是Hadoop安装过程中的主要知识点,每个环节都需要细致的操作和理解,只有这样,才能确保Hadoop环境的稳定运行。对于初学者来说,实践是学习Hadoop的最佳方式,通过安装和运行,可以更好地理解Hadoop的工作原理...

    hadoop配置

    【标题】:“Hadoop配置”涉及的IT知识点主要包括Hadoop的安装、配置、集群搭建以及故障恢复等核心概念。Hadoop是一个开源的分布式计算框架,主要用于处理和存储大规模数据,其核心组件包括HDFS(Hadoop Distributed...

    hadoop-common-2.7.1-bin-master.zip

    《Hadoop Common 2.7.1:基础工具包详解》 Hadoop作为一个开源的分布式计算框架,其组件众多,而“hadoop-common-2.7.1-bin-master.zip...理解和掌握这些知识点,对于在实际项目中部署和管理Hadoop集群具有重要意义。

    Hadoop学习总结

    在IT领域,Hadoop是一个广泛使用的开源...掌握这些知识点,不仅能够帮助你理解和操作Hadoop系统,也为进一步探索大数据处理和分析打下坚实基础。在实践中不断深化对Hadoop的理解,将有助于你在大数据时代应对各种挑战。

    传智黑马赵星老师hadoop七天课程资料笔记-第一天(全)

    9. "hdfs笔记.txt" - 这可能是一位学生或讲师的个人笔记,记录了关于HDFS的详细知识点,可能是对HDFS操作的深入理解和技巧的总结。 综合这些资源,学习者可以从多个角度深入了解Hadoop,包括它的核心组件、安装配置...

    Hadoop Share

    现在,让我们详细探讨一下Hadoop和Hive的相关知识点: **Hadoop**: Hadoop是由Apache基金会维护的一个开源项目,核心是分布式文件系统(HDFS)和MapReduce计算框架。HDFS提供了高容错性和高吞吐量的数据存储,而...

    (完整版)hadoop常见笔试题答案.docx

    这些知识点构成了Hadoop基础知识的骨架,理解和掌握它们对于理解和操作Hadoop集群至关重要。在实际工作中,Hadoop还涉及到更多复杂的应用场景和优化策略,如数据倾斜、性能调优、安全性设置等。

    hadoop调查报告书

    根据提供的文件信息,我们可以深入探讨Hadoop的相关知识点,特别是与Hadoop性能测试相关的主题。这份报告主要关注Hadoop系统的基本架构、与Google File System (GFS) 的对比、以及Hadoop MapReduce的工作原理等方面...

    Hadoop课件

    ### Hadoop课件知识点概述 #### 一、实验目的与要求 本次实验旨在通过实际操作,让学生深入理解云环境下的文件管理系统以及Hadoop的核心概念和技术。具体目标包括但不限于: 1. **云环境安装与配置**:熟悉并掌握...

    基于Ubuntu的Hadoop简易集群安装与配置

    ### 基于Ubuntu的Hadoop简易集群安装与配置知识点详解 #### 一、绪论 ##### 1.1 研究背景及意义 在当前信息化社会中,随着科技的发展与进步,尤其是互联网技术的普及,我们正处在一个数据爆炸的时代。各行各业都在...

Global site tag (gtag.js) - Google Analytics