`
nopower
  • 浏览: 7105 次
  • 性别: Icon_minigender_1
  • 来自: 北京
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

Hadoop tips: Hadoop脚本的环境变量

阅读更多

在Hadoop的命令行脚本($HADOOP_HOME/bin/hadoop)里可以找到一些环境变量,在某些情况下可以灵活使用。

JAVA_HOME,HADOOP_CLASSPATH,HADOOP_HEAPSIZE等变量的意义比较明确,就不细说了。

HADOOP_CONF_DIR

指定Hadoop配置文件目录,默认是${HADOOP_HOME}/conf。当某台客户端机器是多人共用时,大家可能使用同一个Hadoop安装包,但每个人却都都有各自的配置,所以需要各自指定自己的配置文件目录:

export HADOOP_CONF_DIR=$HOME/hadoop_conf

这个环境变量在测试脚本里也经常使用。

HADOOP_OPTS

HADOOP_OPTS环境变量(包括HADOOP_NAMENODE_OPTS,HADOOP_CLIENT_OPTS等)指定了Hadoop Java进程运行时的系统参数,比如TestDfsIO程序中用到一个系统参数test.build.data,我们需要把它放到HADOOP_OPTS环境变量中:

export HADOOP_OPTS='-Dtest.build.data=/user/willwu/TestDFSIO'

如果你要改变NameNode GC方式,也可以用这个参数:

export HADOOP_NAMENODE_OPTS="-Xms40960m -XX:+UseConcMarkSweepGC"

HADOOP_ROOT_LOGGER

有时候你想让Hadoop客户端程序打印Debug日志,你需要改变HADOOP_ROOT_LOGGER变量,默认是INFO,console:

export HADOOP_ROOT_LOGGER=DEBUG,console
 

 

分享到:
评论

相关推荐

    Apache Hadoop YARN:【Hadoop YARN权威指南】

    Apache Hadoop YARN:Moving beyond MapReduce and Batch Processing with Apach 2 【yarn权威指南】

    hadoop 文档:Hadoop开发者下载

    3. **开发环境搭建**:安装和配置Hadoop开发环境是开发者的第一步,包括Java环境、Hadoop版本选择、配置Hadoop环境变量、集群部署或伪分布式部署等。 4. **Hadoop API**:学习使用Hadoop API进行数据读写和处理,...

    hadoop全分布式-脚本一键安装

    4. 解压Hadoop:使用tar命令解压预先下载的Hadoop压缩包,并移动到合适的目录,如/usr/local/hadoop。 5. 修改配置文件:根据具体需求,调整Hadoop的配置文件,如设置HDFS的名称节点和数据节点,YARN的资源管理器等...

    大数据安全-kerberos技术-hadoop安装包,hadoop版本:hadoop-3.3.4.tar.gz

    在Hadoop环境中,Kerberos可以应用于HDFS、YARN、HBase等组件,保护数据的读写操作、资源调度以及数据库访问。安装Hadoop-3.3.4时,需确保配置Kerberos以实现安全运行。首先,需要设置Kerberos的KDC服务器,并为每个...

    windows下面的hadoop环境变量

    1. 变量名:HADOOP_HOME 2. 变量值:刚才放置`winutils.exe`的目录,例如 `C:\hadoop` 然后找到已存在的`Path`变量,将其编辑并添加HADOOP_HOME到末尾,用分号(`;`)隔开。这样,系统就能在任何路径下通过命令行执行...

    Hadoop部署脚本

    Apache Hadoop软件库是一个框架,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器提供本地计算和存储。该库本身不是依靠硬件来提供高可用性,而是设计...

    hadoop环境部署自动化shell脚本(伪分布式、完全分布式集群搭建).docx

    【Hadoop环境部署自动化Shell脚本】是一种高效的方法,用于快速搭建Hadoop集群,无论是用于学习还是开发。本文档提供了一个详细的脚本,涵盖了从Java环境配置到Hadoop集群的完全分布式安装的所有步骤,旨在降低...

    HadoopHA集群 批量启动脚本

    HadoopHA集群 批量启动脚本HadoopHA集群 批量启动脚本HadoopHA集群 批量启动脚本HadoopHA集群 批量启动脚本

    Data Analytics with Hadoop: An Introduction for Data Scientists

    "Data Analytics with Hadoop: An Introduction for Data Scientists" ISBN: 1491913703 | 2016 | PDF | 288 pages | 7 MB Ready to use statistical and machine-learning techniques across large data sets? ...

    Hadoop平台搭建 1.搭建 步骤文档 2.搭建时要用到的组件安装包

    安装Java环境:Hadoop需要Java运行环境,因此需要先安装Java。 下载并解压Hadoop安装包:从官方网站或其他可靠来源下载Hadoop安装包,并解压到指定目录。 配置Hadoop环境变量:设置Hadoop的相关环境变量,以便系统...

    云计算Hadoop:快速部署Hadoop集群

    资源名称:云计算Hadoop:快速部署Hadoop集群内容简介: 近来云计算越来越热门了,云计算已经被看作IT业的新趋势。云计算可以粗略地定义为使用自己环境之外的某一服务提供的可伸缩计算资源,并按使用量付费。可以...

    hadoop的winutils.exe及hadoop.dll文件

    我的报错:Could not locate Hadoop executable: E:\big_data\hadoop-3.3.0\bin\winutils.ex hadoop的winutils.exe及hadoop.dll文件,可以用于hadoop3.3. 下载好直接将两个文件复制到我们hadoop的bin目录下就行了

    hadoop-3.1.0.rar windows 环境依赖

    3. **配置环境变量**:设置HADOOP_HOME环境变量指向Hadoop的安装目录,并将%HADOOP_HOME%\bin添加到PATH环境变量中。 4. **配置Hadoop**:修改Hadoop的配置文件,如`core-site.xml`、`hdfs-site.xml`和`yarn-site....

    shell脚本配置Hadoop伪分布式.zip

    在这个"shell脚本配置Hadoop伪分布式.zip"压缩包中,包含了配置Hadoop伪分布式环境所需的所有资源和指南。伪分布式模式是在单个节点上模拟分布式环境,这对于学习和测试Hadoop功能非常有用,无需复杂的多节点集群...

    hadoop2.6 centos6.5 伪分布式环境部署 实例

    chown -R hadoop:hadoop /usr/opt/hadoop ``` 配置 Hadoop 环境变量 使用以下命令配置 Hadoop 环境变量: ``` su vim /etc/profile export HADOOP_INSTALL=/opt/modules/hadoop export PATH=${HADOOP_INSTALL}/bin:...

    安装hadoop_配置hadoop的运行环境视频

    Hadoop由两个主要部分组成:Hadoop Distributed File System (HDFS) 和 MapReduce。HDFS是分布式文件系统,负责数据的存储;MapReduce则是一个并行处理框架,用于数据的计算。 1. **系统要求**:在安装Hadoop之前,...

    Windows环境安装Hadoop.7z

    1. 下载Hadoop: 从Apache官网下载适用于Windows的Hadoop二进制发行版。 2. 解压Hadoop: 将下载的Hadoop压缩包解压到一个合适的目录,例如`C:\hadoop`。 配置Hadoop 1. 配置环境变量: 设置HADOOP_HOME环境变量指向...

    hadoop 部分 shell 脚本

    3. **环境变量**:使用`export`定义环境变量,确保子进程能继承这些变量。 4. **函数**:创建自定义函数,提高代码复用性和可读性。 5. **脚本参数**:通过$1, $2...访问脚本传入的参数,方便脚本的灵活调用。 四、...

    hadoop集群安装脚本

    "hadoop集群安装脚本"是实现快速、便捷部署Hadoop集群的一种工具,尤其对于初学者或运维人员来说,这种一键式安装脚本极大地简化了复杂的配置过程。 Hadoop集群的核心组件包括HDFS(Hadoop Distributed File System...

Global site tag (gtag.js) - Google Analytics