`

Hadoop的配置类 Configuration

 
阅读更多

Hadoop的配置类是由资源指定的,资源可以由一个String或Path来指定:
  • String:在classpath中寻找
  • path: 直接从本地文件系统中查找
我们可以通过addResource()方法为Configuration添加资源。
值得注意的是,Hadoop在默认情况下在classpath中按次序指定读取以下两个文件:
  • core-default.xml: Hadoop的只读属性
  • core-site.xml: 某个给定hadoop的site-specific的配置。
配置参数可以指定为final,这样的话后续载入的资源就不能改变这个值,例如:
1 <property>
2        <name>dfs.client.buffer.dir</name>
3        <value>/tmp/hadoop/dfs/client</value>
4        <final>true</final>
5 </property>
一般来说,管理员会在core-site.xml中指定参数为final,这样客户端就不能再改变它。
 
关于变量扩展

首先要对字符串值进行变量扩展,可用的属性有:
  • 在配置中定义的其它属性
  • System.getProperties()中的属性。
例如,如果一个配置资源包含下面的属性定义:
1 <property>
2  <name>basedir</name>
3  <value>/user/${user.name}</value>
4 </property>
5  
6 <property>
7  <name>tempdir</name>
8  <value>${basedir}/tmp</value>
9 </property>
当conf.get(“tempdir”)被调用时,${basedir}会解析为配置文件中的其它属性,而${user.name}则会从系统属性中读取。但是需要注意的是,尽管配置属性时可以用系统属性来定义,但是通过Configuration API 是不能直接读取这些系统属性的。

分享到:
评论

相关推荐

    HadoopService java连接hadoop服务类,可上传、下载、删除

    HadoopService java连接hadoop服务类,可... 需要在启动类中配置hadoop.home.dir为winutils.exe的上一级bin的父级目录 (2)hadoop.dll 需要放置到C:\Windows\System32中 */ return FileSystem.get(new URI(fsDefau

    hadoop配置

    【Hadoop配置详解】 在Windows 7环境下配置Hadoop是一项技术性的任务,涉及到多个步骤和注意事项。以下将详细讲解如何在Win7系统上搭建Hadoop环境。 首先,我们需要下载Hadoop的二进制发行版,通常是以tar.gz或....

    hadoop eclips 的插件 和实例程序

    4. 设置Hadoop配置:在Driver类中,使用Configuration对象设置任何特定于作业的配置参数,如压缩选项、分区器等。 5. 提交作业:在Driver类的main方法中,使用Job的submit()方法提交作业。在Eclipse中,可以通过...

    spring-hadoop 环境集成

    Spring Data Hadoop项目是Spring对Hadoop生态系统的抽象和封装,它简化了Hadoop配置,提供了高层次的API,使得开发者可以更加专注于业务逻辑,而非底层的基础设施。在Spring 3.0版本之后,Spring Data Hadoop开始被...

    hadoop2lib.tar.gz

    同时,Hadoop的Configuration类使得配置参数变得简单,而FileSystem API则允许开发者操作HDFS上的文件。 在实际开发过程中,Hadoop2lib还可能包含Hadoop相关的测试工具,如MiniDFSCluster和MiniMRCluster,它们允许...

    hadoop Java接口 文件操作类

    6. **Hadoop配置**: 在进行任何文件操作前,需要配置Hadoop环境。`Configuration`类是Hadoop的配置中心,可以设置HDFS的地址、端口等参数。通过`FileSystem.get(conf)`传入配置对象来创建`FileSystem`实例。 7. *...

    Hadoop源代码分析(IDs类和Context类)

    - **JobConf**:JobConf继承自`Configuration`类,用于管理MapReduce作业的各种配置信息。它维护了一系列的配置参数,包括但不限于上述提到的`mapreduce.*`系列配置项的老版本别名。 ##### 2. TaskContext类解析 - ...

    hadoop的相关包

    - **Configuration**: 这是Hadoop的配置类,用于设置Hadoop集群的相关参数,如HDFS的地址和端口。 - **FSDataOutputStream**: 通过`FileSystem.create(path, conf)`创建一个输出流,可以用来写入文件到HDFS。 以下...

    hadoop-common-0.23.8.jar_hadoop_

    5. **配置管理**:通过Properties和Configuration类来管理和加载Hadoop集群的配置信息。 6. **日志和监控**:支持日志聚合和节点健康检查,便于运维人员监控集群状态。 7. **资源管理**:包含如内存管理、磁盘空间...

    hadoop_eclipse插件

    插件会自动生成Hadoop配置文件,如`job.xml`,并提供运行和调试作业的功能。 总之,Hadoop Eclipse插件是Hadoop开发者不可或缺的工具,它简化了在Eclipse中的开发流程,通过环境变量`HADOOP_USER_NAME`的正确设置和...

    hadoop-core-0.20.2 源码 hadoop-2.5.1-src.tar.gz 源码 hadoop 源码

    5. **配置管理**:`org.apache.hadoop.conf.Configuration`类用于管理Hadoop的配置参数,这些参数控制着Hadoop的行为和性能。 6. **日志和监控**:Hadoop使用`org.apache.hadoop.log`和`org.apache.hadoop.metrics`...

    hadoop-2.7.2-bin-x64

    在Windows平台上,尽管Hadoop最初设计为在Linux环境下运行,但通过特定的配置,我们也可以在Windows上搭建开发环境。本文将详细介绍如何在Windows 64位系统中安装和使用Hadoop 2.7.2。 一、Hadoop 2.7.2的下载与...

    hadoop开发所需类

    4. **Hadoop配置**:在开发过程中,需要配置Hadoop的相关参数,这通常通过`Configuration`类来实现。开发者可以设置如`fs.defaultFS`(默认文件系统地址)等核心配置。 5. **MapReduce编程模型**:MapReduce包含两...

    第3章 HadoopAPI操作.pdf

    通过导入`Configuration`,`FileSystem`和`Path`等类,配置Hadoop的默认文件系统,并使用`FileSystem.get(conf)`获取文件系统实例。接着,使用`exists()`方法判断文件是否存在,输出相应的结果。 另一个练习是写...

    eclipse hadoop 例子源代码

    学习这些源代码,开发者可以了解到如何使用Hadoop API,如`Configuration`类来设置作业参数,`Job`类来创建和提交作业,以及`TextInputFormat`和`TextOutputFormat`如何定义输入和输出格式。同时,`Mapper`和`...

    Java访问Hadoop集群源码

    1. 配置Hadoop客户端:在Java代码中,你需要通过`Configuration`类设置Hadoop集群的相关配置,如HDFS的名称节点地址和Hadoop的配置文件路径。 ```java Configuration conf = new Configuration(); conf.set("fs....

    hadoop api.doc

    1. **org.apache.hadoop.conf**: 这个包包含了处理配置参数的类,如`Configuration`,它是Hadoop中配置系统参数的主要接口。用户可以通过它来设置或获取Hadoop集群的相关配置,例如DFS的默认块大小、 Namenode地址等...

    hadoop api 操作代码

    - `Configuration`类:设置Hadoop集群的配置信息,如默认的文件系统地址、MapReduce作业的配置参数等。 - `Job`类:创建和管理MapReduce作业,如提交作业、监控作业状态、设置作业配置等。 - `InputFormat`和`...

Global site tag (gtag.js) - Google Analytics