1、编写代码:
package crt.hadoop.test;
import java.io.IOException;
import java.io.InputStream;
import java.net.MalformedURLException;
import java.net.URL;
import org.apache.hadoop.fs.FsUrlStreamHandlerFactory;
import org.apache.hadoop.io.IOUtils;
public class URLCat {
static{
URL.setURLStreamHandlerFactory(new FsUrlStreamHandlerFactory());
}
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
InputStream in = null;
try{
in = new URL(args[0]).openStream();
IOUtils.copyBytes(in, System.out, 4096, false);
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
} finally{
}
}
}
2、在$HADOOP_HOME下新建目录build/classes/crt/hadoop/test/
3、把URLCat.java复制到$HADOOP_HOME/build/classes/crt/hadoop/test/
4、编译:
$ javac -classpath $HADOOP_HOME/hadoop-common-0.21.0.jar
$HADOOP_HOME/build/classes/crt/hadoop/test/URLCat.java
5、新建测试文件
$ cd /home/hadoop/workspace
$ mkdir readdata
$ cd readdata
$ echo "hello hadoop" > readdatatest.txt
$ hdfs dfs put readdatatest.txt hdfs://namenode:9001/tmp
6、运行:
$ export HADOOP_CLASSPATH=build/classes
$ hadoop crt.hadoop.test.URLCat hdfs://hadoop-namenode:9001/tmp/readdatatest.txt
运行结果:
hello hadoop
分享到:
相关推荐
通过阅读《Hadoop权威指南》并实践书中的代码,读者可以系统地学习Hadoop及其生态系统,掌握大数据处理的关键技能,这对于在大数据领域工作的专业人士来说是非常宝贵的资源。无论是初学者还是有经验的开发者,都能...
最后,书中的“Hadoop权威指南3-书签-中文.pdf”可能包含了一些书签或注释,这些是读者在阅读过程中为了方便回顾和查找关键内容而添加的,可以帮助快速定位到特定知识点。 总的来说,《Hadoop权威指南》第三版是一...
《Hadoop权威指南4》是Hadoop领域的一本经典著作,深入浅出地介绍了这个分布式计算框架的核心概念、设计原理以及实际操作。这本书是许多开发者和数据工程师学习Hadoop的首选资料,而附带的源码则为读者提供了更直观...
《Hadoop权威指南》中文版是全面了解和深入学习Hadoop技术的重要参考资料,它涵盖了Hadoop生态系统中的核心组件以及相关的分布式计算概念。这本书详细解析了Hadoop的设计原理、架构、安装配置、操作维护以及实际应用...
在《Hadoop权威指南(第四版)》中文PDF中,读者可以了解到关于Hadoop的基础知识,如HDFS的架构、数据块的管理、NameNode和DataNode的角色以及如何进行数据读写操作。此外,书中还会详细解析MapReduce的工作原理,...
《Hadoop权威指南》第四版是Hadoop领域的经典著作,由Tom White撰写,该书深入浅出地介绍了Hadoop生态系统的核心技术和应用场景。这本书对于想要理解、学习和掌握Hadoop技术的人来说,具有极高的参考价值。 Hadoop...
本文带来的资源是hadoop权威指南第四版中文版,适合hadoop深入学习
《Hadoop权威指南(第四版)》是一本深入解析Hadoop生态系统的经典著作,适合对大数据处理感兴趣的读者,包括开发者、架构师以及数据分析师。这本书详尽地介绍了Hadoop的核心概念、架构以及实际应用,旨在帮助读者...
《Hadoop权威指南》是大数据领域的一本经典著作,它深入浅出地介绍了Apache Hadoop这一开源分布式计算框架。Hadoop是由Doug Cutting和Mike Cafarella共同创建,最初是为了支持Google的MapReduce计算模型和Google ...
《Hadoop权威指南》(第3版) 修订版是一本专门为那些想要深入理解Hadoop技术的读者准备的专业书籍。Hadoop是当前大数据处理领域的重要工具,它基于分布式计算模型,能够处理和存储海量数据。这本书以其详尽的介绍和...
《Hadoop权威指南》是一本深入探讨大数据处理和分布式计算技术的经典著作,尤其对Hadoop生态系统的核心组件进行了详尽的阐述。这本书对于理解Hadoop集群、MapReduce编程模型以及HBase分布式数据库有着极大的帮助。接...
Hadoop权威指南 大数据的存储与分析 第四版
总的来说,《Hadoop权威指南》详尽地讲解了Hadoop框架及其在大数据存储和分析中的应用,无论你是初学者还是经验丰富的开发者,都能从中获取宝贵的洞见和实践经验。通过学习这本书,你可以掌握如何构建和优化Hadoop...
《HADOOP权威指南》第三版是一本全面深入解析Hadoop生态系统的经典之作,由知名的IT专家撰写,旨在为读者提供最全面、最权威的Hadoop学习资源。这本书以其详尽的内容、清晰的结构和实用的示例,深受广大开发者和数据...
绝对第四版!绝对中文!绝对完整!绝对第四版!绝对中文!绝对完整! Hadoop权威指南 大数据 第四版 修订版&升级版 中文版 pdf格式。Tom White 著,王海 等译,清华大学出版社,最新第4版。
### Hadoop权威指南第三版知识点总结 #### 一、Hadoop概述 - **定义与背景**:Hadoop是一个能够对大量数据进行分布式处理的软件框架。它由Apache基金会开发维护,旨在提供高可靠性、高效性及可扩展性的数据处理...
Hadoop权威指南----读书笔记
《Hadoop权威指南》是大数据领域的一本经典著作,它为读者深入理解并掌握Hadoop提供了全面而详尽的指导。书中的内容涵盖了Hadoop生态系统的各个重要组件,包括核心的Hadoop分布式文件系统(HDFS)和MapReduce计算...