`
zhangbaoming815
  • 浏览: 150441 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

在集群上运行hadoop程序

阅读更多

p { margin-bottom: 0.08in; }

hadoop 集群上执行程序:

这里只是简单的实现文件的读取工作:

1. 开启 hadoop:

start.all.sh

注意在开启 hadoop 后并不能马上进行下面的操作, hadoop 会处于安全模式状态下一段时间,大概半分钟到一分钟。

2. 将自己写的程序打包:

import java.io.IOException;
import java.io.InputStream;
import java.net.URI;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;


public class FileSystemCat {
	public static void main(String[] args) {
		String uri = args[0];
		Configuration conf = new Configuration();
		InputStream in = null;
		try {
			FileSystem fs = FileSystem.get(URI.create(uri), conf);
			in = fs.open(new Path(uri));
			IOUtils.copyBytes(in, System.out, conf);
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} finally {
			IOUtils.closeStream(in);
		}
	}
}
 

3. 将自己的文件上传到 hadoop HDFS 上:

hadoop fs -put input input01

4. 查看是否上传成功:

hadoop fs -ls

5. 执行程序:

hadoop jar /home/hadoop/Desktop/generate-lib/FileSystemCat.jar com.hadoop.FileSystemCat hdfs://localhost:9000/user/hadoop/input01/testlog.log

在控制台下就能看到结果了

 

分享到:
评论

相关推荐

    Hadoop集群程序设计与开发教材最终代码.zip

    - Eclipse和IntelliJ IDEA等IDE提供了Hadoop插件,便于调试和测试Hadoop应用程序。 5. Hadoop集群部署: - 单机模式:用于开发和测试,所有Hadoop进程都在一台机器上运行。 -伪分布式模式:在一个节点上模拟多...

    hadoop 集群部署操作

    Hadoop 集群部署操作是指规划、安装和配置 Hadoop 集群的整个过程,以便在生产环境中运行 Hadoop 应用程序。下面是 Hadoop 集群部署操作的详细知识点: 规划 Hadoop 集群 * 规划主机名:bdlinux01、bdlinux02、...

    pc机连接集群的HADOOP_HOME

    为了在Eclipse中调试和运行Hadoop程序,你需要安装Hadoop插件(如Hadoop插件for Eclipse或Eclipse for Big Data Developers),同时确保`HADOOP_HOME`已经正确配置,这样Eclipse才能正确地构建和连接到Hadoop集群。...

    hadoop集群安装笔记

    JDK是Hadoop的基本组件,用于编译和运行Hadoop应用程序。 修改主机名 在安装Hadoop集群时,可以根据需要修改主机名。修改主机名可以方便地标识不同的机器,但这不是必需的步骤。 关闭防火墙 在安装Hadoop集群时...

    eclipse运行hadoop2.7.3程序依赖的jar包

    在开发Hadoop应用程序时,Eclipse作为Java IDE是开发者常用的选择。为了在Eclipse中运行Hadoop 2.7.3程序,你需要确保正确配置了项目依赖并包含了所有必需的JAR包。以下是你需要知道的关键知识点: 1. **Hadoop环境...

    Hadoop集群搭建部署与MapReduce程序关键点个性化开发.doc

    在Eclipse中直接运行MapReduce程序,可以进行快速的本地测试和调试,减少了实际在集群上运行的时间。 任务3是对开发过程的总结和反思,通常包括遇到的问题、解决策略以及优化建议。在实践中,可能需要根据硬件资源...

    在Windows上使用eclipse编写Hadoop应用程序

    为了方便开发者在Windows环境下进行Hadoop应用程序的开发,本篇指南将详细介绍如何使用Eclipse集成开发环境(IDE)来编写、编译并在Hadoop集群上运行简单的Hadoop应用程序。 #### 创建Java项目 1. **启动Eclipse**...

    Hadoop集群-WordCount运行详解.pdf

    Hadoop采用MapReduce编程模型来实现分布式计算,MapReduce是Hadoop的核心组件,它将复杂的、运行在大规模集群上的并行计算问题简化为两个关键操作:Map(映射)和Reduce(归约)。 MapReduce理论简介中,1.1.1...

    hadoop Windows 运行环境

    这个"hadopp Windows 运行环境"就是为在Windows操作系统上搭建和运行Hadoop环境提供所需的支持。 Hadoop的核心由两个主要组件构成:Hadoop分布式文件系统(HDFS)和MapReduce。HDFS是Hadoop的数据存储层,它将大...

    大数据与云计算培训学习资料 Hadoop集群 细细品味Hadoop_第7期_Eclipse开发环境设置 共23页.pdf

    Hadoop Eclipse插件可以自动导入Hadoop编程接口的JAR文件,用户可以在Eclipse的图形化界面中编写、调试、运行Hadoop程序。 四、Hadoop工作目录简介 Hadoop工作目录是存放Hadoop相关文件的目录。Hadoop工作目录包括...

    Hadoop系统安装运行与程序开发

    而Java则是运行Hadoop所必需的环境。安装单机模式时,JDK是必选项。此外,系统还需要配置SSH,使得无需密码就可以在节点间进行通信。之后需要下载Hadoop软件,解压,并配置Hadoop运行环境,格式化HDFS(Hadoop分布式...

    window下eclipse中运行mapreduce程序所需要的Hadoop全部jar包

    总之,要在Windows下的Eclipse环境中成功运行MapReduce程序,关键在于正确配置Hadoop环境,导入所有必要的jar包,并理解如何设置和提交MapReduce作业。这个过程可能需要一些时间和实践,但一旦配置完成,将为高效...

    实验2-在Hadoop平台上部署WordCount程序-孙淼1

    实验2的目的是在Hadoop平台上部署WordCount程序,以此来理解和体验云计算的基础应用。这个实验主要涉及以下几个关键知识点: 1. **Linux系统基础**:实验要求学生具备Linux系统的使用知识,包括基本的命令行操作、...

    hadoop伪集群搭建及eclipse插件配置

    Hadoop作为当今最流行的分布式存储与计算框架之一,主要用于存储和分析大规模数据集。...这样的环境非常适合学习和开发Hadoop应用程序,帮助开发者在部署到实际生产环境之前发现并解决潜在的问题。

    Hadoop集群程序设计与开发教学大纲.docx

    3. **Hadoop开发环境配置与搭建**:教授如何设置不同的Hadoop运行模式,包括集群部署、本地/独立模式、伪分布模式和完全分布式模式,以及如何在Eclipse中配置Hadoop开发环境。 4. **HDFS**:讲解HDFS的流操作、...

    myEclipse10.0与hadoop集群远程连接

    将myEclipse与Hadoop集群远程连接起来,可以方便地在开发环境中编写、测试和部署Hadoop应用程序,从而实现高效的数据分析和处理。 首先,我们需要了解myEclipse中的远程系统视图(Remote Systems View)。这是...

    hadoop在windows上运行的工具

    标题中提到的“hadoop在windows上运行的工具”主要指的是在Windows环境下运行Hadoop所需的特定工具,这些工具确保了Hadoop能够在非Linux系统上正常工作。其中,“libwinutils.lib”是一个动态链接库文件,它包含了在...

    云计算技术实验报告三运行Hadoop MapReduce程序

    实验报告的标题为“云计算技术实验报告三运行Hadoop MapReduce程序”,这表明实验的核心是了解和实践Hadoop MapReduce的编程模型。MapReduce是一种分布式计算框架,常用于处理和生成大规模数据集,由Google提出并被...

    董西成:Hadoop YARN程序设计与应用案例

    总结来说,董西成在“Hadoop英雄会——暨Hadoop 10周年生日大趴”中详细介绍了Hadoop YARN的架构、API、通信协议以及如何在YARN上设计和运行应用程序。通过其演讲内容,我们可以看到YARN在构建现代大数据处理和分析...

    理解hadoop集群

    Hadoop是一种支持数据密集型分布式应用程序的开源框架,主要用于大数据处理和存储。Hadoop集群是由多个计算机(节点)组成的,它们协同工作,共同处理和存储大量的数据。以下是关于Hadoop集群的一些基本原理和概念的...

Global site tag (gtag.js) - Google Analytics