Hadoop管理员常用命令
hadoop job -list #列出正在运行的job
hadoop job -kill <job_id> #kill job
hadoop fsck /xxx #检查HDFS块状态,是否损坏
hadoop fsck /xxx -delete #检查HDFS块状态,删除损坏块
hadoop dfsadmin -report #检查HDFS状态,包括DN信息
hadoop dfsadmin -safemode enter|leave
./bin/start-balancer.sh #平衡集群文件
使用hadoop创建一个文件
package com.hadoop.test; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; public class HDFSmkdir { public static void main(String args[]) throws IOException{ Configuration conf = new Configuration(); FileSystem fs = FileSystem.get(conf); fs.mkdirs(new Path("/user/hadoop/xxx")); } }
创建完成后导出hadoop项目jar,导出为hdfs.jar
放在linux中hadoop的lib下面
执行方式:
hadoop jar hdfs.jar
package com.hadoop.test; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; /** * 文件拷贝 * @author lenovo * */ public class CopyToHdfs { public static void main(String args[]) throws IOException{ Configuration conf = new Configuration(); FileSystem fs = FileSystem.get(conf); fs.copyFromLocalFile(new Path("/user/abc.txt"), new Path("/user/hadoop/abc.txt")); } }
//查看HDFS结点信息
package com.hadoop.test; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.BlockLocation; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import org.apache.hadoop.hdfs.DistributedFileSystem; import org.apache.hadoop.hdfs.protocol.DatanodeInfo; /** * 查看HDFS结点信息 * @author lenovo * */ public class FindFileOnHdfs { /** * @param args * @throws IOException */ public static void main(String[] args) throws IOException { getHDFSNodes(); getFileLocal(); } // 获取某个文件在Hdfs的集群位置 private static void getFileLocal() throws IOException { Configuration conf = new Configuration(); FileSystem fs = FileSystem.get(conf); Path path =new Path("/user/hadoop/xxxxx/xxx.txt"); //获取文件信息状态 FileStatus filestatus = fs.getFileStatus(path); BlockLocation[] blockLocation=fs.getFileBlockLocations(filestatus, 0, 20); int lengths= blockLocation.length; for(int i=0;i<lengths;i++){ String [] nodes = blockLocation[i].getHosts(); System.out.println("block_"+i+"_location:"+nodes[0]); } } private static void getHDFSNodes() throws IOException { Configuration conf = new Configuration(); FileSystem fs = FileSystem.get(conf); //获取分布式文件系统 DistributedFileSystem hdfs =(DistributedFileSystem) fs; //获取结点数 DatanodeInfo [] datanodeinfo = hdfs.getDataNodeStats(); for(int i=0;i<datanodeinfo.length;i++){ System.out.println("datanode_"+i+"_name"+datanodeinfo[i].getHostName()); } } }
相关推荐
hadoop基本知识总结
学习Hadoop,不仅要理解其基本概念,还需要掌握如何部署和管理Hadoop集群,以及如何编写MapReduce程序。同时,了解Hadoop与其他大数据技术(如Spark、HBase等)的结合使用也是至关重要的。通过“hadoop知识结构图”...
通过这些章节的学习,读者可以系统地掌握Hadoop的基础知识,并逐步深入到Hadoop集群的管理和优化。从初识到精通,这个过程不仅涉及理论知识,还强调实际操作和问题解决能力的培养。对于想在大数据领域深入发展的IT...
通过"超人Hadoop网络培训学院"的详细教程,学习者可以系统地了解和掌握Hadoop的各项知识点,从基础概念到高级应用,一步步成为Hadoop领域的专家。在学习过程中,不仅要理解理论,更要动手实践,才能真正掌握这个强大...
InfoQ 提供的相关资料如"InfoQ Hadoop基本流程与应用开发"、"InfoQ 分布式计算开源框架Hadoop介绍"和"InfoQ Hadoop中的集群配置和使用技巧"将帮助你深入学习这些主题,为你的Hadoop之旅提供坚实的理论基础和实践指导...
大数据与云计算培训学习资料 Hadoop之HDFS基础入门知识介绍 共42页.ppt
《Hadoop入门实战手册》是一本专为初学者设计的中文版指南,旨在帮助读者快速掌握Hadoop这一分布式计算框架的基础知识和实际操作技巧。Hadoop是Apache软件基金会的一个开源项目,它为海量数据处理提供了可靠的分布式...
hadoop架构的基础知识介绍,此文档为PPT,通过此文档可以对hadoop的基本理论知识有所熟悉。
【Hadoop入门手册】是一本专为初学者设计的指南,旨在帮助读者快速掌握Hadoop这一分布式计算框架的基础知识和核心概念。Hadoop是Apache软件基金会的一个开源项目,它的出现解决了大数据处理中的诸多挑战,包括数据...
### Hadoop入门学习文档知识点梳理 #### 一、大数据概论 ##### 1.1 大数据概念 - **定义**:大数据是指无法在可承受的时间...对于希望进入大数据领域的技术人员来说,掌握Hadoop的基础知识和实践技能是非常必要的。
教程适用于初学者,旨在帮助你快速掌握Hadoop的基础知识。 1. **JDK安装与配置** 在开始Hadoop的安装前,首先确保已经安装了Java Development Kit(JDK)。在Ubuntu上,可以使用`sudo apt-get install default-jdk...
《Hadoop Beginner's Guide》这本书通过详实的理论讲解和实践案例,为读者提供了一条清晰的学习路径,帮助他们快速掌握Hadoop的基础知识和应用技能。无论是对大数据处理感兴趣的学生,还是希望提升自身技术栈的专业...
【Hadoop大数据开发基础-PPT课件】是一个涵盖了Hadoop生态系统入门知识的教育资源,适合初学者和希望深入了解大数据处理技术的IT专业人士。本课件主要围绕Hadoop框架展开,包括其设计原理、核心组件以及实际应用。...
### Hadoop 入门学习知识点概览 #### Hadoop 是什么? Hadoop 是 Apache 基金会下的一款开源软件框架,旨在通过集群的方式高效地处理大规模数据集。Hadoop 提供了分布式文件系统(HDFS)、运算资源调度系统(YARN...
### Hadoop基础入门知识点详解 #### 一、Hadoop概览与背景介绍 **1.1 什么是Hadoop** Hadoop是由Apache基金会维护的一个开源软件框架,它支持使用普通的硬件来构建大规模的数据处理集群。Hadoop的核心优势在于...
《Hadoop大数据开发基础》是一门深入浅出的教程,主要涵盖了Hadoop生态系统的基础知识以及MapReduce编程模型的高级应用。本课程旨在帮助初学者快速掌握大数据处理的核心技能,为今后的数据分析和挖掘打下坚实基础。 ...
根据标题和描述,《hadoop入门实战手册.pdf》是一...这些知识点覆盖了Hadoop入门者需要掌握的基础知识,从Hadoop的基本概念、核心组件,到安装配置、使用方法,再到实际应用案例,构成了一个完整的Hadoop入门知识体系。
但可以推测其中可能包括了各个主题的视频讲座、PPT课件、示例代码、阅读材料等,这些内容将按照8天的学习计划进行组织,每天可能涵盖一个或多个关键知识点,例如Hadoop的安装与配置、HDFS的基础操作、MapReduce编程...