`
韩悠悠
  • 浏览: 839981 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

hadoop基本知识2

 
阅读更多

Hadoop管理员常用命令
hadoop job -list #列出正在运行的job
hadoop job -kill <job_id> #kill job
hadoop fsck /xxx  #检查HDFS块状态,是否损坏
hadoop fsck /xxx -delete #检查HDFS块状态,删除损坏块
hadoop dfsadmin -report #检查HDFS状态,包括DN信息
hadoop dfsadmin -safemode enter|leave
./bin/start-balancer.sh #平衡集群文件

使用hadoop创建一个文件

package com.hadoop.test;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;

public class HDFSmkdir {

 public static void main(String args[]) throws IOException{
  Configuration conf = new Configuration();
  FileSystem fs = FileSystem.get(conf);
  fs.mkdirs(new Path("/user/hadoop/xxx"));
 }
}

 

 


创建完成后导出hadoop项目jar,导出为hdfs.jar

放在linux中hadoop的lib下面
执行方式:
hadoop jar hdfs.jar

 

package com.hadoop.test;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;

/**
 * 文件拷贝
 * @author lenovo
 *
 */
public class CopyToHdfs {
 
 public static void main(String args[]) throws IOException{
  Configuration conf = new Configuration();
  
  FileSystem fs = FileSystem.get(conf);
  
  fs.copyFromLocalFile(new Path("/user/abc.txt"), new Path("/user/hadoop/abc.txt"));
 }
}

 

 


//查看HDFS结点信息

package com.hadoop.test;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.BlockLocation;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.hdfs.DistributedFileSystem;
import org.apache.hadoop.hdfs.protocol.DatanodeInfo;

/**
 * 查看HDFS结点信息
 * @author lenovo
 *
 */
public class FindFileOnHdfs {

 /**
  * @param args
  * @throws IOException 
  */
 public static void main(String[] args) throws IOException {

  getHDFSNodes();
  getFileLocal();
 }

 // 获取某个文件在Hdfs的集群位置
 private static void getFileLocal() throws IOException {
  Configuration conf = new Configuration();
  FileSystem fs = FileSystem.get(conf);
  Path path  =new Path("/user/hadoop/xxxxx/xxx.txt");
  //获取文件信息状态
  FileStatus filestatus = fs.getFileStatus(path);
  BlockLocation[] blockLocation=fs.getFileBlockLocations(filestatus, 0, 20);
  
  int lengths= blockLocation.length;
  for(int i=0;i<lengths;i++){
   String [] nodes = blockLocation[i].getHosts();
   System.out.println("block_"+i+"_location:"+nodes[0]);
  }
 }

 private static void getHDFSNodes() throws IOException {

  Configuration conf = new Configuration();
  FileSystem fs = FileSystem.get(conf);
  //获取分布式文件系统
  DistributedFileSystem hdfs =(DistributedFileSystem) fs;
  //获取结点数
  DatanodeInfo [] datanodeinfo = hdfs.getDataNodeStats();
  for(int i=0;i<datanodeinfo.length;i++){
   System.out.println("datanode_"+i+"_name"+datanodeinfo[i].getHostName());
  }
 }

}

 

 

 

分享到:
评论

相关推荐

    hadoop基本知识总结

    hadoop基本知识总结

    hadoop知识结构图

    学习Hadoop,不仅要理解其基本概念,还需要掌握如何部署和管理Hadoop集群,以及如何编写MapReduce程序。同时,了解Hadoop与其他大数据技术(如Spark、HBase等)的结合使用也是至关重要的。通过“hadoop知识结构图”...

    hadoop从入门到精通课件pdf

    通过这些章节的学习,读者可以系统地掌握Hadoop的基础知识,并逐步深入到Hadoop集群的管理和优化。从初识到精通,这个过程不仅涉及理论知识,还强调实际操作和问题解决能力的培养。对于想在大数据领域深入发展的IT...

    Hadoop入门到精通

    通过"超人Hadoop网络培训学院"的详细教程,学习者可以系统地了解和掌握Hadoop的各项知识点,从基础概念到高级应用,一步步成为Hadoop领域的专家。在学习过程中,不仅要理解理论,更要动手实践,才能真正掌握这个强大...

    hadoop 入门

    InfoQ 提供的相关资料如"InfoQ Hadoop基本流程与应用开发"、"InfoQ 分布式计算开源框架Hadoop介绍"和"InfoQ Hadoop中的集群配置和使用技巧"将帮助你深入学习这些主题,为你的Hadoop之旅提供坚实的理论基础和实践指导...

    大数据与云计算培训学习资料 Hadoop之HDFS基础入门知识介绍 共42页.ppt

    大数据与云计算培训学习资料 Hadoop之HDFS基础入门知识介绍 共42页.ppt

    Hadoop入门实战手册 中文版)

    《Hadoop入门实战手册》是一本专为初学者设计的中文版指南,旨在帮助读者快速掌握Hadoop这一分布式计算框架的基础知识和实际操作技巧。Hadoop是Apache软件基金会的一个开源项目,它为海量数据处理提供了可靠的分布式...

    hadoop基础知识

    hadoop架构的基础知识介绍,此文档为PPT,通过此文档可以对hadoop的基本理论知识有所熟悉。

    Hadoop入门手册

    【Hadoop入门手册】是一本专为初学者设计的指南,旨在帮助读者快速掌握Hadoop这一分布式计算框架的基础知识和核心概念。Hadoop是Apache软件基金会的一个开源项目,它的出现解决了大数据处理中的诸多挑战,包括数据...

    Hadoop入门学习文档

    ### Hadoop入门学习文档知识点梳理 #### 一、大数据概论 ##### 1.1 大数据概念 - **定义**:大数据是指无法在可承受的时间...对于希望进入大数据领域的技术人员来说,掌握Hadoop的基础知识和实践技能是非常必要的。

    hadoop入门教程.docx

    教程适用于初学者,旨在帮助你快速掌握Hadoop的基础知识。 1. **JDK安装与配置** 在开始Hadoop的安装前,首先确保已经安装了Java Development Kit(JDK)。在Ubuntu上,可以使用`sudo apt-get install default-jdk...

    HADOOP 入门

    《Hadoop Beginner's Guide》这本书通过详实的理论讲解和实践案例,为读者提供了一条清晰的学习路径,帮助他们快速掌握Hadoop的基础知识和应用技能。无论是对大数据处理感兴趣的学生,还是希望提升自身技术栈的专业...

    Hadoop大数据开发基础-PPT课件

    【Hadoop大数据开发基础-PPT课件】是一个涵盖了Hadoop生态系统入门知识的教育资源,适合初学者和希望深入了解大数据处理技术的IT专业人士。本课件主要围绕Hadoop框架展开,包括其设计原理、核心组件以及实际应用。...

    hadoop入门学习文档

    ### Hadoop 入门学习知识点概览 #### Hadoop 是什么? Hadoop 是 Apache 基金会下的一款开源软件框架,旨在通过集群的方式高效地处理大规模数据集。Hadoop 提供了分布式文件系统(HDFS)、运算资源调度系统(YARN...

    hadoop基础入门

    ### Hadoop基础入门知识点详解 #### 一、Hadoop概览与背景介绍 **1.1 什么是Hadoop** Hadoop是由Apache基金会维护的一个开源软件框架,它支持使用普通的硬件来构建大规模的数据处理集群。Hadoop的核心优势在于...

    Hadoop大数据开发基础-PPT课件.rar

    《Hadoop大数据开发基础》是一门深入浅出的教程,主要涵盖了Hadoop生态系统的基础知识以及MapReduce编程模型的高级应用。本课程旨在帮助初学者快速掌握大数据处理的核心技能,为今后的数据分析和挖掘打下坚实基础。 ...

    hadoop入门实战手册.pdf

    根据标题和描述,《hadoop入门实战手册.pdf》是一...这些知识点覆盖了Hadoop入门者需要掌握的基础知识,从Hadoop的基本概念、核心组件,到安装配置、使用方法,再到实际应用案例,构成了一个完整的Hadoop入门知识体系。

    8天Hadoop大数据

    但可以推测其中可能包括了各个主题的视频讲座、PPT课件、示例代码、阅读材料等,这些内容将按照8天的学习计划进行组织,每天可能涵盖一个或多个关键知识点,例如Hadoop的安装与配置、HDFS的基础操作、MapReduce编程...

Global site tag (gtag.js) - Google Analytics