`

Hadoop hdfs命令

 
阅读更多
  1. hdfs fsck /home/hive/warehouse/music_rec.db/fact_user_events_all -files -blocks
  2. Format the filesystem:

      $ bin/hdfs namenode -format
    
  3. Start NameNode daemon and DataNode daemon:

      $ sbin/start-dfs.sh
    

    The hadoop daemon log output is written to the $HADOOP_LOG_DIR directory (defaults to $HADOOP_HOME/logs).

  4. Browse the web interface for the NameNode; by default it is available at:

    • NameNode - http://localhost:50070/
  5. Make the HDFS directories required to execute MapReduce jobs:

      $ bin/hdfs dfs -mkdir /user
      $ bin/hdfs dfs -mkdir /user/<username>
    
  6. Copy the input files into the distributed filesystem:

      $ bin/hdfs dfs -put etc/hadoop input
    
  7. Run some of the examples provided:

      $ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar grep input output 'dfs[a-z.]+'
    
  8. Examine the output files: Copy the output files from the distributed filesystem to the local filesystem and examine them:

      $ bin/hdfs dfs -get output output
      $ cat output/*
    

    or

    View the output files on the distributed filesystem:

      $ bin/hdfs dfs -cat output/*
    
  9. When you’re done, stop the daemons with:

      $ sbin/stop-dfs.sh
分享到:
评论

相关推荐

    Hadoop HDFS_Shell命令详解.pdf

    ### Hadoop HDFS Shell 命令详解 #### 概述 Hadoop HDFS Shell 是一组用于与Hadoop分布式文件系统 (HDFS) 进行交互的命令行工具。通过这些命令,用户能够执行诸如创建、删除、移动文件以及设置文件权限等操作。本文...

    Hadoop HDFS分布式文件系统 常用命令汇总

    Hadoop HDFS分布式文件系统常用命令汇总 Hadoop HDFS分布式文件系统是大数据存储和处理的核心组件。作为一个分布式文件系统,HDFS提供了高可靠性、高可扩展性和高性能的存储解决方案。在使用HDFS时,经常需要执行...

    I001-hadoophdfs-mkdirs.7z

    这个"I001-hadoophdfs-mkdirs"压缩包可能包含详细的Hadoop HDFS使用指南,关于`mkdirs`命令的用法示例,以及如何在实际大数据项目中运用这些知识的实践案例。学习这些内容对于理解和操作Hadoop集群至关重要,特别是...

    window客户端连接hadoop hdfs,完美解决障碍

    5. **测试连接**:配置完成后,使用`hadoop fs -ls`命令检查是否能成功列出HDFS上的目录。 除了命令行工具,还可以使用Hadoop的Java API在Windows上开发应用程序,与HDFS进行交互。这需要在项目中引入Hadoop的相关...

    Hadoop hdfs文件操作,mr demo,topN demo

    例如,可以使用`hadoop fs -put`命令将本地文件上传到HDFS,用`hadoop fs -get`下载文件,`hadoop fs -rm`删除文件,`hadoop fs -mv`移动文件,以及`hadoop fs -ls`列出目录内容。 接着,MapReduce是一种编程模型,...

    Hadoop HDFS初级部分

    ### Hadoop HDFS初级部分知识点概述 #### 一、HDFS简介 **HDFS**(Hadoop Distributed File System)是Hadoop项目的核心子项目之一,它是一个分布式文件系统,旨在为海量数据提供高吞吐量的访问能力。HDFS的设计目标...

    Hadoop HDFS配置

    ### Hadoop HDFS配置详解 #### 一、JDK安装与环境配置 为了确保Hadoop能够正常运行,首先需要在所有服务器上安装JDK。在本案例中,选择了JDK 1.6版本进行安装,并将它解压到了`/usr/local/jdk1.6`目录下。 **具体...

    hadoop HDFS增删改

    ### Hadoop HDFS 增删改操作及配置详解 Hadoop 分布式文件系统 (HDFS) 是 Hadoop 的核心组件之一,主要用于存储大量数据并支持这些数据的大规模处理。本文将根据提供的文档信息,深入探讨 HDFS 中涉及的增、删、改...

    在Windows上安装Hadoop HDFS和MapReduce框架1

    - 使用命令`hadoop fs -ls /`查看HDFS根目录内容。 - 使用命令`hadoop fs -mkdir /test`创建测试目录。 - 使用命令`hadoop fs -put C:\path\to\localfile /test`上传本地文件到HDFS。 - 使用命令`hadoop fs -get /...

    Hadoop-HDFS常用命令

    Hadoop-HDFS常用命令

    HDFS命令指南相关学习

    这些HDFS命令对于日常的数据操作至关重要,包括数据上传、下载、查看、权限管理等。熟悉并熟练使用这些命令能够大大提高Hadoop环境中的工作效率。在实际工作中,根据具体需求灵活运用这些命令,可以实现对HDFS的高效...

    Hadoop HDFS文件系统技术概述.pptx

    Hadoop HDFS文件系统技术概述 Hadoop Distributed File System(HDFS)是一种分布式文件系统,旨在提供高容错、可靠、可扩展的文件存储解决方案。HDFS来自Google的GFS(Google File System),是GFS的开源版本。 ...

    Hadoop HDFS文件系统技术概述.pdf

    1. HDFS Client:文件切分、文件上传、与NameNode交互、与DataNode交互、命令管理HDFS。 2. NameNode:master,管理HDFS的名称空间、管理数据块映射信息、配置副本策略、处理客户端读写请求。 3. DataNode:Slave,...

    Hadoop HDFS应用

    在Hadoop HDFS应用的讨论中,涉及到多个核心知识点。首先,HDFS(Hadoop Distributed File System)是一种分布式文件系统,旨在提供高吞吐量的数据访问,非常适合于大规模数据集的应用。HDFS具有高容错性的特点,...

    hadoop 2.7.1 hdfs-over-ftp

    在本文档中,我们首先了解了如何通过Hadoop 2.7.1实现HDFS与FTP的结合使用,称为hdfs-over-ftp。为了实现这一功能,我们需要经过几个步骤来配置和启动一个支持Hadoop文件系统的FTP服务器。 首先,文档提到了安装和...

    Hadoop_HDFS安装和管理

    ### Hadoop HDFS安装与管理知识点详解 #### 一、Hadoop HDFS概述 Hadoop是一种分布式计算框架,主要用于处理大规模数据集。它由多个组件组成,其中最核心的是Hadoop Distributed File System (HDFS) 和 MapReduce。...

    hadoop的hdfs笔记

    #### 二、HDFS命令详解 HDFS提供了一系列的命令用于管理文件系统。这些命令类似于Unix/Linux系统中的命令,对于熟悉Linux命令行的用户来说非常友好。 ##### 1. 使用`usage`或`help`查看帮助 - **命令格式**: ``` ...

    高级软件人才培训专家-Hadoop课程资料-2-第二章 - 分布式存储 Hadoop HDFS

    ### 高级软件人才培训专家-Hadoop课程资料-2-第二章 - 分布式存储 Hadoop HDFS #### 重要知识点解析 ##### 1. 为什么需要分布式存储 随着信息技术的发展,数据量呈爆炸性增长趋势,单个服务器已经无法满足大规模...

    Hadoop中一些hdfs的命令

    ### Hadoop与HDFS命令详解 #### 一、HDFS基本概念 Hadoop是一个能够对大量数据进行分布式处理的软件框架,它支持大规模数据集的分布式处理,是大数据技术领域的重要组成部分。Hadoop的核心组件之一是HDFS(Hadoop ...

Global site tag (gtag.js) - Google Analytics