查看集群状态:
hadoop dfsadmin -report
显示块的信息,包括:备份数量,存在哪个节点,保存状态
hadoop fsck /user/ak47/tmp_0.gz -files -racks -blocks
检查HDFS状态:
hadoop fsck {path}
举例:
hadoop fsck /user
举例:
hadoop fsck /user
使用distcp在集群间进行文件复制(在dist机器执行)
hadoop distcp hdfs://{src_host_ip}:9000/log/src/FCACCESS/20110105/00 hdfs://{dist_hostname}:9000/log/src/FCACCESS/20110105/00
手动 关闭/打开 服务
hadoop-daemon.sh start/stop jobtracker/namenode/datanode
关闭安全模式:
hadoop dfsadmin -safemode leave
马上开始一个测试Mapreduce job
hadoop-0.20 fs -mkdir input
hadoop-0.20 fs -put /etc/hadoop-0.20/conf/*.xml input
hadoop-0.20 fs -ls input
hadoop-0.20 jar /usr/lib/hadoop-0.20/hadoop-*-examples.jar grep input output 'dfs[a-z.]+'
hadoop-0.20 fs -put /etc/hadoop-0.20/conf/*.xml input
hadoop-0.20 fs -ls input
hadoop-0.20 jar /usr/lib/hadoop-0.20/hadoop-*-examples.jar grep input output 'dfs[a-z.]+'
冒烟测试
测试HDFS性能
hadoop jar hadoop-test*.jar TestDFSIO -write -nrFiles 10 -fileSize 1000 # 测试write
hadoop jar hadoop-test*.jar TestDFSIO -read -nrFiles 100 -fileSize 100 # 测试read
hadoop jar hadoop-test*.jar TestDFSIO -clean # 清除生成数据
hadoop jar hadoop-test*.jar TestDFSIO -read -nrFiles 100 -fileSize 100 # 测试read
hadoop jar hadoop-test*.jar TestDFSIO -clean # 清除生成数据
排序测试
hadoop jar hadoop-examples-*.jar teragen 10000000 /user/hadoop/input_dir
hadoop jar hadoop-examples-*.jar terasort /user/hadoop/input_dir /user/hadoop/output_dir
#4台内存32GB、8core,1T*6磁盘、map slot 32个、reduce slot 16个,耗时37s
hadoop jar hadoop-examples-*.jar terasort /user/hadoop/input_dir /user/hadoop/output_dir
#4台内存32GB、8core,1T*6磁盘、map slot 32个、reduce slot 16个,耗时37s
求PI值
hadoop jar hadoop-examples-*.jar pi 10 100
相关推荐
Hadoop Shell是一个命令行界面,允许用户直接与Hadoop分布式文件系统(HDFS)进行交互,执行文件系统操作,管理Hadoop集群中的数据。 HDFS命令有两种风格的命令,分别是带有“hadoop fs”前缀和“hdfs dfs”前缀的...
而掌握Hadoop Shell命令是进行数据管理和操作的基础技能之一。 ### Hadoop Shell 命令详解 #### 1. **hadoop fs** `hadoop fs` 命令是访问HDFS(Hadoop分布式文件系统)的主要方式,提供了与文件和目录相关的各种...
【标题】"Hadoop Shell操作与程序开发"涵盖了在分布式计算环境Hadoop中进行命令行交互和编写应用程序的核心概念。Hadoop是一个开源框架,专为处理和存储大量数据而设计,它利用分布式文件系统(HDFS)和MapReduce...
### 大数据中Hadoop Shell介绍 在大数据处理领域,Hadoop无疑占据着举足轻重的地位。Hadoop是一款能够高效存储和处理大规模数据集的开源软件框架,它支持在集群环境中运行分布式应用程序。为了更好地管理和操作...
Hadoop Shell命令是Hadoop提供的一组命令行工具,使得用户可以通过命令行界面(CLI)与HDFS进行交互。HDFS可以使用命令行、Web接口或Java API进行操作。本文档将详细介绍如何使用Hadoop Shell命令来操作HDFS,包括...
该文档记录了在linux的shell环境下执行的hadoop的相关操作命令,包括多hafs文件的相关操作
hadoop shell 伪分布式
### Hadoop Shell命令详解 #### 一、概述 Hadoop Shell命令是针对Hadoop系统的一系列操作命令集合,主要用于管理Hadoop集群中的数据和任务。这些命令为用户提供了一个直观便捷的方式来与Hadoop交互,实现对分布式...
这里囊括了所有操作hadoop的shell命令,十分齐全,,。
Hadoop 是一款流行的开源分布式存储与计算框架,其核心是 Hadoop Distributed File System(HDFS),这是一个高度容错性的系统,适合在廉价硬件上运行。HDFS的设计宗旨是存储大文件,并且提供高吞吐量的数据访问,...
在Hadoop生态系统中,Shell脚本扮演着至关重要的角色,特别是在大数据处理和集群管理中。这些脚本通常用于自动化任务,如数据迁移、作业调度、集群监控等。下面我们将深入探讨Hadoop Shell脚本的相关知识点。 一、...
《Hadoop Shell实战指南》第四章主要探讨了在Hadoop生态系统中如何利用Shell命令行工具进行数据处理和管理。这一章对于理解Hadoop集群操作、数据处理流程以及优化Hadoop作业执行至关重要。以下是对本章内容的详细...
Hadoop Shell 命令自动完成用法与您每天使用的 Bash 自动完成类似,按两次TAB键: TAB TAB 。无需安装获取脚本,假设您将其保存到~/bin/hadoop-completion.sh : curl ...
### Hadoop下的Shell命令详解 #### 一、前言 Hadoop是一款开源软件框架,用于分布式存储和处理大型数据集。它主要由两个核心组成部分构成:HDFS(Hadoop Distributed File System)和MapReduce。HDFS负责数据的...
### Hadoop的Shell接口和Java接口知识点解析 #### 一、Shell接口操作 **1. 文件上传** - **步骤**: 使用`hadoop fs -put <from> <to>`命令进行文件上传。 - **注意事项**: - 需要确保文件已存在于本地文件系统...
本资源摘要信息主要介绍了Hadoop的相关知识点,涵盖了Hadoop的版本、4V特征、大数据存储、HDFS、MapReduce、SecondaryNameNode、Hadoop shell命令、集群管理工具等方面。 1. Hadoop的最高版本是Hadoop 3.x,当前...
### Hadoop2安装与常用Shell命令详解 #### Hadoop2安装步骤 在开始Hadoop2的安装之前,首先需要确保所有节点的操作系统版本为CentOS/Red Hat Linux 6.4_x64,并且每台服务器都已完成基本的系统配置。 ##### 系统...
- **熟练使用Hadoop Shell操作集群**:掌握Hadoop Shell的基本命令及高级用法,能够高效地管理和操作Hadoop集群。 - **了解Hadoop各个节点HDPData文件夹**:熟悉HDPData文件夹在集群中的作用,以及它对HDFS(Hadoop ...
本课将介绍Hadoop的shell命令,如hadoop fs系列命令,以及如何使用Hadoop执行MapReduce程序,使学员能便捷地进行数据导入、导出和管理。 第六课时:Hadoop生态系统 Hadoop并不止于HDFS和MapReduce,还包括一系列...