`
小网客
  • 浏览: 1241089 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Hadoop之TestDFSIO

 
阅读更多

概述:

TestDFSIO为测试HDFS的IO性能,通过MR进行并发读写并做结果的统计。主要涉及,读,随机读,写,追加写,清空测试环境

使用:

清空:

bin/hadoop jar share/hadoop/mapreduceX/hadoop-test-XXX.jar TestDFSIO -clean

 写:

bin/hadoop jar share/hadoop/mapreduceX/hadoop-test-XXX.jar TestDFSIO  -write -nrFiles 10000 -fileSize 1 -resFile 1res.log

参数说明:

nrFiles:标示10000个文件

fileSize:标示1M

resFile:统计结果文件

结果说明:

       Number of files: 10000 --文件个数
Total MBytes processed: 10000.0 --总量
     Throughput mb/sec: 9.489862928419862--吞吐量
Average IO rate mb/sec: 12.854496002197266--平均IO率
 IO rate std deviation: 4.13103623338331--标准差
    Test exec time sec: 1765.421--耗时

读取操作:

 

bin/hadoop jar share/hadoop/mapreduceX/hadoop-test-XXX.jar TestDFSIO  -read -nrFiles 10000 -fileSize 1 -resFile 1res.log

 

结果等同于write

 

PS:

默认测试文件的路径为:/benchmarks/TestDFSIO

可以通过-rootDir指定

同时也可以指定bufferSize,默认为1000000

0
0
分享到:
评论

相关推荐

    Hadoop 三个配置文件的参数含义说明

    在Hadoop生态系统中,配置文件对于集群的正常运行至关重要。主要涉及三个核心配置文件:`core-site.xml`、`hdfs-site.xml`和`mapred-site.xml`。这些文件定义了Hadoop系统的各种参数,包括但不限于端口设置、存储...

    Hadoop 安装文档 性能测试

    常用的测试工具有Hadoop自带的Benchmark工具如`hadoop dfsio`和`testDFSIO`等。通过执行这些工具的不同模式(如读、写、随机读等),可以评估Hadoop集群的性能表现,为后续的调优提供数据支持。 #### 四、结语 ...

    hadoop性能测试报告

    - **写测试**:通过执行TestDFSIO工具,向Hadoop集群写入10个1000MB的文件,平均写入速率达到了约20.2MB/s,测试执行时间约为104.69秒。这意味着集群在写入大量数据时具有稳定的吞吐量。 - **读测试**:读取同样...

    hadoop工具包中的share包

    7. **测试框架**:为了确保Hadoop的各个组件能够正常工作,share包还提供了测试框架,如`TestDFSIO`,用于测试HDFS的读写性能。 总的来说,Hadoop的share包是整个Hadoop生态系统的基石,它提供了一套标准化的接口和...

    Hadoop集群测试报告.pdf

    通过执行`TestDFSIO-write`命令进行了10次连续写操作的测试,测试结果记录在表格中。这里我们关注的主要指标是吞吐量(Throughput)和平均I/O速率(Average I/O rate),这两个指标直接反映了HDFS系统的写入性能。具体的...

    英特尔Hadoop发行版 2.2 开发者指南

    - **样例程序**:包括TestDFSIO(用于压力测试HDFS I/O性能)、TeraSort基准套件(衡量Hadoop排序能力)和NameNode基准(nnbench,用于评估NameNode的性能)。这些样例代码详细展示了如何编写和运行Hadoop作业,有...

    Hadoop 分布式部署配置及基准性能测试

    【Hadoop分布式部署配置及基准性能测试】 在大数据处理领域,Apache Hadoop 是一个关键的开源框架,它允许在分布式环境中存储和处理大规模数据。本文将详细介绍如何在Hadoop v3.3.3版本下进行分布式集群的部署,并...

    hadoop-mapreduce-client-jobclient-0.23.1.jar

    hadoop-mapreduce-client-jobclient-0.23.1.jar 用来进行HDFS的基本测试 可以进行IO读写等功能的测试

    Hadoop平台基准性能测试研究_张新玲.pdf

    为了确保测试结果的准确性和可比性,采用了Hadoop自带的测试包`hadoop-test.jar`中的`TestDFSIO`方法来执行读写操作。实验环境配置如表1所示,包含了8台服务器节点,其中每台服务器均配备了高性能的CPU(Intel E5-...

    HadoopMiniCluster:使用 Hadoop MiniCluster 进行测试

    - **替代方案**:对于最新版本的Hadoop,可以考虑使用更现代的测试框架,如Apache Hadoop Testing Utility或者TestDFSIO等,它们提供了更全面的测试支持。 - **局限性**:MiniCluster无法完全模拟生产环境的所有...

    tachyon-test

    测试 HDFS写bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-2.6.0-tests.jar TestDFSIO -write -nrFiles 24 -fileSize 1000 -seq &>> hadoop_write_rp1.log序列读取bin/hadoop jar share...

    某大数据平台针对车联网场景的各个组件参数调优POC说明

    - **测试方法**:使用Hadoop自带的TestDFSIO工具进行测试,包括读写测试和带宽测试。 - **测试结果分析**:根据测试结果调整相关参数,进一步优化系统性能。 通过以上详细的参数调优指南,可以显著提高大数据平台在...

    big_data:有关Hadoop,MapReduce,Spark,Docker的教程的集合

    有关Hadoop,Spark等的一些教程和演示,主要是Jupyter笔记本的形式。 使用MapReduce Streaming和bash创建映射器和化的MapReduce简介 一个非常基本的MapReduce单词计数示例 一个简单的MapReduce作业,带有mrjob ...

    云计算环境下网络节点流量检测算法.pdf

    例如,可以参考WordCount、TestDFSIO读取等基准测试,通过优化这些测试的算法流程,使网络流量检测更加有效。 7. 大数据环境下的流量分析 流量分析是大数据时代下对网络节点流量进行实时检测和处理的重要组成部分。...

Global site tag (gtag.js) - Google Analytics