`

Hadoop TestDFSIO

 
阅读更多

@VM

 

[bigdata@bigdata hadoop]$ hadoop jar hadoop-test-1.0.4.jar TestDFSIO -write -nrFiles 10 -fileSize 20

Warning: $HADOOP_HOME is deprecated.

 

TestDFSIO.0.0.4

13/04/21 12:54:47 INFO fs.TestDFSIO: nrFiles = 10

13/04/21 12:54:47 INFO fs.TestDFSIO: fileSize (MB) = 20

13/04/21 12:54:47 INFO fs.TestDFSIO: bufferSize = 1000000

13/04/21 12:54:48 INFO fs.TestDFSIO: creating control file: 20 mega bytes, 10 files

13/04/21 12:54:48 INFO fs.TestDFSIO: created control files for: 10 files

13/04/21 12:54:48 INFO mapred.FileInputFormat: Total input paths to process : 10

13/04/21 12:54:48 INFO mapred.JobClient: Running job: job_201304060732_0008

13/04/21 12:54:49 INFO mapred.JobClient:  map 0% reduce 0%

13/04/21 12:55:02 INFO mapred.JobClient:  map 20% reduce 0%

13/04/21 12:55:09 INFO mapred.JobClient:  map 40% reduce 0%

13/04/21 12:55:15 INFO mapred.JobClient:  map 60% reduce 0%

13/04/21 12:55:18 INFO mapred.JobClient:  map 60% reduce 13%

13/04/21 12:55:21 INFO mapred.JobClient:  map 80% reduce 20%

13/04/21 12:55:27 INFO mapred.JobClient:  map 100% reduce 26%

13/04/21 12:55:41 INFO mapred.JobClient:  map 100% reduce 100%

13/04/21 12:55:46 INFO mapred.JobClient: Job complete: job_201304060732_0008

13/04/21 12:55:46 INFO mapred.JobClient: Counters: 30

13/04/21 12:55:46 INFO mapred.JobClient:   Job Counters

13/04/21 12:55:46 INFO mapred.JobClient:     Launched reduce tasks=1

13/04/21 12:55:46 INFO mapred.JobClient:     SLOTS_MILLIS_MAPS=45841

13/04/21 12:55:46 INFO mapred.JobClient:     Total time spent by all reduces waiting after reserving slots (ms)=0

13/04/21 12:55:46 INFO mapred.JobClient:     Total time spent by all maps waiting after reserving slots (ms)=0

13/04/21 12:55:46 INFO mapred.JobClient:     Launched map tasks=10

13/04/21 12:55:46 INFO mapred.JobClient:     Data-local map tasks=10

13/04/21 12:55:46 INFO mapred.JobClient:     SLOTS_MILLIS_REDUCES=36159

13/04/21 12:55:46 INFO mapred.JobClient:   File Input Format Counters

13/04/21 12:55:46 INFO mapred.JobClient:     Bytes Read=1120

13/04/21 12:55:46 INFO mapred.JobClient:   File Output Format Counters

13/04/21 12:55:46 INFO mapred.JobClient:     Bytes Written=78

13/04/21 12:55:46 INFO mapred.JobClient:   FileSystemCounters

13/04/21 12:55:46 INFO mapred.JobClient:     FILE_BYTES_READ=833

13/04/21 12:55:46 INFO mapred.JobClient:     HDFS_BYTES_READ=2340

13/04/21 12:55:46 INFO mapred.JobClient:     FILE_BYTES_WRITTEN=239157

13/04/21 12:55:46 INFO mapred.JobClient:     HDFS_BYTES_WRITTEN=209715278

13/04/21 12:55:46 INFO mapred.JobClient:   Map-Reduce Framework

13/04/21 12:55:46 INFO mapred.JobClient:     Map output materialized bytes=887

13/04/21 12:55:46 INFO mapred.JobClient:     Map input records=10

13/04/21 12:55:46 INFO mapred.JobClient:     Reduce shuffle bytes=799

13/04/21 12:55:46 INFO mapred.JobClient:     Spilled Records=100

13/04/21 12:55:46 INFO mapred.JobClient:     Map output bytes=727

13/04/21 12:55:46 INFO mapred.JobClient:     Total committed heap usage (bytes)=2764374016

13/04/21 12:55:46 INFO mapred.JobClient:     CPU time spent (ms)=11070

13/04/21 12:55:46 INFO mapred.JobClient:     Map input bytes=260

13/04/21 12:55:46 INFO mapred.JobClient:     SPLIT_RAW_BYTES=1220

13/04/21 12:55:46 INFO mapred.JobClient:     Combine input records=0

13/04/21 12:55:46 INFO mapred.JobClient:     Reduce input records=50

13/04/21 12:55:46 INFO mapred.JobClient:     Reduce input groups=5

13/04/21 12:55:46 INFO mapred.JobClient:     Combine output records=0

13/04/21 12:55:46 INFO mapred.JobClient:     Physical memory (bytes) snapshot=2931482624

13/04/21 12:55:46 INFO mapred.JobClient:     Reduce output records=5

13/04/21 12:55:46 INFO mapred.JobClient:     Virtual memory (bytes) snapshot=14189375488

13/04/21 12:55:46 INFO mapred.JobClient:     Map output records=50

13/04/21 12:55:46 INFO fs.TestDFSIO: ----- TestDFSIO ----- : write

13/04/21 12:55:46 INFO fs.TestDFSIO:            Date & time: Sun Apr 21 12:55:46 CST 2013

13/04/21 12:55:46 INFO fs.TestDFSIO:        Number of files: 10

13/04/21 12:55:46 INFO fs.TestDFSIO: Total MBytes processed: 200

13/04/21 12:55:46 INFO fs.TestDFSIO:      Throughput mb/sec: 27.359781121751027

13/04/21 12:55:46 INFO fs.TestDFSIO: Average IO rate mb/sec: 31.685556411743164

13/04/21 12:55:46 INFO fs.TestDFSIO:  IO rate std deviation: 10.648457663926225

13/04/21 12:55:46 INFO fs.TestDFSIO:     Test exec time sec: 58.006

13/04/21 12:55:46 INFO fs.TestDFSIO:

分享到:
评论

相关推荐

    某大数据平台针对车联网场景的各个组件参数调优POC说明

    - **测试方法**:使用Hadoop自带的TestDFSIO工具进行测试,包括读写测试和带宽测试。 - **测试结果分析**:根据测试结果调整相关参数,进一步优化系统性能。 通过以上详细的参数调优指南,可以显著提高大数据平台在...

    Hadoop 三个配置文件的参数含义说明

    在Hadoop生态系统中,配置文件对于集群的正常运行至关重要。主要涉及三个核心配置文件:`core-site.xml`、`hdfs-site.xml`和`mapred-site.xml`。这些文件定义了Hadoop系统的各种参数,包括但不限于端口设置、存储...

    hadoop性能测试报告

    - **写测试**:通过执行TestDFSIO工具,向Hadoop集群写入10个1000MB的文件,平均写入速率达到了约20.2MB/s,测试执行时间约为104.69秒。这意味着集群在写入大量数据时具有稳定的吞吐量。 - **读测试**:读取同样...

    Hadoop 安装文档 性能测试

    常用的测试工具有Hadoop自带的Benchmark工具如`hadoop dfsio`和`testDFSIO`等。通过执行这些工具的不同模式(如读、写、随机读等),可以评估Hadoop集群的性能表现,为后续的调优提供数据支持。 #### 四、结语 ...

    hadoop工具包中的share包

    7. **测试框架**:为了确保Hadoop的各个组件能够正常工作,share包还提供了测试框架,如`TestDFSIO`,用于测试HDFS的读写性能。 总的来说,Hadoop的share包是整个Hadoop生态系统的基石,它提供了一套标准化的接口和...

    Hadoop集群测试报告.pdf

    通过执行`TestDFSIO-write`命令进行了10次连续写操作的测试,测试结果记录在表格中。这里我们关注的主要指标是吞吐量(Throughput)和平均I/O速率(Average I/O rate),这两个指标直接反映了HDFS系统的写入性能。具体的...

    英特尔Hadoop发行版 2.2 开发者指南

    - **样例程序**:包括TestDFSIO(用于压力测试HDFS I/O性能)、TeraSort基准套件(衡量Hadoop排序能力)和NameNode基准(nnbench,用于评估NameNode的性能)。这些样例代码详细展示了如何编写和运行Hadoop作业,有...

    Hadoop 分布式部署配置及基准性能测试

    【Hadoop分布式部署配置及基准性能测试】 在大数据处理领域,Apache Hadoop 是一个关键的开源框架,它允许在分布式环境中存储和处理大规模数据。本文将详细介绍如何在Hadoop v3.3.3版本下进行分布式集群的部署,并...

    hadoop-mapreduce-client-jobclient-0.23.1.jar

    hadoop-mapreduce-client-jobclient-0.23.1.jar 用来进行HDFS的基本测试 可以进行IO读写等功能的测试

    Hadoop平台基准性能测试研究_张新玲.pdf

    为了确保测试结果的准确性和可比性,采用了Hadoop自带的测试包`hadoop-test.jar`中的`TestDFSIO`方法来执行读写操作。实验环境配置如表1所示,包含了8台服务器节点,其中每台服务器均配备了高性能的CPU(Intel E5-...

    HadoopMiniCluster:使用 Hadoop MiniCluster 进行测试

    - **替代方案**:对于最新版本的Hadoop,可以考虑使用更现代的测试框架,如Apache Hadoop Testing Utility或者TestDFSIO等,它们提供了更全面的测试支持。 - **局限性**:MiniCluster无法完全模拟生产环境的所有...

    tachyon-test

    测试 HDFS写bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-2.6.0-tests.jar TestDFSIO -write -nrFiles 24 -fileSize 1000 -seq &>> hadoop_write_rp1.log序列读取bin/hadoop jar share...

    big_data:有关Hadoop,MapReduce,Spark,Docker的教程的集合

    有关Hadoop,Spark等的一些教程和演示,主要是Jupyter笔记本的形式。 使用MapReduce Streaming和bash创建映射器和化的MapReduce简介 一个非常基本的MapReduce单词计数示例 一个简单的MapReduce作业,带有mrjob ...

    云计算环境下网络节点流量检测算法.pdf

    例如,可以参考WordCount、TestDFSIO读取等基准测试,通过优化这些测试的算法流程,使网络流量检测更加有效。 7. 大数据环境下的流量分析 流量分析是大数据时代下对网络节点流量进行实时检测和处理的重要组成部分。...

Global site tag (gtag.js) - Google Analytics