`

杂七杂八

阅读更多
*************************************************************************************************************
*************************************************************************************************************
http://qa.baidu.com/blog/?p=59                                           --百度hadoop集群测试遇到的问题及测试方法
http://www.infoq.com/cn/news/2010/07/facebook-hadoop-summit              --Facebook Hadoop,Hive,HBase和 A/B测试     ps:scribe日志切分对比nginx 服务器切分性能对比
http://blog.csdn.net/v_july_v/article/details/6704077                    --学习hadoop内部机制,及淘宝的数据魔方架构内部介绍

首先得分析分布式概念,分布式文件系统、分布式计算
分布式集群分为哪几种。水平集群、垂直集群、

hadoop用java语言实现分布式基础框架,分布式java应用基础

hadoop分布式集群测试方法:

HDFS的吞吐量, 由此推测出其集群中存在的性能。    --HDFS mock             暴风的做法: mapslots * blocksize = 吞吐量 。。map是吞量,reduce的吐量就不好计算了    --
baofeng的HDFS文件块默认为多大 ? 64MB ?

map的分布方式,因该不是一个slot对应一个map

baofeng的hadoop集群中的HDFS访问方式 ?
对PB级的数据量的数据源数据进行分析,测试关注点是其性能及准确性

HDFS ---DistributedFSCheck功能,实现文件系统一致性的分布式检查
        TESTDFSIO               分布式的I/O基准
        dfsthroughput           测量HDFS的吞吐量 
        loadgen                 通用的MapReduce加载产生器
        mrbench                 创建大量小作业的MapReduce基准
        nnbench                 NameNode的性能基准
        testarrayFile           对有键值对的文本文件的测试
        threadedmapbench        对比输出一个排序块的Map作业和输出多个排序块的Map作业的性能

hadoop程序输入目录的标准化,程序往hdfs指定目录输入数据完全没有问题,文件路径和格式均为正确,但是结果文件确实为空。

=============================================================================================================================
一些测试工具
我们常常需要对HDFS或者mapreduce进行一些性能方面的测试,比如测试rpc的性能,测试DFS的IO读写性能,测试DFS的吞吐率性能,测试namenode的benchmark性能,mapreduce的sort性能等等。在hadoop的发行版中,其实已经提供了许多类似的工具,并已经打包成jar,供我们使用。以下是0.20.2中自带的一系列工具列表:

DFSCIOTest Distributed i/o benchmark of libhdfs.
DistributedFSCheck Distributed checkup of the file system consistency.
MRReliabilityTest A program that tests the reliability of the MR framework by injecting faults/failures
TestDFSIO Distributed i/o benchmark.
dfsthroughput measure hdfs throughput
filebench: Benchmark SequenceFile(Input|Output)Format (block,record compressed and uncompressed), Text(Input|Output)Format (compressed and uncompressed)
loadgen Generic map/reduce load generator
mapredtest A map/reduce test check.
minicluster Single process HDFS and MR cluster.
nnbench A benchmark that stresses the namenode.
testbigmapoutput A map/reduce program that works on a very big non-splittable file and does identity map/reduce
testfilesystem A test for FileSystem read/write.
testrpc A test for rpc
testsequencefile A test for flat files of binary key value pairs.
threadedmapbench: A map/reduce benchmark that compares the performance of maps with multiple spills over maps with 1 spill
==================================================================================================================================
                                                  hive
hive只是采用了行存储的方式兼存储和读取数据.                --效率低
当在hive中读取某一列时,先要取出所有数据然后再取某一行。   --占用较多的磁盘空间

淘宝数据魔方里的缓存穿透、架构、空数据缓存这些和Hadoop一点关系都么有.

关于MR/Hadoop的一些关键点没有讲到,比如:已有的并行计算模型(如:多线程、MPI/OpenCL)存在哪些问题?而MR/Hadoop是如何解决他们的。


Datanode在集群中一般是一个节点一个,负责管理节点上它们附带的存储。在内 部,一个文件其实分成一个或多个block,这些block存储在Datanode集合里。
Namenode执行文件系统的namespace操作,例如 打开、关闭、重命名文件和目录,同时决定block到具体Datanode节点的映射。
Datanode在Namenode的指挥下进行block的创 建、删除和复制。                                                             --切记几个动作
==================================================================================================================================
分布式改造的准入原则
并不是所有的测试执行都可以分布式化,在我们的实际操作过程中,总结出以下几点准入原则,供参考:
1、空白机器可运行。通过一个总控脚本就可以做到依赖环境准备,lib库安装,测试case执行等。
2、测试框架允许case并行。
3、业务层case对外部不存在固定依赖,例如依赖于某个写死的目录。
4、业务层case依赖的server端口,最好是随机的。
5、不允许业务层去操作公共环境。


后续可能的技术方向
1、case按照执行时间切分。按照时间切分来替代按照case数切分。
2、从分布式测试执行过渡到云测试服务。
分享到:
评论

相关推荐

    java杂七杂八 java杂七杂八

    java杂七杂八java杂七杂八java杂七杂八java杂七杂八

    linux 杂七杂八的资料

    【标题】:“Linux 杂七杂八的资料”这一压缩包包含了多个与Linux操作系统相关的学习材料,涵盖了从基本概念到高级应用的多个方面。 【描述】:描述中的重复表明这个资料包是关于Linux的广泛主题,可能包括了教程、...

    小学语文近义词杂七杂八的近义词有哪些及造句

    "杂七杂八"这个词,意指事物繁多且无秩序,通常用来形容物品或事情混杂在一起的情况。它的近义词包括"杂乱无章"、"参差不齐"、"错落有致"、"七零八落"等,这些词都有类似的含义,表示事物排列混乱或种类繁多。 1. ...

    Android代码-跟安卓相关杂七杂八攒在一起存着

    杂七杂八攒在一起存着 目录: [apps-for-android-master]() [BmobExample]() [bookmanager]() [FirebaseSample]() [Gson_Fastjson_for_Json]() [highlight]() [Kyhelper]() [mytoolbar]() [Okdroid]() ...

    Linux shell 参考文档 杂七杂八留下的代码

    文档中的"杂七杂八留下的代码"可能涵盖了日常工作中遇到的各种问题的解决方案,对于学习和提升Linux技能非常有帮助。 在Linux Shell中,用户可以执行系统级操作,如文件管理、进程控制、网络配置等。例如,`ls`命令...

    C++ Builder杂七杂八 都是收藏的编程方面的

    在"杂七杂八 都是收藏的编程方面"这个主题中,我们可以深入探讨C++ Builder的一些关键知识点,以及与之相关的编程技巧。 首先,C++ Builder提供了VCL(Visual Component Library)框架,它是一套面向对象的类库,...

    模糊控制的一些杂七杂八的资料

    模糊控制的一些杂七杂八的资料:模糊控制ch1ch2.ppt模糊控制ch3基本原理.ppt包模糊控制ch4应用实例.ppt包]模糊控制ch5改善系统性能的方法.ppt模糊控制算法c程序.doc模糊算法在智能车控制中的应用.pdf模糊控制算法...

    杂七杂八的测试资料

    这些压缩包中的文件主要涵盖了软件测试的不同方面,包括性能测试、单元测试、自动化测试和测试框架等关键领域。以下是对每个文件内容的详细说明: 1. **软件性能测试过程详解与案例剖析.pdf**:这份文档可能详细...

    杂七杂八的PID控制算法资料

    PID的详细调试.pdfPID电机控制.pdfPID调节规律和过程控制.pdf PID过程控制及其参数整定.pdfPID控制算法的C语言实现.PID算法.pdf数字PID及其改进算法.pdf由入门到精通吃透PID.pdf增量式PID.docx

    python杂七杂八小项目合集.zip

    软件开发设计:应用软件开发、系统软件开发、移动应用开发、网站开发C++、Java、python、web、C#等语言的项目开发与学习资料 硬件与设备:单片机、EDA、proteus、RTOS、包括计算机硬件、服务器、网络设备、存储设备...

    summary:杂七杂八的东西

    平时想到的一些杂七杂八的东西 版本 2021-02-19 将大屏展示弄成组件化 2018-11-30 添加了一些东西,也修改了一下里面的文件夹的结构,内容没有变 结构目录 aboutMap 关于地图的一些 BaiduMapTile使用C#写的,可以...

    算法集合(杂七杂八的一大堆)

    广义表 图元识别 josep排列 jose排列 inver逆序表 paren括号匹配 expr波兰表达式 二叉树(满 前缀 同构 后缀 ) 多机调度 简单路径 非递归遍历 进制方程 嵌套 等价类划分 等等 太多了 不写了 自己下载了看看吧

    camp:代码片段集中营.杂七杂八

    杂七杂八" 暗示这是一个包含多种编程语言或技术的代码库,可能是一个学习资源或者开发者个人的代码收藏。"杂七杂八"一词表明其中涵盖了各种不同的主题和用途,可能没有特定的主线,而是以实用性和多样性为主。 ...

    js代码-杂七杂八的

    在"js代码-杂七杂八的"这个主题中,我们可以深入探讨JavaScript的多个方面,包括基本语法、变量、数据类型、控制结构、函数、对象、DOM操作以及事件处理等。 1. 基本语法:JavaScript是基于ECMAScript规范的,它...

    杂七杂八的系统:安卓即时通讯;安卓微博前端;SSM采购系统;jsp网上论坛;纯前端展示页面(毕设&课设&实训&大作业&竞赛&项目

    项目工程资源经过严格测试可直接运行成功且功能正常的情况才上传,可轻松复刻,拿到资料包后可轻松复现出一样的项目,本人系统开发经验充足(全领域),有任何使用问题欢迎随时与我联系,我会及时为您解惑,提供帮助...

    Springboot_v2:SpringBoot_v2项目是努力打造springboot框架的极致细腻的脚手架。包括一套漂亮的前台。无其他杂七杂八的功能,原生纯净

    无其他杂七杂八的功能,原生纯净。 服务器演示:http://47.99.218.99:8080/ 账号:admin密码:admin 项目介绍 努力打造一个免费的开源,注释全,文档全适合新手学习,方便快速二次开发的框架。 1.没有基础版,没有...

    弹幕通知插件源码 信息弹幕高级插件版 高能弹幕条 信息弹幕效果.zip

    实现B2主题右下角用户购买记录提示弹幕功能一览插件安装,随装随卸,无需杂七杂八配置。购买隐藏内容付费文件弹幕购买商城物品信息弹幕打赏信息弹幕认证信息弹幕充值信息弹幕兑换积分弹幕购买会员弹幕弹幕在手机端...

Global site tag (gtag.js) - Google Analytics