一、背景
最近2个月时间一直在一个阴暗的地下室的角落里工作,主要内容就是hadoop相关的应用。在这期间,Hadoop的应用确实得到认可,但是同时也带来了一些问题,软件方面我就不在这里说了,只说说一些物理方面的局限:
1、众所周知,hadoop能够接受任何类型的机器加入集群,在多不在精。但是这带来一个问题,机房的空间开销以及电费。
2、机器太多,人力维护成本也是增加的。机柜啊、物理空间都是个不小的负担和开销。
刚好,在这个问题产生的同时,十分幸运的被一同事叫出来,去参加一个会议,得以有机会走上地面。这个会议是个联合性质的,多个公司的人在一起。其中有一家公司在海量数据计算方面力推hadoop,并做了比较好的配套开发工作。比如工作流、数据清洗过滤、输出数据管理等。其实这些应用模型都大同小异。但最引起我关注的是他们的硬件方面的选型,确实很有新意(当然,可能由于我对硬件不熟悉,说的不对还望朋友们别笑话)。
二、具体内容
在昨天会议上,对方提到了自己采用的硬件设备,能很好的解决物理空间和维护成本的问题(当然,我也碰到不在乎空间和电费的主。地方有的是,就是希望把以前淘汰的机器都用上)。他们的机器类型是一款2U的设备,在这个2U的机器上集成了4块主板,12块硬盘。什么意思呢,说白了,就是把4台机器集成到了一个2U的设备上。除了电源共用(没问电源多少瓦的,一激动,忘记问了),其他都是独立的。这样的机器类型大大的节约了物理空间。试想一下,一个机柜10台2U设备,传统的只能存放10台节点机器。如果换成这样的2U设备,可以存放4×10=40台节点机器,空间利用缩小,这样的机器我觉得还是很客观的。
三、总结
1、我不是在做广告,只是觉得这样的硬件类型确实是很适合hadoop集群的使用。
2、硬件方面我不是很熟悉,可能熟悉硬件的朋友对这个都比较了解了,所以我说错了还望指出来。
3、分布式计算的集群确实可以很好的解决海量计算问题,但是带来规模庞大的硬件数量确实在空间和电费上是个挑战。
4、写的不对或是有争议的地方,随时欢迎大家发邮件讨论:dajuzhao@gmail.com
分享到:
相关推荐
从成本方面考虑,分布式集群存储利用成本较低的标准硬件组件,能够大大降低总体成本。与使用少量昂贵高端服务器的传统存储方式相比,集群存储不仅成本低廉,而且能够通过增加更多节点的方式,而不是增加单个节点的...
尤其是在军事信息系统中,大数据分析和数据安全的需求推动了分布式集群平台的发展,而国产化软硬件在其中扮演着举足轻重的角色。基于Hadoop架构的国产化分布式集群平台的构建,不仅是一种技术上的革新,更是适应...
Hadoop分布式集群搭建的...总结来说,Hadoop分布式集群的搭建是一个涉及到硬件环境、软件安装、网络配置、系统参数调优等多方面知识的综合过程。搭建完成后,应该进行充分的测试以确保集群的稳定性和性能表现符合预期。
### Hadoop完全分布式集群搭建详解 #### 一、概述 Hadoop是一款开源的大数据处理框架,主要用于处理海量数据。为了实现高效的数据处理能力,Hadoop通常会在多台计算机上搭建分布式集群。本文将详细介绍如何搭建一...
在大型应用中,单台Memcache服务器可能无法满足高并发和大容量的需求,这时就需要搭建Memcache的分布式集群。 在标题提到的“memcache缓存分布式集群”中,主要涉及以下知识点: 1. **分布式存储原理**:分布式...
在分布式集群框架服务平台中,ESB充当了不同系统间沟通的桥梁,PaaS则负责提供基础资源和服务的平台化管理。通过PaaS提供的基础服务能力,结合ESB实现的服务总线,能够使各种业务应用在平台上高效稳定地运行,同时...
在开始搭建Hadoop完全分布式集群之前,需要确保已经准备好相应的硬件资源和软件环境。本篇指南旨在为初学者提供一个全面且详细的Hadoop集群搭建流程,以便更好地理解和掌握大数据处理的基本架构。 #### 二、硬件...
构建渲染农场的目的在于通过分布式集群运算,将渲染工作分解为多个子任务,这些子任务被分配给网络中的各个渲染节点进行处理,从而实现渲染工作负荷的有效分担。 分布式系统是一种计算机系统,它由多个可通过网络...
### hadoop HA高可用性完全分布式集群安装 在大数据处理领域,Hadoop作为一个开源软件框架,主要用于分布式存储和处理大规模数据集。为了提高系统的稳定性和可靠性,Hadoop提供了高可用性(High Availability,简称...
基于Hadoop分布式集群搭建方法研究的知识点包含以下几个方面: 1. Hadoop简介与大数据分布式基础架构: Hadoop是一个开源的大数据平台,由Apache软件基金会支持。它包括HDFS(Hadoop分布式文件系统)和MapReduce...
在【标题】中提到的“Hadoop-搭建分布式集群”,实际上指的是搭建 Hadoop 系统,其中“伪分布式集群”是一种常见的部署方式。在伪分布式模式下,所有的 Hadoop 守护进程(如 NameNode、DataNode、JobTracker、...
而分布式集群处理环境平台软件技术,便是这一技术领域中的重要进展,它针对嵌入式设备资源有限、软件集成困难、通信环境复杂等问题,提出了一种有效的解决方案。 在嵌入式系统领域,设备的硬件资源通常较为有限,这...
在实际应用中,Hadoop通常运行在由多台服务器组成的集群环境中,但为了方便学习和测试,可以搭建一个伪分布式集群(Pseudo Distributed Cluster)。伪分布式集群是指所有Hadoop守护进程都在同一台机器上运行,每个...
在CentOS 7上搭建MinIO分布式集群是一项重要的IT任务,这将帮助我们构建一个可扩展、高可用的云存储解决方案。下面将详细阐述如何在CentOS 7系统上实现这个过程。 首先,我们需要了解MinIO的基本概念。MinIO由多个...
在配置Hadoop-0.21.0分布式集群时,首先要考虑的是硬件环境。在这个例子中,我们有三台Linux系统的机器,每台都装有JDK 1.6.0。为了保证集群间的通信,每台机器的主机名和IP地址必须能够正确解析。可以通过`ping`...
Ceph是一种开源的分布式...总之,Ceph分布式集群的部署涉及多个环节,从硬件规划、软件安装、组件配置到集群监控,都需要深入理解和实践。正确部署和管理Ceph集群,能够为大规模数据存储和处理提供强大而可靠的支撑。
构建Hadoop分布式集群环境是一项涉及多个知识点的复杂任务,它要求系统管理员或大数据工程师具备对Hadoop架构、云计算平台和Linux操作系统深入的理解和实践经验。下面将详细介绍在构建Hadoop分布式集群时所需的知识...
在**分布式集群配置**中,每台机器需要有唯一的ID以区分。在hosts文件中,你需要添加节点间的IP和主机名映射,确保网络连通。配置完成后,通过SSH测试节点间的连接。接下来,设置master节点的SSH,使其能免密登录到...