`

VMware发布开源项目Serengeti,支持云中部署Apache Hadoop

 
阅读更多

原文 http://www.iteye.com/news/25341

 

全球虚拟化和云基础架构领导厂商VMware公司今天公布了最新开源项目——Serengeti,支持企业能够在虚拟和云环境中快速部署、管理和扩展Apache Hadoop。此外,VMware与Apache Hadoop社区共同合作研发扩展功能,让主要组件可以“感知虚拟化”以支持灵活扩展,并进一步提高Hadoop在虚拟化环境中的性能。


VMware公司云应用服务副总裁陈志璋表示:

引用
通过支持企业充分利用超大型数据而获取竞争优势,Apache Hadoop具有带来业务变革的潜力。它代表了应用正在发生根本性变化的一个方面,而企业也在寻求把这些新技术融入其产品家族的方式。VMware与Apache Hadoop社区合作,支持企业IT部门能够在虚拟和云环境中轻松部署和管理Hadoop。


Apache Hadoop事实上正在成为大数据处理的标准,但部署和运营的复杂性、特定的硬件需求、安全上的顾虑和服务水平保障让很多企业无法充分发挥Hadoop的威力。通过把Apache Hadoop节点从底层物理基础架构剥离,VMware可以将云基础架构的优势带给Hadoop,包括快速部署、高可用性、最佳资源利用率、灵活和安全多租户。

Serengeti基于Apache 2.0许可证。它是一键式部署工具包,支持企业能够利用VMware vSphere平台在几分钟内部署高度可用的Apache Hadoop集群,包括Apache Pig和Apache Hive等常见的Hadoop组件。通过使用Serengeti在VMware vSphere上运行Hadoop,企业可以轻松享受到值得信赖、广泛部署的全球虚拟化平台的高可用性、容错性和现场迁移能力,从而实现Hadoop集群的可用性和可管理性。

OVUM首席分析师Tony Baer表示:

引用
要想成为企业IT基础架构中的佼佼者,Hadoop必须符合企业IT部门的技术和实践需求。大数据集群的资源密集性使得Hadoop必须支持虚拟化。VMware参与Apache Hadoop项目和VMware最新Serengeti Apache项目都是非常重要的举措,为企业提供了在Hadoop原型开发和部署时所需的灵活性。


VMware与Cloudera、Greenplum、Hortonworks、IBM和MapR等领先的Apache Hadoop分销商合作,从而进行广泛分销。

虚拟化扩展、Spring更新帮助企业构建和运营大数据应用

为了简化并加速企业使用Apache Hadoop,VMware与Apache Hadoop社区合作更新Hadoop分布式文件系统(HDFS)和Hadoop MapReduce项目,使其能够感知虚拟化,从而支持数据和计算工作在虚拟基础架构中可以进行最佳分布。这些改变支持企业能够实现更灵活、更安全且高度可用的Hadoop集群。

VMware还发布了Spring for Apache Hadoop(2012年2月首次发布的开源项目)的更新,让企业开发者能够轻松利用Apache Hadoop开发分布式处理解决方案。上述更新支持Spring开发者能够轻松开发可以与HBase数据库、Cascading库和Hadoop相集成的企业应用。Spring for Apache Hadoop可以免费下载,目前可以通过开源Apache 2.0许可证获取。

上述项目和新功能旨在加速Hadoop使用,并支持企业充分利用Cetas等大数据分析应用从海量数据中获得实时的智能洞察力。VMware在2012年4月收购了Cetas,Cetas分析服务目前可以在www.cetas.net网站获得。

分享到:
评论

相关推荐

    Serengeti-虚拟化你的大数据应用(VMWare)41.pptx

    Serengeti 是一个由 VMWare 开发的开源项目,其主要目标是简化大数据应用程序,尤其是 Apache Hadoop 的部署和管理。通过虚拟化技术,Serengeti 提供了一种自动化的方式来创建、扩展和管理 Hadoop 集群,使得大数据...

    serengeti 用户手册

    Serengeti用户手册主要面向希望在VMware vSphere环境中实现Hadoop集群自动化部署与管理的技术人员。这包括系统管理员、开发人员以及任何需要通过虚拟化基础设施来快速设置和配置Hadoop集群的人员。 **2.1 Serengeti...

    Serengeti - 虚拟化你的大数据应用.pdf

    Serengeti 是一个由VMware公司开发的工具,旨在解决大数据应用,特别是Hadoop集群的部署、管理和优化问题。通过对大数据环境进行虚拟化,Serengeti 提供了一种高效、灵活且易于管理的方式来运行大数据工作负载。 在...

    Serengeti虚拟化你的大数据应用

    标题《Serengeti虚拟化你的大数据应用》揭示了大数据技术与虚拟化技术的结合,这一主题深入探讨了大数据处理系统当前的挑战、虚拟化Hadoop集群的好处、以及Serengeti如何解决这些挑战。 描述中提到了一系列议程点,...

    Serengeti 使用向导

    **Serengeti** 是一款由 VMware 开发的工具,主要用于简化 Hadoop 和 HBase 集群的部署与管理过程。它通过提供一套集成化的解决方案来帮助用户在 VMware 的虚拟化平台上快速搭建和维护大数据集群。 ##### Serengeti...

    Serengeti-虚拟化你的大数据应用.pptx

    **Serengeti** 是VMware公司推出的一个解决方案,旨在通过虚拟化技术解决这些问题,使企业能够更轻松地部署和管理Hadoop集群。Serengeti的主要目标是简化Hadoop环境的运维,提高资源利用率,并提供高可用性。 **为...

    serengeti-ws:塞伦盖蒂Web服务和CLI代码

    serengeti-ws:塞伦盖蒂的Web服务和CLI 是VMware发起的一个开源项目,旨在在虚拟平台上快速部署Apache Hadoop集群。 该存储库包含Serengeti Web服务和CLI的代码。入门要跳入使用Serengeti,请遵循我们的![安装指南]...

    李欣慧-虚拟化大数据和性能优化

    Serengeti是VMware推出的一个项目,旨在简化和自动化在vSphere平台上Hadoop集群的部署、配置和管理。Serengeti的目的是让用户能够在十分钟内快速部署一个Hadoop集群,并支持如MapReduce、HBase等主流的大数据分布式...

    3. vSphere Big Data Extensions - 技术内幕.pptx

    为了满足多租户的需求,BDE 支持部署独立的计算集群供不同租户共享 HDFS。这种架构允许根据优先级和可用资源动态调整计算节点的数量,同时保持高可用性和安全性。 - **实验环境**:支持动态资源池,便于进行实验和...

    apm_serengeti.zip

    而apm_serengeti是特定的硬件平台,它需要一个针对该硬件优化的板级支持包(Board Support Package,简称BSP)才能运行VxWorks操作系统。 BSP是操作系统与硬件之间的桥梁,它包含了驱动程序、初始化代码、配置文件...

    Hadoop 2.0 生态系统第八章 云计算和虚拟化Ser

    Hadoop 2.0 生态系统第八章 云计算和虚拟化Serengeti

    Serengeti:开发中

    在IT行业中,"Serengeti:开发中"可能指的是一个名为"Serengeti"的项目正在处于持续的开发阶段。这个项目似乎是一个静态网站,它作为狂犬病研究中心的一部分,目的是提供信息、研究结果或者相关服务。由于是静态网站...

    Serengeti:塞伦盖蒂快照前端

    【Serengeti:塞伦盖蒂快照前端】是一个基于JavaScript开发的项目,它主要用于构建用户友好的界面,提供对Zooniverse平台上的“塞伦盖蒂”项目的数据快照进行浏览和分析。Zooniverse是一个知名的公民科学平台,让...

Global site tag (gtag.js) - Google Analytics