`
weitao1026
  • 浏览: 1070459 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论
阅读更多
这几天最大的消息莫过于 Greenplum 的开源,年初开始 Pivotal 就宣布了 greenplum 的开源,经过大半年的翘首等待,终于在十月底在欧洲的 Postgres 大会宣布开源,并兑现在 Github 上开放代码(https://github.com/greenplum-db/gpdb ),社区的官网为 http://greenplum.org/, 其官方博客也有提到相关事项。代码是采用 Apache 许可,今天已经有社区的朋友尝鲜从社区取下代码,在 Greenplum 上测试了 tpch 的性能,虽然测试比较粗糙但是结果基本和商业版的一样,印证了之前 greenplum 将走向全开源的消息。虽然里面关键的新一代优化器 orca 还没有看到代码,但据消息这部分后续也会开出来,估计这个是其对这个最核心资产的一个谨慎的操作。

总体的印象来看,其采取开放的 Apache 许可,代码基本上无保留开源,这次的开源更大程度是公司层面的战略行为,而不是简单的市场推广的战术行为。

Greenplum 的开源,在我看来有几个驱动力。

首先是受其 cloud foundry 开源战略成功的驱动。pivotal在整个emc联邦的定位来说是偏中间件这一层,emc是存储,vmware是虚拟化,pivotal要搞定的是PaaS。而pivotal的业务上来说,要把云和大数据这两个支柱搞定,才能把emc联邦的疆域稳定下来。云这一层来说vmware已经是私有云的霸主,而剩下的上层PaaS这一层如果落入他人之手对其来说也是一个大威胁,所以PaaS这一层也是志在必得。鉴于当时已经在市场有很多对手,2011年的时候cloudfoundry启动是以开源的模式来去做,把IBM和HP拉上。这个战略取得了出人意料的巨大成功,现在CF几乎要变成了PaaS的事实标准,IBM也推出了基于CF的bluemix产品,而pivotal在今年发布的2014年的财报,极为惹眼的标题:破纪录的2014年,史上最快的开源产品销售增长( http://finance.yahoo.com/news/pivotal-cloud-foundry-reports-record-160000128.html )在短短的一年里,就获得4千万美金的软件销售收入,另外也获得了财富500强中的100个客户!这对于基础软件来说,基本是神话。说了这么多,无外乎就是给大家强调一下,整个pivotal在cloudfoudry的巨大成功下,对于开源的认识已经到了商业战略的层次,已经不需要去讨论要不要开源,开源已经成为杀手级的武器!在此背景下我们来去理解greenplum的开源才更容易理解。

其次,Pivotal 的大数据战场,需要新的战略调整。上面提到,除了云以外,Pivotal的战略重心是大数据,Pivotal除了有自己的hadoop发行版以外还有greenplum作为大数据最重要的资产。但是大数据整个市场都不是太理想,Hadoop发行版除了有Cloudera,Hortonworks,MapR这三个第三方发行版以外,还有Pivotal,IBM,Intel这些厂商本身的发行版,市场最突出的问题是碎片化(fragmented),Hadoop的门槛低,厂商林立,同质化严重,不仅仅难以溢价出售,传统大厂商靠溢价销售基础软件获取超额利益的路子开始行不通;更为重要的是越来越多的客户倾向于使用第三方独立的发行版,道理不难理解,用户更希望的是Linux生态里面有Redhat和SuSe这样的发行厂商,而不希望类似AIX或者是Windows Server这种由厂商控制的生态,这个更加加剧了厂商面临的困境。Intel由于其发行版的糟糕市场表现,开始陆续解散自己的Hadoop团队,国内的星环就是在这个背景下诞生,2014年Intel重金投资Cloudera 7.4亿美金取得18%的股权,Dell也投入Cloudera的阵营,HP、微软、Teradata则倾向于直接使用Hortonworks的发行版,HP还投资了Hortonworks。但是Cloudera的优势明显,营收是Hortonworks的将近一倍,Cloudera俨然有成为Hadoop生态的新的霸主的阵势,市场格局开始慢慢固化,Intel有可能是这场战役的赢家。在这样的市场格局里面,Pivotal的困境可想而知,HD的发行版肯定需要重新调整策略,所以Pivotal联合IBM、GE等15个弱势玩家, 在今年3月宣告成立ODP(Open Data Platform)组织,本质上是希望通过支持Hortonworks抗衡Cloudera,取得平衡。但是这个赌注的胜算并不明显,Cloudera的CEO甚至公开嘲讽ODP,说其出现本身就是Cloudera的一个胜利( https://gigaom.com/2015/03/03/cloudera-ceo-declares-victory-over-big-data-competition/   ),Greenplum的开源正是作为ODP的砝码而出现,Pivotal决定把HD发行版、Gemfire、HAWQ还有Greenplum开源,所以从这个角度我们看到,Greenplum的开源本身,就是Pivotal希望赢回这场战役的一个砝码,对其而言,越多人用越好,没有必要隐藏任何功能。

其实在 Greenplum 开源之前,MPP 数据库的日子也并不好过,也是市场碎片化,每个厂家也就区区几千万美金的营收,市场难以有大的突破,传统丰厚的 DW 市场也难以打入,Hadoop 生态又是以开源为主,甚至很多类似 Impala 这样的产品也在做其类似的功能,传统的打不开,新市场又难以全面打开,而且竞争重重,进退两难。而Greenplum十多年来的架构也无力进行大的调整。正是在这样的背景下,倒不如开源,盘活大局。下面这篇文章称其举动为 open sourcing code is the modern graceful way to retire an unprofitable product line (http://skylandtech.net/2015/02/24/thinking-about-the-pivotal-announcements/ )

Greenplum 的开源应该是相对比较激进和带有攻击性(aggressive)一着棋,成败难料,但对于整个生态会有比较大的影响。
分享到:
评论

相关推荐

    Greenplum开源的这一年.pdf

    Greenplum开源数据库经历了过去一年的发展,成长为一个生产级别的开源MPP(大规模并行处理)数据库产品。本文档中提及的GreenplumDB 5.0版本是自2015年开源以来的第一个稳定版本,预示着它在安全、性能和功能上的...

    Greenplum开源数据仓库介绍.pptx

    【Greenplum 开源数据仓库】是一个高性能的并行数据仓库系统,专为大规模数据分析而设计。它基于 PostgreSQL 关系数据库管理系统,集成了 MPP(大规模并行处理)架构,能够处理PB级别的数据。Greenplum 由Pivotal...

    Greenplum开源数据仓库-实现100亿监控数据的秒级分析-萧少聪

    Greenplum开源数据仓库是一款基于PostgreSQL的开源MPP(大规模并行处理)分布式数据库产品,它能够提供高效的海量数据存储、查询和分析功能。由萧少聪(铁庵)于2016年撰写的文章中,详细介绍了Greenplum如何实现对...

    greenplum_jdbc_5.1.4.zip

    Greenplum是一种开源、分布式的关系型数据库管理系统,特别设计用于处理海量数据。它基于PostgreSQL,但扩展了MPP(大规模并行处理)架构,使得数据处理速度大幅提升。在大数据场景下,Greenplum能够提供高效的数据...

    开源大数据引擎:分布式Greenplum数据库内核分析

    在分析开源大数据引擎时,分布式Greenplum数据库内核是一个值得深入探讨的主题。Greenplum作为一个大规模并行处理(MPP)架构的开源数据库系统,特别适用于大数据存储、计算、分析和挖掘的应用场景。在本篇文章中,...

    greenplum/postgresql驱动包:greenplum-1.0.jar

    Greenplum是一款开源的数据仓库系统,它基于 PostgreSQL 并进行了大规模并行处理(MPP)的优化。Greenplum被设计用于处理海量数据,尤其适用于大数据分析、商业智能和数据仓库应用。它的核心优势在于其分布式架构,...

    greenplum数据库jdbc驱动下载

    绿盟(Greenplum)是一种基于MPP(大规模并行处理)架构的开源数据仓库系统,主要用于大数据分析和处理。JDBC(Java Database Connectivity)是Java编程语言中用于与各种数据库进行交互的一种标准接口。在Java应用...

    Greenplum6.2.1版本安装包(RPM)版

    本文将详细介绍Greenplum 6.2.1版本的RPM安装包,包括GitHub开源版和Pivotal提供的版本,帮助用户更好地理解和安装这一强大的数据仓库平台。 首先,我们来看标题中的"Greenplum6.2.1版本安装包(RPM)版"。RPM(Red ...

    Greenplum数据库文档(中文版)

    这意味着部分特性可能仅存在于PivotalGreenplum数据库中,而这些特性虽然在开源的Greenplum数据库代码库中未实现,但仍被记录在文档中。为了区分这些差异,文档中采用了两个不同的术语:“Greenplum数据库”和...

    greenplum.jar.zip

    在数据处理和分析领域,Pivotal Greenplum是一款广泛使用的开源大数据分析平台。它基于 PostgreSQL 构建,具有强大的并行处理能力,尤其适合大规模的数据仓库和数据分析应用。本文将详细讨论如何通过Java连接到...

    greenplum5.10.1官方文档

    Pivotal Greenplum 是一个开源的大规模并行处理(MPP)数据库管理系统,专门针对数据仓库和大数据分析工作负载而设计。它采用基于PostgreSQL的架构,并在此基础上加入了水平扩展和高可用性的特性。Pivotal Greenplum...

    greenplum安装包

    绿盟(Greenplum)是一款基于MPP架构的开源大数据分析平台,专为大规模数据仓库和分析设计。它由Pivotal公司开发,现在成为Apache软件基金会的顶级项目。Greenplum提供了高度并行的数据处理能力,使得企业能够快速、...

    greenplum常用函数-基础

    Greenplum是基于PostgreSQL的开源分布式并行数据仓库,专为大数据分析而设计。在数据仓库的使用过程中,掌握一些常用函数对于提升工作效率和维护数据准确性至关重要。根据给定的文件内容,我们将详细介绍Greenplum中...

    Greenplum Spark Connector 2.2.0 for Scala 2.11

    此外,`open_source_license_VMware_Tanzu_Greenplum_Connector_for_Apache_Spark_2_2.2.0_GA.txt`文件包含了该连接器的开源许可协议,这表明该软件遵循特定的开放源代码政策,允许开发者在遵守规定的情况下自由使用...

    Greenplum机器学习⼯具集和案例

    Greenplum是一款新一代开源大数据平台,它以其大规模并行处理(MPP)架构,支持PB级别的数据加载、查询优化器(GPORCA)、工作负载管理器、多种数据结构的存储以及灵活的部署方式而著称。Pivotal研发的技术总监在...

    greenplum5.7官方文档

    - **与开源Greenplum数据库的差异(Differences Compared to Open Source Greenplum Database)**:Greenplum数据库有两个主要版本,一个是开源版本,另一个是由Pivotal维护的商业版本。文档中提到的差异可能涉及...

    greenplum的驱动

    《Greenplum数据库驱动详解与应用》 Greenplum,作为一个高效、可扩展的企业级大数据分析平台,广泛应用于数据仓库和大数据处理场景。其强大的并行处理能力与优秀的性能表现,使得众多企业和开发者青睐有加。本文将...

    greenplum 简介及数据库对比

    greenplum 简介及数据库对比 。 greenplum hive infobright 对比。

    GREENPLUM_5.1.4.zip

    《Greenplum数据库与Java连接实战指南》 在IT领域,大数据处理和分析已经成为不可或缺的一部分,而Greenplum作为一款高效、可扩展的并行数据库系统,被广泛应用于大规模数据仓库和数据分析场景。本文将围绕...

    Greenplum日常运维手册

    Greenplum日常运维,针对运维dba,pivotal,postgresql

Global site tag (gtag.js) - Google Analytics