`
weitao1026
  • 浏览: 1053244 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论
阅读更多

Greenplum

编辑 锁定

 
当前使用的 OLTP程序中,用户访问一个中心数据库,如果采用SMP系统结构,它的效率要比采用MPP结构要快得多。而MPP系统在决策支持和数据挖掘方面显示了优势,可以这样说,如果操作相互之间没有什么关系,处理单元之间需要进行的通信比较少,那采用MPP系统就要好,相反就不合适了。
 
外文名
Greenplum
属    于
用户访问一个中心数据库
采    用
MPP系统就要好
已    有
中信实业银行东方航空公司

Greenplum公司简介

编辑
Greenplum是一家总部位于美国加利福尼亚州,为全球大型企业用户提供新型企业级数据仓库(EDW)、企业级数据云(EDC)和商务智能(BI)提供解决方案和咨询服务的公司,在全球已有:纳斯达克纽约证券交易所Skype. FOX,T-Mobile;中国已有:中信实业银行东方航空公司阿里巴巴华泰保险中国远(Cosco),李宁公司等大型企业用户选择Greenplum的产品。
MPP 系统
Greenplum的架构采用了MPP(大规模并行处理)。在 MPP 系统中,每个 SMP节点也可以运行自己的操作系统、数据库等。换言之,每个节点内的 CPU 不能访问另一个节点的内存。节点之间的信息交互是通过节点互联网络实现的,这个过程一般称为数据重分配(Data Redistribution) 。与传统的SMP架构明显不同,通常情况下,MPP系统因为要在不同处理单元之间传送信息,所以它的效率要比SMP要差一点,但是这也不是绝对的,因为 MPP系统不共享资源,因此对它而言,资源比SMP要多,当需要处理的事务达到一定规模时,MPP的效率要比SMP好。这就是看通信时间占用计算时间的比例而定,如果通信时间比较多,那MPP系统就不占优势了,相反,如果通信时间比较少,那MPP系统可以充分发挥资源的优势,达到高效率。
名字来源
Greenplum的大中华区总裁Stanley Chen告诉我们:“Greenplum这个名字是一个7岁小女孩无意中脱口而出的。”起初几个创始人在斟酌公司名字的时候都很没头绪,于是他们去问了朋友的孩子,一个年仅7岁的可爱小姑娘告诉他们叫“Apple”,但是爸爸告诉她,这个名字已经被别人用了,还有其他的么?很快孩子便随口说了“Greenplum”,于是“Greenplum”公司的名字就这样诞生了。

Greenplum中国运营

编辑
 
Greenplum2008年12月进入中国市场,经过一年多的开拓,2010年1月1日Greenplum正式宣布在中国独立运营,并任命Stanley Chen先生为Greenplum大中华区总裁职务,Stanley Chen先生在IT行业从业25年以上,曾在Oracle公司工作16年担任亚太区副总裁。Stanley Chen总裁将管理和运营Greenplum在大中华区的业务,Greenplum公司将为大中华区的企业级用户提供世界领先的数据仓库解决方案和服务。Greenplum在中国迅速而高效的适应能力已经彰显了其卓越的实力,宣布在中国的独立运营展示了Greenplum对中国市场的信心,也体现了Greenplum描绘中国市场宏伟蓝图的决心,也预示着新一代超级数据引擎Greenplum在中国市场的无限前景。[1] 
2010年7月EMC收购Greenplum,2010年4月Greenplum借助EMC中国卓越研发集团进入中国,组建Greenplum研发并稳步成长,覆盖了Chorus,Greenplum和Hadoop等多个产品研发。2014年4月,伴随着全球Pivotal公司的组建,冯雷(RayFeng,时任EMC中国卓越研发集团Greenplum部门经理)在范承工博士和Greenplum创始人ScottYara的支持下组建了Pivotal中国研发中心。Greenplum作为Pivotal的核心大数据产品,有着一支技术实力很强的团队。Greenplum中国研发团队占全球研发团队的一半以上,在研发总监姚延栋,产品经理高小明的带领下,专注于Greenplum分布式数据库内核开发。此外中国研发团队还独立负责GPText(文本检索)和GPCC(Greenplum数据库监控管理)两个产品的全部研发工作。Greenplum中国研发团队将敏捷软件开发方法学引入到分布式数据库的开发中,通过使用站立会议、回顾会议、结对编程、持续集成、测试驱动、单周迭代等敏捷方法建立了高效的快速反馈系统,大大提高了产品的质量和客户的满意度。Greenplum中国研发团队开放、协作、创新的文化吸引了大量来自于清华、北大、中科院、人大、北航等国内知名院校的人才,是分布式数据库研发领域的知名团队[2] 
Greenplum于2015年10月开源,开源社区在中国有很高的知名度。在2014年,为了筹备Greenplum开源后中国生态的建设和商业开发,冯雷聘请了陆公瑜加入Pivotal。陆公瑜先生就读于英国约克大学,并曾担任过IBM云计算资深研发经理。在Greenplum中国产品领导团队的带领下,Greenplum/Pivotal越来越多的企业和开发者正在加入,阿里巴巴,易观等国内知名企业纷纷使用或提供Greenplum开源服务[2] 

Greenplum发展历史

编辑
2006年,Sun与Greenplum联手打造即时数据仓库[3] 
2008年,Greenplum进军中国市场[4] 
2012年,Greenplum大数据分析工具亮相EMC World[5] 
2012年,EMC、VMware和Greenplum又联手建新公司[6] 
2016年,Pivotal Greenplum 4.3.9.0正式发布[2] 

Greenplum目标宗旨

编辑
公司专注OLAP系统数据引擎开发,有世界级的研发团队进行高性能计算和数据库系统的前沿开发工作,宗旨是向客户提供高性能的超级数据引擎,并将强大的并行计算能力融入到大规模数据仓库分析领域中。公司具有发展趋势超前的视野和洞察力,为全球很多最大规模的数据仓库提供推动力;公司最先将SQL和Map Reduce的功能整合到统一的数据处理框架中。
Greenplum中国公司拥有一支具备丰富行业经验的销售和技术团队,具备金融、电信、政府、互联网等等行业的数据仓库项目行业经验,专注于推动Greenplum在数据仓库分析领域的应用,为客户实现投资回报、价值增长。

Greenplum软件优势

编辑

Greenplum数据存储

当今是个数据不断膨胀的时代,采取MPP架构的数据库系统可以对海量数据进行管理。
Greenplum支持50PB(1PB=1000TB)级海量数据的存储和处理,Greenplum将来自不同源系统的、不同部门、不同平台的数据集成到数据库中集中存放,并且存放详尽历史的数据轨迹,业务用户不用再面对一个又一个信息孤岛,也不再困惑于不同版本数据导致的偏差,同时对于IT人员也降低管理维护工作的复杂度。

Greenplum高并发

随着商业智能在企业内的快速发展,BI 用户对信息分析平台的访问频率和查询复杂度也快速提升,因此要求相应的数据库系统对高并发查询进行支持。Greenplum利用强大并行处理能力提供并发支持。
Greenplum提供资源管理功能(workload managemnt)来管理数据库资源,利用资源队列管理可实现按用户组的进行资源分配,如Session同时激活数、最大资源值等。通过资源管理功能,可以按用户级别进行资源分配和管理用户SQL查询优先级别,同时也能防止低质量SQL(如没有条件的多表join等)对系统资源的消耗。

Greenplum线性扩展

Greenplum与其他分布式大数据产品如Yonghong Z-DataMart一样采用了通用的MPP并行处理架构,在MPP架构中增加节点就可以线性提高系统的存储容量和处理能力。Greenplum在扩展节点时操作简单,在很短时间内就能完成数据的重新分布。
Greenplum线性扩展支持为数据分析系统将来的拓展给予了技术上的保障,用户可根据实施需要进行容量和性能的扩展。

Greenplum高性价比

Greenplum数据库软件系统节点基于业界各种开放式硬件平台,如SUN/HP/DELL等厂商的PC Server等,在普通的x86 Server上就能达到很高的性能,因此性价比很高,相比于其他封闭式数据仓库专用系统,Greenplum每TB的投资是前者的1/5甚至更低。同样,Greenplum产品的维护成本相比同类厂商也低许多。

Greenplum反应速度

我们面对的是一个瞬息变化的市场,谁能首先感知到市场的需求和变化,就能在竞争中先行一步,获得主动权,在竞争中立于不败之地。
Greenplum通过准实时、实时的数据加载方式,实现数据仓库的实时更新,进而实现动态数据仓库(ADW)。基于动态数据仓库,业务用户能对当前业务数据进行BI实时分析-“Just In Time BI”,能够让企业敏锐感知市场的变化,加快决策支持反应速度。

Greenplum高可用性

Greenplum是高可用的系统,在已有案例中最多使用了96台机器的集群MPP环境。除了硬件级的Raid技术外,Greenplum还提供数据库层Mirror机制保护,即每个节点数据在另外的节点中同步镜像,单个节点的错误不影响整个系统的使用。
对于主节点,Greenplum提供Master/Stand by机制进行主节点容错,当主节点发生错误时,可以切换到Stand by节点继续服务。

Greenplum系统易用

Greenplum产品是基于流行的PostgreSQL之上开发,几乎所有的PostgreSQL客户端工具及PostgreSQL应用都能运行在Greenplum平台上,在Internet上有着丰富的PostgreSQL资源供用户参考。
最新进展
Greenplum 被EMC公司收购,将其整合到EMC云计算战略中。

Greenplum公司优势:

编辑

Greenplum数据量


  依照需求,快速简便的建立任意大小和种类的数据仓库
  使用业界的标准硬件,扩充符合成本效益[7] 

Greenplum查询能力


  相比于传统查询,可以以10倍到100倍的超快速度得到答案
  随着您的数据增长确保高性能的分析效率[7] 

Greenplum数据处理

一个平台可以支持数据查询,机器学习,文本挖掘,统计计算等
  使用业界标准的语言(SQL,MapReduce,R),在各个数据层级进行并行分析
  Greenplum数据引擎的技术突破在于使用群集(Cluster)业界标准的硬件,可以对于从
  TB量级到PB量级的数据进行分组,存储和分析,因为 Greenplum数据引擎在处理数据的时候尽可能接近的数据源,快速的并行处理,如此的技术可以提供超级大量的数据处理和无与伦比的导入和查询性能。 同时Greenplum数据引擎可以很容易依照需求,增加存储容量和处理能力,避免代价高昂的设备升级。
  Greenplum数据库是业界最快和最高性价比的高端数据仓库解决方案。用户将可以对于大量的数据运行复杂的分析,通常用传统的解决办法需要几天的运算, 实际上只需几秒钟就可以完成。[7] 
Greenplum数据引擎-世界上最强大的分析数据库
Greenplum数据引擎是为了支持新一代数据仓库和分析处理大规模数据而建立的软件解决 方案。Greenplum支持SQL和MapReduce的并行处理功能,并能以较低的成本向管;理TB量到PB量级数据的企业提供业界领先的性能。[7] 
参考资料
分享到:
评论

相关推荐

    greenplum客户端工具

    《Greenplum客户端工具详解及升级指南》 在大数据处理领域,Greenplum以其高效、扩展性强的特点,成为企业级数据仓库和分析平台的首选。本文将深入探讨Greenplum的客户端工具,以及如何利用提供的升级工具进行系统...

    greenplum/postgresql驱动包:greenplum-1.0.jar

    《Greenplum与PostgreSQL数据库驱动详解》 在IT领域,数据库管理系统的高效运作是支撑企业数据处理和服务的核心。本文将深入探讨Greenplum和PostgreSQL两种数据库系统,以及它们对应的驱动包`greenplum-1.0.jar`的...

    greenplum数据库jdbc驱动下载

    绿盟(Greenplum)是一种基于MPP(大规模并行处理)架构的开源数据仓库系统,主要用于大数据分析和处理。JDBC(Java Database Connectivity)是Java编程语言中用于与各种数据库进行交互的一种标准接口。在Java应用...

    greenplum的驱动

    首先,我们要理解什么是JDBC驱动。JDBC(Java Database Connectivity)是Java语言访问数据库的标准,提供了一套API接口,使得Java程序可以与各种类型的数据库进行交互。Greenplum的JDBC驱动,如同其他数据库的JDBC...

    greenplum常用函数-基础

    Greenplum是基于PostgreSQL的开源分布式并行数据仓库,专为大数据分析而设计。在数据仓库的使用过程中,掌握一些常用函数对于提升工作效率和维护数据准确性至关重要。根据给定的文件内容,我们将详细介绍Greenplum中...

    greenplum.jar.zip

    《Pivotal Greenplum数据库连接驱动详解》 在数据处理和分析领域,Pivotal Greenplum是一款广泛使用的开源大数据分析平台。它基于 PostgreSQL 构建,具有强大的并行处理能力,尤其适合大规模的数据仓库和数据分析...

    GREENPLUM_5.1.4.zip

    《Greenplum数据库与Java连接实战指南》 在IT领域,大数据处理和分析已经成为不可或缺的一部分,而Greenplum作为一款高效、可扩展的并行数据库系统,被广泛应用于大规模数据仓库和数据分析场景。本文将围绕...

    greenplum_jdbc_5.1.4.zip

    《Greenplum JDBC驱动5.1.4详解》 在大数据处理领域,Greenplum数据库以其优秀的并行处理能力和大规模数据存储能力而受到广泛关注。为了方便Java开发者与Greenplum数据库进行交互,Pivotal公司提供了Greenplum JDBC...

    greenplum和postgresql的驱动包

    《Greenplum与PostgreSQL驱动包详解》 在大数据处理领域,Greenplum与PostgreSQL是两种广泛应用的关系型数据库管理系统(RDBMS)。它们都基于开源的PostgreSQL数据库引擎,但在设计目标和功能特性上有所差异。本篇...

    greenplum安装包

    绿盟(Greenplum)是一款基于MPP架构的开源大数据分析平台,专为大规模数据仓库和分析设计。它由Pivotal公司开发,现在成为Apache软件基金会的顶级项目。Greenplum提供了高度并行的数据处理能力,使得企业能够快速、...

    Greenplum分布式一键安装及卸载脚本

    **绿盟分布式数据库Greenplum的一键安装与卸载脚本详解** Greenplum是一款高效、可扩展的并行数据库系统,广泛应用于大数据处理和分析。为了简化Greenplum的安装和卸载过程,通常会编写一系列自动化脚本来实现一键...

    Greenplum6.2.1版本安装包(RPM)版

    《Greenplum 6.2.1 RPM版安装详解》 Greenplum是一款高度扩展的并行数据库系统,常用于大数据分析。本文将详细介绍Greenplum 6.2.1版本的RPM安装包,包括GitHub开源版和Pivotal提供的版本,帮助用户更好地理解和...

    greenplum 简介及数据库对比

    greenplum 简介及数据库对比 。 greenplum hive infobright 对比。

    Greenplum Spark Connector 2.2.0 for Scala 2.11

    《Greenplum Spark Connector 2.2.0 for Scala 2.11详解》 在大数据处理领域,Spark和Greenplum是两个重要的组件。Spark以其高效的数据处理能力,广泛应用于实时计算、批处理和机器学习等场景;而Greenplum则是一款...

    GreenPLum6-1.pdf

    GreenPlum6官方文档中文翻译,如下为节选: 有关配置,管理和监控Greenplum数据库安装以及管理,监控和使用数 据库的信息。该指南还包含有关Greenplum数据库架构和概念(例如 并行处理)的信息。 Greenplum...

    flink消费kafka到greenplum

    在大数据处理领域,Flink和Kafka是两个非常重要的组件,而Greenplum则是一种高效的数据仓库系统。本文将深入探讨如何使用Flink从Kafka消费数据并将其存储到Greenplum,同时也会介绍Flink的数据流(DataStream)和...

    Greenplum数据库文档(中文版)

    ### Greenplum数据库文档知识点详解 #### Greenplum数据库文档概述 Greenplum数据库文档是基于官方提供的资源,经过翻译和整理形成的中文版手册。该文档不仅内容详尽且易于理解,还特别注重实用性,旨在帮助用户更...

    greenplum管理员手册

    ### Greenplum数据库管理员手册知识点概述 #### 一、关于Greenplum架构 - **Greenplum Master**:这是Greenplum系统的核心组件之一,负责管理整个数据库集群,包括接收客户端请求、创建并分发查询计划给各个...

    Greenplum日常运维手册

    Greenplum日常运维,针对运维dba,pivotal,postgresql

    分布式数据库greenplum安装包

    greenplum安装包,Centos7下测试安装成功。greenplum是一种基于PostgreSQL的分布式关系型数据库,采取MPP架构。适合构建企业级面向分析的应用!

Global site tag (gtag.js) - Google Analytics