- 浏览: 1048129 次
- 性别:
- 来自: 上海
文章分类
- 全部博客 (1441)
- 软件思想&演讲 (9)
- 行业常识 (250)
- 时时疑问 (5)
- java/guava/python/php/ruby/R/scala/groovy (213)
- struct/spring/springmvc (37)
- mybatis/hibernate/JPA (10)
- mysql/oracle/sqlserver/db2/mongdb/redis/neo4j/GreenPlum/Teradata/hsqldb/Derby/sakila (268)
- js/jquery/jqueryUi/jqueryEaseyUI/extjs/angulrJs/react/es6/grunt/zepto/raphael (81)
- ZMQ/RabbitMQ/ActiveMQ/JMS/kafka (17)
- lucene/solr/nuth/elasticsearch/MG4J (167)
- html/css/ionic/nodejs/bootstrap (19)
- Linux/shell/centos (56)
- cvs/svn/git/sourceTree/gradle/ant/maven/mantis/docker/Kubernetes (26)
- sonatype nexus (1)
- tomcat/jetty/netty/jboss (9)
- 工具 (17)
- ETL/SPASS/MATLAB/RapidMiner/weka/kettle/DataX/Kylin (11)
- hadoop/spark/Hbase/Hive/pig/Zookeeper/HAWQ/cloudera/Impala/Oozie (190)
- ios/swift/android (9)
- 机器学习&算法&大数据 (18)
- Mesos是Apache下的开源分布式资源管理框架 (1)
- echarts/d3/highCharts/tableau (1)
- 行业技能图谱 (1)
- 大数据可视化 (2)
- tornado/ansible/twisted (2)
- Nagios/Cacti/Zabbix (0)
- eclipse/intellijIDEA/webstorm (5)
- cvs/svn/git/sourceTree/gradle/jira/bitbucket (4)
- jsp/jsf/flex/ZKoss (0)
- 测试技术 (2)
- splunk/flunm (2)
- 高并发/大数据量 (1)
- freemarker/vector/thymeleaf (1)
- docker/Kubernetes (2)
- dubbo/ESB/dubboX/wso2 (2)
最新评论
GreenPlum主要的功能和优势
基于软件,并针对商业硬件进行了优化
软件很容易安装到多家一级供应商提供的商业x86服务器上,并在Linux和Solaris上运行。
线性扩展性能
“完全不共享”体系和并行查询优化可以确保线性扩展性能和容量,将其扩展到成本上千个节点和处理器内核。
支持MapReduce
MapReduce已经被Google和Yahoo等重要的互连网服务运营商证明是一种可行的大规模数据分析技术。借助Greenplum,各个企业可以在内部使用MapReduce技术。
SQL标准
通过SQL 2003 OLAP控制功能全面支持SQL-92和SQL-99。所有查询信息都并行地在整个系统上执行。
统一分析处理
可以在同一个并行数据流引擎上执行所有查询和分析(SQL、MapReduce、R等)操作,从而允许分析人员、开发人员和统计人员使用同一个基础构架进行数据分析。
可编程并行分析
为从事运算和统计工作的人员提供了更先进的并行分析功能,支持R、线性代数和机器学习功能。
数据库内压缩
采用了业内领先的压缩技术,提高性能的同时,显著地减少存储数据所需的空间。客户可以将所用空间减少3-10倍,并提高有效的I/O性能。
千万亿字节规模的数据加载操作
高性能的并行数据装载器可以在所有节点上同步执行操作,装载速度超过4.5TB/小时。
随地访问数据
不管数据的位置、格式或存储介质如何,都可以从数据库向外部数据源执行查询操作,并行向数据库返回数据。
动态扩展
帮助公司对数据仓库进行便捷的小规模或大规模扩展,同时避免高成本的设备或SMP服务器升级。
SMP的全称是"对称多处理"(Symmetrical Multi-Processing)技术,是指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。
工作负载管理
允许管理人员创建基于角色的资源队列,以便划分资源和管理系统负载。
集中管理
提供集群级管理工具和资源,帮助管理人员像管理一台服务器一样管理整个Greenplum数据库平台。
性能监控
通过图形化的性能监控功能,用户可以确定当前运行的情况和历史查询信息,并跟踪系统使用情况和资源信息。
支持索引
Greenplum支持二叉搜索树、哈希、位图、GiST和GIN,从而能够实现多种索引功能,提供给数据架构师实施优化设计所必需的工具。
工业标准接口
支持标准数据库接口(SQL、ODBC、JDBC、DBI),并且可以与市场上先进的商务智能和抽取/转换/加载(ETL)工具互相操作
软件很容易安装到多家一级供应商提供的商业x86服务器上,并在Linux和Solaris上运行。
线性扩展性能
“完全不共享”体系和并行查询优化可以确保线性扩展性能和容量,将其扩展到成本上千个节点和处理器内核。
支持MapReduce
MapReduce已经被Google和Yahoo等重要的互连网服务运营商证明是一种可行的大规模数据分析技术。借助Greenplum,各个企业可以在内部使用MapReduce技术。
SQL标准
通过SQL 2003 OLAP控制功能全面支持SQL-92和SQL-99。所有查询信息都并行地在整个系统上执行。
统一分析处理
可以在同一个并行数据流引擎上执行所有查询和分析(SQL、MapReduce、R等)操作,从而允许分析人员、开发人员和统计人员使用同一个基础构架进行数据分析。
可编程并行分析
为从事运算和统计工作的人员提供了更先进的并行分析功能,支持R、线性代数和机器学习功能。
数据库内压缩
采用了业内领先的压缩技术,提高性能的同时,显著地减少存储数据所需的空间。客户可以将所用空间减少3-10倍,并提高有效的I/O性能。
千万亿字节规模的数据加载操作
高性能的并行数据装载器可以在所有节点上同步执行操作,装载速度超过4.5TB/小时。
随地访问数据
不管数据的位置、格式或存储介质如何,都可以从数据库向外部数据源执行查询操作,并行向数据库返回数据。
动态扩展
帮助公司对数据仓库进行便捷的小规模或大规模扩展,同时避免高成本的设备或SMP服务器升级。
SMP的全称是"对称多处理"(Symmetrical Multi-Processing)技术,是指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。
工作负载管理
允许管理人员创建基于角色的资源队列,以便划分资源和管理系统负载。
集中管理
提供集群级管理工具和资源,帮助管理人员像管理一台服务器一样管理整个Greenplum数据库平台。
性能监控
通过图形化的性能监控功能,用户可以确定当前运行的情况和历史查询信息,并跟踪系统使用情况和资源信息。
支持索引
Greenplum支持二叉搜索树、哈希、位图、GiST和GIN,从而能够实现多种索引功能,提供给数据架构师实施优化设计所必需的工具。
工业标准接口
支持标准数据库接口(SQL、ODBC、JDBC、DBI),并且可以与市场上先进的商务智能和抽取/转换/加载(ETL)工具互相操作
发表评论
-
Mysql中DATE_SUB 使用方法结合查询一天内,一周内,一月内的信息实例讲解
2018-02-07 09:05 772在对数据查询或菜单时经常要对指定的时间或时间段进行查询,例 ... -
MySQL里获取当前week、month、quarter的start_date/end_date
2018-02-06 13:51 667select curDate(); #获取当前日 ... -
查看数据库
2018-01-28 20:38 528---mysql查看用户名和密码 select Hos ... -
数据导入到数据库
2018-01-09 20:23 449数据导出当数据量大时最好是dump文件,sql文件过大不好执行 ... -
使用数据库客户端工具Oracle SQL Developer加载第三方驱动连接mysql的方法
2018-02-28 09:20 1252用Oracle SQL Developer时遇到no oc ... -
数据连接符
2018-02-28 09:32 521不同的数据库中字符串连接符不同,下面列举几种数据库的连接符 ... -
commit
2018-01-08 10:12 0刚接触SQLSERVER,刚才insert了一条记录,为什么 ... -
Redis操作命令总结
2017-10-25 12:43 1686redis-cli 中。 使用命令 ... -
PostgreSQL中表名、字段名大小写问题
2017-10-21 20:59 0学习hibernate的时候,数据库用了PostgreSQL ... -
怎么解决Greenplum中用pg
2018-07-19 09:51 475基本思路是为ns1.table1设置分布策略:root登陆 ... -
mysql unrecognized service问题解决
2017-10-21 20:34 0unrecognized 英 [ʌnˈrekəgna ... -
Oracle创建视图、通过视图创建表
2017-10-21 19:11 1139创建视图: [sql] view plain c ... -
PostgreSQL中表名、字段名大小写问题
2017-10-19 10:48 1283如果有视图依赖该表则该表不能删除 学习hibern ... -
关于性能测试几个名词概念的说明
2017-10-11 10:05 435什么是性能测试 在一定的负载下,系统的响应时间 ... -
数据库性能优化详解
2017-10-11 09:59 8471.数据库访问优化法则 要正确的优化SQL,我们需 ... -
Oracle怎样把varchar2型转成number型
2017-09-23 11:13 1654varchar2型转成number型的前提条件是varch ... -
oracle中字符串的大小比较,字符串与数字的比较和运算
2017-09-23 11:08 2772Oracle比较字符串是根据ASCII码来的,第一个字母的 ... -
greenplum 程序开发优化原则
2017-09-22 14:07 718greenplum 程序开发优化原则 1、批量数据处理后, ... -
PostgreSQL 时序最佳实践 - 证券交易系统数据库设计 - 阿里云RDS PostgreSQL最佳实践
2017-09-22 01:06 1281PostgreSQL , 证券 , 时序数据 , JSON ... -
PostgreSQL 时序最佳实践
2017-09-21 12:26 1168以股票交易为例,一共 ...
相关推荐
`greenplum-1.0.jar`虽然主要针对Greenplum,但由于Greenplum基于PostgreSQL,因此这个驱动包也兼容PostgreSQL的基本功能,使得开发者可以使用相同的接口来处理这两种数据库。 在实际应用中,`dbdriver-greenplum-...
总结,Greenplum JDBC驱动5.1.4是Java开发者与Greenplum数据库交互的重要工具,其强大的功能和良好的性能使得Java应用能够充分利用Greenplum的分布式处理优势,处理大规模的数据。理解并熟练使用这个驱动,将极大地...
- **Hadoop集成**:文档提到了Hadoop分布兼容性,说明Greenplum可以与Hadoop生态系统集成,允许用户利用Hadoop的处理能力和低成本存储优势。 - **gpcopy 增强功能**:gpcopy是Greenplum的一个工具,用于高效复制表...
Greenplum是一个面向数据仓库应用的关系型数据库,它基于流行的PostgreSQL开发,因为有良好的体系结构,所以在数据存储,高并发,高可用,线性扩展,反应速度,易用性和性价比等方面有非常明显的优势,非常受欢迎.进入大数据...
Hadoop是大数据处理的基石,主要负责数据的存储和处理,而Greenplum则擅长快速查询和分析这些数据。通过Greenplum的Hadoop连接器,用户可以在一个统一的平台上无缝地进行批处理和实时分析,这极大地扩展了数据仓库的...
首先,让我们了解一下Greenplum Spark Connector的基本功能。这个连接器使得Spark可以像操作本地数据源一样访问Greenplum数据库,提供了数据读写的能力。用户可以利用Spark的强大计算能力,对Greenplum中的数据进行...
GreenPlum的核心优势在于其分布式架构,能够支持PB级别的数据存储,并且具备快速查询和分析能力。 **1. GreenPlum简介** GreenPlum简单来说是一个对象关系型数据库管理系统,支持标准SQL接口。与传统的实时应用集群...
以下是对Greenplum架构、功能及优势的深入解析。 ### Greenplum架构 #### MPP架构(Massively Parallel Processing) Greenplum采用了MPP架构,这是一种“无共享”(Shared-Nothing)设计,意味着每个计算节点都...
Tableau的核心优势在于其对数据的高效处理能力和直观的界面设计。用户只需简单地拖放数据字段,便能在几秒钟内创建出精美的图表和仪表板。 - **优点**: - 多种图表类型:支持自定义图表,可以根据不同的数据类型...
总的来说,掌握Greenplum数据库技术需要对MPP架构有深入理解,熟悉其特有的数据分布和查询优化策略,同时结合实际操作和案例分析,才能更好地发挥其在大数据分析中的优势。希望这份学习资料能助你在Greenplum的学习...
综上所述,《Greenplum Database 4.2 系统管理员指南》为管理员提供了全面的指导和支持,帮助其更好地理解和管理Greenplum数据库系统。无论是从架构层面的深入解析还是具体的操作步骤,该指南都是一个不可或缺的资源...
接下来,我们将详细探讨如何在Linux环境下安装和使用Greenplun CC Web,以及其核心功能和优势。 一、安装步骤 1. 解压文件:首先,你需要解压下载的greenplum-cc-web-6.2.0-gp6-rhel7-x86_64.7z压缩包,可以使用7-...
此外,gpbackup利用并行备份技术,可以充分利用Greenplum分布式架构的优势,提高备份效率。 接下来是gprestore,它是与gpbackup配套的恢复工具。当需要从备份中恢复数据时,gprestore能快速且准确地将数据还原到...
### EMC Greenplum 白皮书关键知识点解析 #### 一、EMC 公司简介与概况 ...随着技术的不断进步与市场需求的变化,Greenplum 继续保持着技术创新和市场领导地位,为更多企业提供高效、可靠的解决方案。
了解如何使用外部表、UDF(用户自定义函数)和UDAF(用户自定义聚合函数)等扩展功能,可以提升系统的灵活性和功能多样性。 9. **高可用与容错** 理解Greenplum的镜像复制和主备切换机制,以及如何配置和管理...
Greenplum采用复杂的查询规划和并行执行策略,能够优化复杂查询的执行效率,充分利用其分布式架构的优势。 ### 访问控制与安全 Greenplum提供了一套完整的角色管理和权限控制机制,包括创建新角色、授予和撤销权限...
其中,"31 - 装载和卸载数据(2).mp4" 这个视频可能详细讲解了具体的装载步骤和技术,包括数据预处理、数据格式转换以及使用Greenplum的外部表功能来直接访问Hadoop数据。 数据卸载则是从Greenplum 将结果或中间数据...
它不仅能够实现资源的有效分配,还能提供高级管理功能,如动态资源调度和故障恢复,确保Greenplum数据库在虚拟化环境中稳定运行的同时,达到甚至超越物理环境下的性能水平。 ### 实验设计与方法论 在实验设计阶段...
根据提供的文件信息,我们可以深入探讨Greenplum数据库的相关知识点,主要围绕其架构、分布式数据库特性、功能概述以及查询处理机制等方面展开。 ### Greenplum 架构概览 #### 关于 Greenplum Master Greenplum ...
Greenplum擅长处理数据仓库和分析场景,其智能查询优化器能根据数据分布和查询模式,生成最优执行计划。此外,与Apache MADlib的集成,使得Greenplum具备了内置的统计分析和机器学习能力。 六、安装与部署 在...