1、数据库与实例
不同于oracle数据库,一个实例对应一个数据库。GP可以在一个实例上建立多个数据库。
DB2也是一个实例下可以建立多个数据库,而oracle一个实例下通常只有一个数据库,其实可以一个数据库对应多个实例。
2、导入和导出
GP数据加载卸载数据( load unload,其实就是导入和导出) COPY不支持 并行操作 在多个节点上同时进行,copy命令是属于PostgreSQL的命令。
Create External Table Readable External Table 是load数据
Regular Web这种表只能读取 不支持DML Writeable External Table
3、根据template创建数据库
建立数据库基于template 每个新建的GP都有一个默认的数据库template1,
如果不指定模板,template1就是你创建数据库的模板。 在template1中不要创建任何数据对象,
除非你要在其他数据库中也要创建该对象。 除了template1还有template0,postgres 2个数据库 template0中没有任何数据对象,只是包含标准的数据对象。
4、创建数据库 、Drop数据库
数据库端:CREATE DATABASE dbname
客户端:CREATEDB -h hostname -p 5432 dbname
默认是根据template1来创建,可以指定template创建
create database dbname1 template dbname2
Drop database dbname;
DROPDB -h hostname -p 5432 dbname
5、Alter DATABASE dbname
set search_path to mychema
6、查询数据库
select datname from pg_database
6、表空间
不同的表空间存放在不同的磁盘上,高访问的表空间指定放在高配置的磁盘上。
表空间放置在不同segment的文件位置,收集这些文件系统的位置称为为filespace,
filespace可以被多个表空间所使用。 在一个逻辑文件系统中,你不能控制每一个文件的位置,因此没有必要为一个逻辑文件系统指定filespace
7、Create Schema schemaName
create schema schemaName authorization username
8、select current_schema();
show search_path;
9、DROP SCHEMA myschema CASCADE
schema下的所有object
10、数据类型
CHAR VARCHAR Text没有性能上的差距,而在其他数据上CHAR VARCHAR有性能差距
一般情况下 BIGINT 可以用INT或者SMALLINT代替
在join的时候 需要考虑数据类型的一致性
11、数据约束
create table AA(
c varchar(20) primary key,
a varchar(20) not null,
b numeric check(price >0)
)
DISTRIBUTED BY a
Foreign Key 在4.0版本并不完全支持,分布在不同segment上的table对外键的校验支持不好
numberic(18,4)???????
12、选择分布策略
DISTRUBUTED BY
DISTRUBUTED RANDOMLY
表有主键或者第一列作为DT列,那么使用hash算法分布( eligible )
最好是采用每个表都有不同的值,进行分布
13、默认是采用B—Tree索引
Create index aaa on tablename(AA)
create index bbb on tablename using bitmap (gender)
唯一索引必须是DT列,唯一索引在append-only表中不支持
位图索引在OLAP数据库中性能比较好,适用于DML操作较少的数据库,但是占用空间较大,尤其对于大表来讲,位图索引甚至会比表中的索引数据还要大,一般情况下索引占用空间只是表中索引列一部分,位图索引数据压缩比较好,convert函数将bit position转换为行的id?????
索引列在100至10000个不同的值下性能比较好,人的性别不同值比较少,超过10万个不同的值,位图索引的性能将下降,位图索引占用空间的大小与索引列的不同值成比例。
列的不同值超过10万个 一般不适用位图索引,不管表中数据有多少。
对于有大量DML操作的OLTP数据库不适用于位图索引
使用位图索引需要谨慎,一般是在测试性能改进后使用。
Bitmap indexes can dramatically improve query performance for ad hoc queries. AND and OR conditions in the WHERE clause of a query can be resolved quickly by performing the corresponding Boolean operations directly on the bitmaps before converting the resulting bitmap to tuple ids. If the resulting number of rows is small, the query can be answered quickly without resorting to a full table scan.
REINDEX tablename
REINDEX indexname
分享到:
相关推荐
根据给定的文件信息,以下是从《GreenPlum Admin Guide》中提炼出的关键知识点: ### Greenplum Database架构 Greenplum Database是一个高度可扩展、高性能的并行数据仓库解决方案,设计用于处理大规模数据分析和...
根据提供的文件信息,我们可以深入探讨Greenplum数据库的相关知识点,主要围绕其架构、分布式数据库特性、功能概述以及查询处理机制等方面展开。 ### Greenplum 架构概览 #### 关于 Greenplum Master Greenplum ...
### Greenplum Database 4.2 系统管理员指南知识点概览 #### 一、前言 本指南为Greenplum Database 4.2版本的系统管理员提供了详细的配置与管理指导。作为一款高性能并行数据仓库解决方案,Greenplum Database在大...
在数据库访问章节中,文档讲解了如何建立数据库会话,介绍了支持的客户端应用程序,并重点介绍了如何使用psql和pgAdmin等工具连接到Greenplum数据库。 值得注意的是,文档中强调了使用Pivotal软件的版权声明、隐私...
### Greenplum数据库安装指南:全面解析与实施步骤 #### 关于Greenplum数据库 Greenplum数据库是一款高性能的企业级数据仓库解决方案,由EMC的数据计算部门开发。它旨在处理大规模的数据分析工作负载,提供了先进...
### Greenplum Utility Guide知识点概览 #### 一、前言 本指南旨在为用户提供关于Pivotal™ Greenplum Database® Version 4.3 Utility Guide的详细信息。该文档详细介绍了如何使用各种管理和客户端实用工具来管理...
### Greenplum Admin手册知识点概览 #### 一、关于Greenplum架构 - **Greenplum Master**:这是Greenplum系统的核心组件之一,负责管理整个数据库集群,并且是客户端连接的主要入口点。它主要负责接收客户端请求、...
### Greenplum数据库安装指南知识点概述 #### 一、引言 **Greenplum数据库**是一款高度可扩展的企业级数据仓库解决方案,专为大规模数据分析而设计。本指南旨在提供全面的指导,帮助用户顺利完成Greenplum数据库4.2...
- **Greenplum Database 客户端应用程序**:深入探讨了几种常用的 Greenplum 数据库客户端工具,特别是 pgAdmin III。 - **数据库应用程序接口**:解释了如何通过编程语言(如 Java、Python 等)来访问 Greenplum ...
greenplum学习笔记,学习过程中总结的greenplum学习笔记,学习过程中总结的
根据提供的文件信息,接下来将详细介绍《GP4200 Admin Guide》中所包含的知识点,该文档为Greenplum Database 4.2版本的管理员指南。 首先,文档开头提到了EMC公司和该手册的版权声明,包括出版社的名称、产品手册...
《Greenplum与PostgreSQL数据库驱动详解》 在IT领域,数据库管理系统的高效运作是支撑企业数据处理和服务的核心。本文将深入探讨Greenplum和PostgreSQL两种数据库系统,以及它们对应的驱动包`greenplum-1.0.jar`的...
《Greenplum官方培训教材》是一本针对Greenplum...其中,"Greenplum+AAI_Student+Guide_v2(201271813173030).pdf"这份文档是该教材的具体内容,包含了上述所有知识的详细阐述,是深入学习Greenplum不可多得的参考资料。
《Greenplum数据库驱动详解与应用》 Greenplum,作为一个高效、可扩展的企业级大数据分析平台,广泛应用于数据仓库和大数据处理场景。其强大的并行处理能力与优秀的性能表现,使得众多企业和开发者青睐有加。本文将...
绿盟(Greenplum)是一种基于MPP(大规模并行处理)架构的开源数据仓库系统,主要用于大数据分析和处理。JDBC(Java Database Connectivity)是Java编程语言中用于与各种数据库进行交互的一种标准接口。在Java应用...
《Greenplum数据库与Java连接实战指南》 在IT领域,大数据处理和分析已经成为不可或缺的一部分,而Greenplum作为一款高效、可扩展的并行数据库系统,被广泛应用于大规模数据仓库和数据分析场景。本文将围绕...
greenplum 简介及数据库对比 。 greenplum hive infobright 对比。
Greenplum日常运维,针对运维dba,pivotal,postgresql
绿盟(Greenplum)是一款基于MPP架构的开源大数据分析平台,专为大规模数据仓库和分析设计。它由Pivotal公司开发,现在成为Apache软件基金会的顶级项目。Greenplum提供了高度并行的数据处理能力,使得企业能够快速、...