二、系统安装与初始化
2.1安装前准备
1-在/etc/sysctl.conf 文件中加入有关共享内存与网络参数配置
kernel.shmmax = 500000000
kernel.shmmni = 4096
kernel.shmall = 4000000000
kernel.sem = 250 64000 100 512
net.ipv4.tcp_tw_recycle=1
net.ipv4.tcp_max_syn_backlog=4096
net.core.netdev_max_backlog=10000
vm.overcommit_memory=2
2-在/etc/security/limits.conf 中加入限制参数
* soft nofile 65536
* hard nofile 65536
* soft nproc 131072
* hard nproc 131072
3-创建一个包括所有segment机器名的hosts文件:
seg_hosts与包括master与segment的机器名的hosts文件放在/home/gpadmin/下面。
hosts中的文本是szamy,seg_hosts也是szamy
2.2Master主机上的安装配置
2.2.1安装
1-到greenplum网站下载安装文件,根据服务器与操作系统的类弄选相应的安装包
下载网址:
http://gpn.greenplum.com/download.php(注:要求注册后方可下载)。
2-解压安装包:
Unzip greenplum-db-3[1].2.3.0-RHEL4-i386.zip生成greenplum-db-3[1].2.3.0-RHEL4-i386.bin文件
3-运行安转包:
/bin/bash greenplum-db-3[1].2.3.0-RHEL4-i386.bin
安装过程需要做license确认
安装目录确认,默认是: /usr/local/greenplum-db-3.2.3.0
安装完成
2.2.2配置
1-创建greenplum用户:
# useradd gpadmin
# passwd gpadmin
# New password: <gpadmin_password>
# Retype new password: <gpadmin_password>
2-创建greenplum组(可选):
# groupadd gpadmin
# usermod -g gpadmin gp_user1
# usermod -g gpadmin gp_user2
3-创建greenplum_db像征目录(查看有没有,如果有不需要执行一下命令):
ln -s /usr/local/greenplum-db-3.2.3.0 /usr/local/greenplum-db
4-改变greenplum安转目录的owner
# chown -R gpadmin /usr/local/greenplum-db
# chgrp -R gpadmin /usr/local/greenplum-db
5-配置环境变量:
将 /usr/local/greenplum-db/greenplum_path.sh中的内容加到/etc/profile里,
同是追加到greenplum用户gpadmin的.bash_profile里.
5-创建master主机上的数据存放目录:
mkdir /home/gpadmin/gpdb_p1
chown gpadmin /home/gpadmin/gpdb_p1
chgrp gpadmin /home/gpadmin/gpdb_p1
2.3在segment上安装配置greenplum数据库
2.3.1安装
1-改变root用户下的SSH keys
# gpssh-exkeys -f /home/gpadmin/hosts(注:会要求输入每个segment的root用户的密码)
2-创建segment主机上的gpadmin用户(如果是在master和segment同一台机器上,不需要执行这一步):
创建用户:# gpssh -f /home/gpadmin/seg_hosts
'/usr/sbin/useradd gpadmin -d /home/gpadmin -s /bin/bash'
密码修改:# gpssh -f /home/gpadmin/seg_hosts
'echo "gpadmin_password" | passwd gpadmin -stdin'
3-效验segment下用户被创建:
# gpssh -f seg_hosts ls -l /home
4-改变gpadmin用户下的ssh keys
$ su - gpadmin
$ gpssh-exkeys -f /home/gpadmin/keyhosts(注:会要求输入gpadmin用户的密码)
1-在root用户下创建安转包:
# gtar -cvf /home/gpadmin/gp.tar /home/gpadmin/greenplum-db-3.2.3.0
2-从master主机上复制安装包到segment主机
# gpscp -f /home/gpadmin/hosts /home/gpadmin/gp.tar =: /home/gpadmin
3-session同步: # gpssh -f /home/gpadmin/hosts
4-在segment主机上解压安装文件
=> gtar -directory /home/gpadmin -xvf /home/gpadmin/gp.tar
5-确认文件被正确安装:
=> ls /home/gpadmin/greenplum-db-3.2.3.0
6-创建greenplum_db像征目录:
=> ln -s /home/gpadmin/greenplum-db-3.2.3.0 /home/gpadmin/greenplum-db
7-改变segment主机上安转目录的owner
=> chown -R gpadmin /home/gpadmin/greenplum-db
=> chgrp -R gpadmin /home/gpadmin/greenplum-db
8-删除segment上的压缩安装包
=> rm /home/gpadmin/gp.tar
2.3.2配置
1:创建数据目录:
=> mkdir /home/gpadmin/data(主segment数据目录)
=> mkdir /home/gpadmin/data/gpdb_p0(第0个segment数据目录)
=> mkdir /home/gpadmin/data/gpdb_p1
=> mkdir /home/gpadmin/data/gpdb_p2
=> mkdir /home/gpadmin/data/gpdb_p3
=> mkdir /home/gpadmin/mdata(镜像segment数据目录)
=> mkdir /home/gpadmin/mdata/gpdb_p0
=> mkdir /home/gpadmin/mdata/gpdb_p1
=> mkdir /home/gpadmin/mdata/gpdb_p2
=> mkdir /home/gpadmin/mdata/gpdb_p3
2:改变目录owner:
=> chown -R gpadmin /home/gpadmin/data
=> chgrp -R gpadmin /home/gpadmin/data
=> chown -R gpadmin /home/gpadmin/mdata
=> chgrp -R gpadmin /home/gpadmin/mdata
4:退出gpssh
=> exit
5:同步时钟:
$ gpssh -f seg_hosts -v date
$ gpssh -f seg_hosts -v ntpd
2.4系统性能效验
1-运行gpcheckos 来检查刚配的segment机器的操作系统情况(如果是在master和segment同一台机器上,不需要执行这一步)
gpcheckos -f /home/gpadmin/seg_hosts
2-运行gpcheckos -h szamy 来检查master机器(如果是在master和segment同一台机器上,不需要执行这一步)。
3-计算数据仓库存贮容量,磁盘做RAID10的情况:(U:user data)
计算方法:(raw_capacity * .09) / 2 = formatted_disk_space
如果做segment镜像的话,存贮容量: (2 * U) + U/3 = formatted_disk_space
如果不做segment镜像的话,容量为: U + U/3 = formatted_disk_space
4-硬件性能效验(如果是在master和segment同一台机器上,不需要执行这一步):
gpcheckperf -f /home/gpadmin/hosts -d /home/gpadmin/data1 -d /home/gpadmin/data2 -v
5-网络性能效验:
gpchecknet -f /home/gpadmin/hosts -d /home/gpadmin/data1
gpchecknet -f /home/gpadmin/hosts -r n -d /home/gpadmin/data1(测试最大,最小以及平均值等)
2.5初始化系统
1-复制一个配置文件模板
$ cp $GPHOME/docs/cli_help/gp_init_config_example
/home/gpadmin/gp_init_config
2-修改配置参数 vi /home/gpadmin/gp_init_config
注意下面的参数
ARRAY_NAME="Greenplum"
MACHINE_LIST_FILE=/home/gpadmin/seg_hosts
SEG_PREFIX=gp
PORT_BASE=50000
declare -a DATA_DIRECTORY=
(/home/gpadmin/data/gpdb_p0 /home/gpadmin/data/gpdb_p1
/home/gpadmin/data/gpdb_p2 /home/gpadmin/data/gpdb_p3)
MASTER_HOSTNAME=szamy #机器名
MASTER_DIRECTORY=/home/gpadmin/gpdb_p1
MASTER_PORT=5432
3-运行配置文件初始化greenplum数据库
$ gpinitsystem -c /home/gpadmin/gp_init_config
如果有备份master服务器则
$ gpinitsystem -c /home/gpadmin/gp_init_config -s standby_master_hostname
4-将MASTER_DATA_DIRECTORY加入环境中
修改gpadmin用户的.bash_profile以及/etc/profile,加入
MASTER_DATA_DIRECTORY=/home/gpadmin/gpdb_p1/pg-1
export MASTER_DATA_DIRECTORY
2.5启动服务(以gpadmin的身份启动):
相关推荐
Greenplum数据引擎软件 为新一代数据分析所需的大规模数据和复杂查询 功能所设计 支持众多商用硬件平台 基于PostgreSQL设计 支持ODBC/JDBC等多种接口
单机安装greenplum4.3.10, 介绍安装greenplum全过程。
* 服务器与机柜:在 Greenplum 安装部署中,服务器和机柜的选择是非常重要的。需要考虑到服务器的性能、存储容量、网络连接等因素,以确保 Greenplum 的稳定运行。 * 网络部署:网络部署是 Greenplum 安装部署的关键...
零经验安装Greenplum(足够).
本文将深入探讨在CentOS Linux release 7.1.1503环境下,如何顺利进行Greenplum的安装与配置,旨在帮助用户掌握其核心技术要点。 一、系统准备 在开始Greenplum的安装前,首先要确保系统环境满足基本要求。CentOS ...
greenplum 图文安装配置教程 pdf gp4.2
Greenplum 安装文档 Greenplum 是一个基于 PostgreSQL 的开源的数据仓库系统,提供了高性能的数据处理能力。下面是 Greenplum 的安装文档,详细介绍了安装 Greenplum 的步骤和配置项。 root 用户创建 在安装 ...
5. **初始化数据库**:运行`gpinitsystem`脚本来创建数据库集群并设置初始参数。 6. **启动和验证**:启动Greenplum数据库服务,并通过`psql`等工具验证安装是否成功。 7. **安全性和维护**:根据实际需求,配置...
**绿盟分布式数据库Greenplum的一键安装与卸载脚本详解** Greenplum是一款高效、可扩展的并行数据库系统,广泛应用于大数据处理和分析。为了简化Greenplum的安装和卸载过程,通常会编写一系列自动化脚本来实现一键...
- **初始化数据库**:使用`gpinitsystem`脚本初始化数据库集群,提供主机名、端口和数据目录等信息。 - **启动Greenplum**:启动数据库服务,使用`gpstart`命令。 - **验证安装**:连接到数据库,运行查询以确认...
### Greenplum数据库安装指南(体验版 CentOS + Greenplum) #### 一、Greenplum简介 Greenplum是一款基于PostgreSQL开发的MPP(大规模并行处理)数据库,主要应用于数据仓库的数据存储与处理场景。它对于Hadoop在...
总的来说,Greenplum的安装是一个涉及多个层面的过程,包括操作系统配置、软件安装和数据库初始化。理解每个步骤的作用和目的,将有助于确保Greenplum环境的稳定性和高效性。在实际操作时,务必遵循官方文档的指导,...
### Greenplum数据库安装前准备工作详解 #### 一、概述 Greenplum是一款高性能的并行数据仓库解决方案,被广泛应用于大数据分析领域。为了确保Greenplum能够稳定高效地运行,进行适当的系统环境配置至关重要。本...
在GreenPlum数据库的安装与配置过程中,需要特别注意硬件和存储配置。例如,示例硬件堆栈展示了适合GreenPlum部署的服务器配置,包括CPU、内存、网络接口卡(NIC)和磁盘布局。正确配置这些组件有助于最大化...
指导greenplum安装与部署以及性能优化与管理。
6. **初始化Master节点**:在主节点上运行初始化脚本,设置系统参数,如数据库大小、段数等。 7. **创建Segment节点**:在每个Segment节点上执行配置脚本,指定Master节点的地址,然后启动Greenplum服务。 8. **...
Greenplum的安装部署文档,里面包括具体的gp的安装、部署、扩容、缩容、HA高可用的详细实施步骤。
3.4 **Greenplum与HDFS结合**: - **安装HADOOP**:如何在Greenplum环境中安装Hadoop。 - **配置hadoop参数文件**:如何配置Hadoop参数以使其与Greenplum协同工作。 - **配置hadoop版本信息及路径信息**:确保...