`

greenplum安装与初始化(单机版)

阅读更多
greenplum安装与初始化(单机版)
一、系统安装与运行环境需求
   1.1操作系统环境
 RedHat Enterprise Linux 4.0
 Hostname:szamy
        momery:1.2G
        free disk:3G
  
  
二、系统安装与初始化
   2.1安装前准备
       1-在/etc/sysctl.conf 文件中加入有关共享内存与网络参数配置
     kernel.shmmax = 500000000
     kernel.shmmni = 4096
     kernel.shmall = 4000000000
     kernel.sem = 250 64000 100 512
     net.ipv4.tcp_tw_recycle=1
     net.ipv4.tcp_max_syn_backlog=4096
     net.core.netdev_max_backlog=10000
     vm.overcommit_memory=2 
      2-在/etc/security/limits.conf 中加入限制参数
    * soft nofile 65536
    * hard nofile 65536
    * soft nproc 131072
    * hard nproc 131072
3-创建一个包括所有segment机器名的hosts文件:
  seg_hosts与包括master与segment的机器名的hosts文件放在/home/gpadmin/下面。
  hosts中的文本是szamy,seg_hosts也是szamy
 
2.2Master主机上的安装配置
 2.2.1安装
 1-到greenplum网站下载安装文件,根据服务器与操作系统的类弄选相应的安装包
   下载网址:http://gpn.greenplum.com/download.php(注:要求注册后方可下载)。
 2-解压安装包:
   Unzip greenplum-db-3[1].2.3.0-RHEL4-i386.zip生成greenplum-db-3[1].2.3.0-RHEL4-i386.bin文件
 3-运行安转包:
   /bin/bash greenplum-db-3[1].2.3.0-RHEL4-i386.bin
   安装过程需要做license确认
   安装目录确认,默认是: /usr/local/greenplum-db-3.2.3.0
   安装完成
2.2.2配置
 1-创建greenplum用户:
    # useradd gpadmin
    # passwd gpadmin
    # New password: <gpadmin_password>
    # Retype new password: <gpadmin_password>  
 2-创建greenplum组(可选):
    # groupadd gpadmin
    # usermod -g gpadmin gp_user1
    # usermod -g gpadmin gp_user2
 3-创建greenplum_db像征目录(查看有没有,如果有不需要执行一下命令):
     ln -s  /usr/local/greenplum-db-3.2.3.0  /usr/local/greenplum-db
 4-改变greenplum安转目录的owner
    # chown -R gpadmin  /usr/local/greenplum-db
    # chgrp -R gpadmin  /usr/local/greenplum-db
 5-配置环境变量:
    将 /usr/local/greenplum-db/greenplum_path.sh中的内容加到/etc/profile里,
    同是追加到greenplum用户gpadmin的.bash_profile里.
 5-创建master主机上的数据存放目录:
    mkdir /home/gpadmin/gpdb_p1
    chown gpadmin /home/gpadmin/gpdb_p1
    chgrp gpadmin /home/gpadmin/gpdb_p1
  2.3在segment上安装配置greenplum数据库
 2.3.1安装
 1-改变root用户下的SSH keys
    # gpssh-exkeys -f /home/gpadmin/hosts(注:会要求输入每个segment的root用户的密码)  
 2-创建segment主机上的gpadmin用户(如果是在master和segment同一台机器上,不需要执行这一步):
    创建用户:# gpssh -f /home/gpadmin/seg_hosts
                '/usr/sbin/useradd gpadmin -d /home/gpadmin -s /bin/bash'
    密码修改:# gpssh -f /home/gpadmin/seg_hosts
                'echo "gpadmin_password" | passwd gpadmin -stdin'
 3-效验segment下用户被创建:
    # gpssh -f seg_hosts ls -l /home  
 4-改变gpadmin用户下的ssh keys
   $ su - gpadmin
   $ gpssh-exkeys -f /home/gpadmin/keyhosts(注:会要求输入gpadmin用户的密码)
 1-在root用户下创建安转包:
    # gtar -cvf /home/gpadmin/gp.tar  /home/gpadmin/greenplum-db-3.2.3.0
 2-从master主机上复制安装包到segment主机
    # gpscp -f /home/gpadmin/hosts /home/gpadmin/gp.tar =: /home/gpadmin
 3-session同步:   # gpssh -f /home/gpadmin/hosts
 4-在segment主机上解压安装文件
   => gtar -directory  /home/gpadmin -xvf  /home/gpadmin/gp.tar
 5-确认文件被正确安装:
   => ls  /home/gpadmin/greenplum-db-3.2.3.0
 6-创建greenplum_db像征目录:
   => ln -s  /home/gpadmin/greenplum-db-3.2.3.0  /home/gpadmin/greenplum-db
 7-改变segment主机上安转目录的owner
   => chown -R gpadmin  /home/gpadmin/greenplum-db
   => chgrp -R gpadmin  /home/gpadmin/greenplum-db
 8-删除segment上的压缩安装包
   => rm  /home/gpadmin/gp.tar
 2.3.2配置
 1:创建数据目录:
   => mkdir /home/gpadmin/data(主segment数据目录)
   => mkdir /home/gpadmin/data/gpdb_p0(第0个segment数据目录)
   => mkdir /home/gpadmin/data/gpdb_p1
   => mkdir /home/gpadmin/data/gpdb_p2
   => mkdir /home/gpadmin/data/gpdb_p3
   => mkdir /home/gpadmin/mdata(镜像segment数据目录)
   => mkdir /home/gpadmin/mdata/gpdb_p0
   => mkdir /home/gpadmin/mdata/gpdb_p1
   => mkdir /home/gpadmin/mdata/gpdb_p2
   => mkdir /home/gpadmin/mdata/gpdb_p3
 2:改变目录owner:
   => chown -R gpadmin /home/gpadmin/data
   => chgrp -R gpadmin /home/gpadmin/data
   => chown -R gpadmin /home/gpadmin/mdata
   => chgrp -R gpadmin /home/gpadmin/mdata
 4:退出gpssh
   => exit
 5:同步时钟:
    $ gpssh -f seg_hosts -v date
    $ gpssh -f seg_hosts -v ntpd
2.4系统性能效验
 1-运行gpcheckos 来检查刚配的segment机器的操作系统情况(如果是在master和segment同一台机器上,不需要执行这一步)
    gpcheckos -f /home/gpadmin/seg_hosts
 2-运行gpcheckos -h szamy 来检查master机器(如果是在master和segment同一台机器上,不需要执行这一步)。
 3-计算数据仓库存贮容量,磁盘做RAID10的情况:(U:user data)
    计算方法:(raw_capacity * .09) / 2 = formatted_disk_space
    如果做segment镜像的话,存贮容量: (2 * U) + U/3 = formatted_disk_space  
    如果不做segment镜像的话,容量为:  U + U/3 = formatted_disk_space  
 4-硬件性能效验(如果是在master和segment同一台机器上,不需要执行这一步):
     gpcheckperf -f /home/gpadmin/hosts -d /home/gpadmin/data1 -d /home/gpadmin/data2 -v 
 5-网络性能效验:
      gpchecknet -f /home/gpadmin/hosts -d /home/gpadmin/data1
      gpchecknet -f /home/gpadmin/hosts -r n -d /home/gpadmin/data1(测试最大,最小以及平均值等)
 2.5初始化系统
 1-复制一个配置文件模板
    $ cp $GPHOME/docs/cli_help/gp_init_config_example
         /home/gpadmin/gp_init_config
 2-修改配置参数 vi /home/gpadmin/gp_init_config
    注意下面的参数
    ARRAY_NAME="Greenplum"
    MACHINE_LIST_FILE=/home/gpadmin/seg_hosts
    SEG_PREFIX=gp
    PORT_BASE=50000
    declare -a DATA_DIRECTORY=
              (/home/gpadmin/data/gpdb_p0 /home/gpadmin/data/gpdb_p1
               /home/gpadmin/data/gpdb_p2 /home/gpadmin/data/gpdb_p3)
    MASTER_HOSTNAME=szamy #机器名
    MASTER_DIRECTORY=/home/gpadmin/gpdb_p1
    MASTER_PORT=5432
 3-运行配置文件初始化greenplum数据库
    $ gpinitsystem -c /home/gpadmin/gp_init_config
    如果有备份master服务器则
      $ gpinitsystem -c /home/gpadmin/gp_init_config -s standby_master_hostname
 4-将MASTER_DATA_DIRECTORY加入环境中
      修改gpadmin用户的.bash_profile以及/etc/profile,加入
      MASTER_DATA_DIRECTORY=/home/gpadmin/gpdb_p1/pg-1
      export MASTER_DATA_DIRECTORY
2.5启动服务(以gpadmin的身份启动):
   gpstart
2.6测试(以gpadmin的身份启动):
   psql postgres
  
 
chown -R gpadmin  /usr/local/greenplum-db
chgrp -R gpadmin  /usr/local/greenplum-db
 
GPHOME=/usr/local/greenplum-db-3.2.3.0
# Replace with symlink path if it is present and correct
if [ -L ${GPHOME}/../greenplum-db ]; then
    GPHOME_BY_SYMLINK=`(cd ${GPHOME}/../greenplum-db/ && pwd -P)`
    if [ x"${GPHOME_BY_SYMLINK}" = x"${GPHOME}" ]; then
        GPHOME=`(cd ${GPHOME}/../greenplum-db/ && pwd -L)`/.
    fi
    unset GPHOME_BY_SYMLINK
fi
PATH=$GPHOME/bin:$GPHOME/ext/python/bin:$PATH
LD_LIBRARY_PATH=$GPHOME/lib:$GPHOME/ext/python/lib:$LD_LIBRARY_PATH
export GPHOME
export PATH
export LD_LIBRARY_PATH

source /usr/local/greenplum-db/greenplum_path.sh

 

gtar -cvf /home/gpadmin/gp.tar  /usr/local/greenplum-db-3.2.3.0
gtar –-directory  /home/gpadmin -xvf  /home/gpadmin/gp.tar
ln -s  /home/gpadmin/greenplum-db-3.2.3.0  /home/gpadmin/greenplum-db
在linux服务器的数据库目录/home/gpadmin/gpdb_p1/gp-1,修改一下文件:
vi pg_hba.conf

host     all         gpadmin         192.168.123.180/32    trust
host     all         all             192.168.123.172/32    trust

修改postgresql.conf文件
vi postgresql.conf
#listen_addresses = 'localhost' -->#listen_addresses = '*'
 
 
psql -d dwdb -h 192.168.1.180 -p 5432 -U gpadmin
分享到:
评论

相关推荐

    greenplum安装与初始化

    Greenplum数据引擎软件 为新一代数据分析所需的大规模数据和复杂查询 功能所设计 支持众多商用硬件平台 基于PostgreSQL设计 支持ODBC/JDBC等多种接口

    单机安装greenplum4.3.10

    单机安装greenplum4.3.10, 介绍安装greenplum全过程。

    Greenplum安装部署参考手册.pdf

    * 服务器与机柜:在 Greenplum 安装部署中,服务器和机柜的选择是非常重要的。需要考虑到服务器的性能、存储容量、网络连接等因素,以确保 Greenplum 的稳定运行。 * 网络部署:网络部署是 Greenplum 安装部署的关键...

    零经验安装Greenplum(足够)

    零经验安装Greenplum(足够).

    greenplum安装配置手册

    本文将深入探讨在CentOS Linux release 7.1.1503环境下,如何顺利进行Greenplum的安装与配置,旨在帮助用户掌握其核心技术要点。 一、系统准备 在开始Greenplum的安装前,首先要确保系统环境满足基本要求。CentOS ...

    greenplum详细图文安装配置教程.pdf

    greenplum 图文安装配置教程 pdf gp4.2

    greenplum安装文档

    Greenplum 安装文档 Greenplum 是一个基于 PostgreSQL 的开源的数据仓库系统,提供了高性能的数据处理能力。下面是 Greenplum 的安装文档,详细介绍了安装 Greenplum 的步骤和配置项。 root 用户创建 在安装 ...

    Greenplum6.2.1版本安装包(RPM)版

    5. **初始化数据库**:运行`gpinitsystem`脚本来创建数据库集群并设置初始参数。 6. **启动和验证**:启动Greenplum数据库服务,并通过`psql`等工具验证安装是否成功。 7. **安全性和维护**:根据实际需求,配置...

    Greenplum分布式一键安装及卸载脚本

    **绿盟分布式数据库Greenplum的一键安装与卸载脚本详解** Greenplum是一款高效、可扩展的并行数据库系统,广泛应用于大数据处理和分析。为了简化Greenplum的安装和卸载过程,通常会编写一系列自动化脚本来实现一键...

    greenplum安装演示

    - **初始化数据库**:使用`gpinitsystem`脚本初始化数据库集群,提供主机名、端口和数据目录等信息。 - **启动Greenplum**:启动数据库服务,使用`gpstart`命令。 - **验证安装**:连接到数据库,运行查询以确认...

    Greenplum的安装(体验版centos+Greenplum)

    ### Greenplum数据库安装指南(体验版 CentOS + Greenplum) #### 一、Greenplum简介 Greenplum是一款基于PostgreSQL开发的MPP(大规模并行处理)数据库,主要应用于数据仓库的数据存储与处理场景。它对于Hadoop在...

    Greenplum详细安装

    总的来说,Greenplum的安装是一个涉及多个层面的过程,包括操作系统配置、软件安装和数据库初始化。理解每个步骤的作用和目的,将有助于确保Greenplum环境的稳定性和高效性。在实际操作时,务必遵循官方文档的指导,...

    greenplum安装前准备

    ### Greenplum数据库安装前准备工作详解 #### 一、概述 Greenplum是一款高性能的并行数据仓库解决方案,被广泛应用于大数据分析领域。为了确保Greenplum能够稳定高效地运行,进行适当的系统环境配置至关重要。本...

    GreenPlum 安装指导

    在GreenPlum数据库的安装与配置过程中,需要特别注意硬件和存储配置。例如,示例硬件堆栈展示了适合GreenPlum部署的服务器配置,包括CPU、内存、网络接口卡(NIC)和磁盘布局。正确配置这些组件有助于最大化...

    greenplum分布式安装配置

    指导greenplum安装与部署以及性能优化与管理。

    基于Greenplum Hadoop- 分布式平台的大数据解决方案04 - 安装Greenplum(2)

    6. **初始化Master节点**:在主节点上运行初始化脚本,设置系统参数,如数据库大小、段数等。 7. **创建Segment节点**:在每个Segment节点上执行配置脚本,指定Master节点的地址,然后启动Greenplum服务。 8. **...

    greenplum安装、扩容、缩容、HA

    Greenplum的安装部署文档,里面包括具体的gp的安装、部署、扩容、缩容、HA高可用的详细实施步骤。

    Greenplum数据库使用总结(5.11版本).pdf

    3.4 **Greenplum与HDFS结合**: - **安装HADOOP**:如何在Greenplum环境中安装Hadoop。 - **配置hadoop参数文件**:如何配置Hadoop参数以使其与Greenplum协同工作。 - **配置hadoop版本信息及路径信息**:确保...

Global site tag (gtag.js) - Google Analytics