`
wbj0110
  • 浏览: 1591268 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

Cloudera Hadoop CDH上装配R及RHadoop(rhdfs/rmr2/rhbase/RHive)

阅读更多

Cloudera Hadoop CDH上安装R及RHadoop(rhdfs/rmr2/rhbase/RHive)

转自:http://www.geedoo.info/installed-on-the-cloudera-hadoop-cdh-r-and-rhadoop-rhdfs-rmr2-rhbase-rhive.html

前言:RHadoop是由Revolution Analytics发起的一个开源项目,它可以将统计语言R与Hadoop结合起来。目前该项目包括三个R packages,分别为支持用R来编写MapReduce应用的rmr、用于R语言访问HDFS的rhdfs以及用于R语言访问HBASE的rhbase。

一、系统及所需软件版本

服务器操作系统:CentOS 6.3

R语言版本:R-2.15.3 (先前使用过R-3的最新版,发现新版本存在各种不兼容的问题,因此选择了R-2的最新版)

下载地址:http://ftp.ctex.org/mirrors/CRAN/src/base/R-2/R-2.15.3.tar.gz

Cloudera Hadoop CDH版本:4.4.0

JDK版本:1.6.0_31

使用Cloudera Manager 免费版的安装包cloudera-manager-installer.bin,即可完成CDH和JDK的安装,具体详见CDH的安装

下载地址:https://ccp.cloudera.com/display/SUPPORT/Cloudera+Manager+Free+Edition+Download

rJava(是java可以调用R,可使用CRAN安装)版本:rJava_0.9-5

下载地址:http://www.rforge.net/src/contrib/rJava_0.9-5.tar.gz

RHadoop版本,为官方最新版本,项目地址(https://github.com/RevolutionAnalytics),包含项目具体如下:

  • rmr-2.2.2
  • rhdfs-1.0.6
  • rhbase-1.2.0

下载地址:https://github.com/RevolutionAnalytics/RHadoop/wiki/Downloads

说明文档:https://github.com/RevolutionAnalytics/RHadoop/wiki

二、依赖安装(R语言包、rJava包)

在安装之前需要在集群各个主机上逐个安装R语言包、rJava包,然后再进行Rhadoop的安装。具体安装步骤如下:

1、安装R语言包

在编译R之前,需要通过yum安装以下几个程序:

# yum install gcc-gfortran

否则报”configure: error: No F77 compiler found”错误

# yum install gcc gcc-c++

否则报”configure: error: C++ preprocessor “/lib/cpp” fails sanity check”错误

# yum install readline-devel

否则报”–with-readline=yes (default) and headers/libs are not available”错误

# yum install libXt-devel

否则报”configure: error: –with-x=yes (default) and X11 headers/libs are not available”错误

然后下载源代码,编译

# wget http://cran.rstudio.com/src/base/R-2/R-2.15.3.tar.gz

# tar -zxvf R-2.15.3.tar.gz

# cd R-2.15.3

# ./configure –prefix=/usr –disable-nls –enable-R-shlib/** (后面两个选项–disable-nls –enable-R-shlib是为RHive的安装座准备,如果不安装RHive可以省去)*/

# make

# make install

 

 

http://soledede.com/

 

个人微信号:scccdgf

 

微信公众号:
分享到:
评论

相关推荐

    cloudera hadoop cdh4.3版本安装

    在本文中,我们将深入探讨如何在CentOS 6.2环境下安装Cloudera's Hadoop Distribution (CDH) 4.3版本。CDH是Cloudera公司提供的一款开源大数据处理平台,它集成了Hadoop生态系统中的多个组件,如Hadoop、Zookeeper和...

    Cloudera Hadoop 安装指南

    根据给定的文件信息,以下是对Cloudera Hadoop安装指南中的关键知识点的详细解析。 ### 关于Cloudera Hadoop安装指南 Cloudera Hadoop安装指南是为那些希望在自己的环境中部署并运行Cloudera Hadoop软件的用户提供...

    Cloudera Hadoop 5&Hadoop高阶管理及调优课程

    Cloudera Hadoop 5&Hadoop高阶管理及调优课程,完整版,提供课件代码资料下载。 内容简介 本教程针对有一定Hadoop基础的学员,深入讲解如下方面的内容: 1、Hadoop2.0高阶运维,包括Hadoop节点增加删除、HDFS和...

    hadoop cdh5 centos 64位系统本地库编译文件

    标题中的“hadoop cdh5 centos 64位系统本地库编译文件”涉及到的是在基于64位CentOS操作系统上编译Hadoop CDH5(Cloudera's Distribution Including Apache Hadoop)的本地库的过程。CDH5是Cloudera公司提供的一个...

    【CDH部署】全网最简单CDH6.2.0环境部署

    官方下载链接: https://archive.cloudera.com/cdh6/6.2.0/parcels/ 百度网盘下载链接: https://pan.baidu.com/s/1Dm5Elf9uQqn14BUbgU3AFQ 提取码: mws3 主机规划 sparkproject1 manager 8G 50GB sparkproject2 agent...

    hadoop cdh5安装

    在本文中,我们将深入探讨如何在Linux环境中安装Hadoop CDH5,这是一个广泛使用的Hadoop分发版,包含了多个开源大数据处理组件。CDH5提供了高效的数据存储、处理和分析功能,适合大规模数据处理场景。 首先,安装...

    Cloudera hadoop开发员培训教材

    Cloudera是提供Hadoop商业发行版的一个主要供应商,其产品CDH(Cloudera's Distribution including Apache Hadoop)是业界广泛使用的企业级Hadoop解决方案。 在Cloudera提供的Hadoop开发员培训中,首先会对Hadoop的...

    基于Cloudera-CDH的安装说明文档

    它不仅提供了详细的步骤和指导,用于帮助用户在生产环境中高效地安装和配置Cloudera软件,包括Cloudera Manager、CDH(Cloudera Distribution Including Apache Hadoop)以及其他托管服务,还涵盖了从基础设置到高级...

    hadoop-fuse-dfs安装.docx

    本文档旨在为读者提供关于在CDH(Cloudera Distribution Including Apache Hadoop)环境下安装和配置Hadoop-Fuse-Dfs的详细步骤及注意事项。通过本文档的学习,用户能够了解如何通过Hadoop-Fuse-Dfs实现HDFS(Hadoop...

    Hadoop CDH5.5.0 配置(Hdfs/Yarn HA)

    在大数据处理领域,Hadoop是不可或缺的开源框架,而Cloudera Distribution Including Apache Hadoop (CDH) 是Hadoop的一种企业级发行版,它提供了一套完整的数据处理和存储解决方案。CDH5.5.0是CDH的一个版本,包含...

    hadoop cdh版本伪分布式集群搭建图文教程

    CDH(Cloudera Distribution Including Apache Hadoop)作为Hadoop的一个发行版,因其高度集成性和易用性而受到广泛欢迎。本文将详细介绍如何在单台机器上搭建Hadoop CDH版本的伪分布式集群,并通过图文形式进行指导...

    Hadoop 源码编译所需软件

    2. **获取源码**:从Cloudera的官方仓库或者GitHub上克隆Hadoop CDH的源代码。 3. **依赖管理**:下载并安装所有必要的依赖,这包括Hadoop自身依赖的其他开源项目,如Zookeeper、Avro、Protobuf等,以及在这个例子...

    cloudera-hive-cdh6.3.2源码包

    在 CDH(Cloudera Distribution Including Apache Hadoop)6.3.2 版本中,Hive 已经发展到了一个成熟的阶段,提供了更高效、稳定的数据处理能力。下面我们将对 `cloudera-hive-cdh6.3.2` 源码包中的关键组件和技术...

    hadoop之cdh

    ### Hadoop之CDH:基于Cloudera的HA部署指南 #### 关于本指南 本文档旨在提供关于如何在Cloudera Distribution Including Hadoop (CDH)上配置高可用性的详细指南。CDH是由Cloudera公司提供的一个企业级Hadoop发行...

    Cloudera hadoop文档

    Cloudera hadoop官方文档 Cloudera Enterprise 5.11.x Documentation https://www.cloudera.com/documentation/enterprise/latest.html

    cloudera manager 安装cdh 搭建大数据集群,详细讲解核心

    Cloudera Manager 安装 CDH 搭建大数据集群核心知识点 一、Cloudera Manager 安装方法 Cloudera Manager 安装 CDH 集群有多种方法,主要分为 Server 端和 Agent 端安装。 1. Server 端安装: * 使用 yum 安装 cm...

    cdh5-vagrant, 准备使用,手动调整 Cloudera Hadoop发行版 5已经置备集群.zip

    cdh5-vagrant, 准备使用,手动调整 Cloudera Hadoop发行版 5已经置备集群 Hadoop发行版 5的 Vagrant脚本这个脚本提供了一个完整的自动方式来在完全分布式的node 中安装 Cloudera,无需用户干预。 因为我在互联网上...

    Cloudera CDH集群运维手册

    Cloudera CDH(Cloudera Distribution Including Apache Hadoop)是Cloudera公司提供的一款开源大数据平台,它包含了Hadoop生态系统中的多个组件,如HDFS、MapReduce、YARN、Hive、HBase等,为企业级大数据处理提供...

    Cloudera hadoop spark培训题

    2. 使用命令行和Hue访问HDFS:Hadoop分布式文件系统(HDFS)是Hadoop项目的核心子项目之一,它设计用于运行在标准硬件上的分布式文件系统。而Hue是一个用户友好界面,可以通过它来访问HDFS和Hadoop集群的其他组件。 ...

    Cloudera 5 Hadoop平台简介

    作为业界最领先的企业级数据平台软件,Cloudera企业版除了包含业界最流行的基于开源Hadoop及其生态组件构建的CDH核心,还包含了大量为支撑企业级业务的高级管理特性。 借助于Cloudera企业版的整体解决方案,企业可以...

Global site tag (gtag.js) - Google Analytics