`

debian 安装cloudera CDH3

 
阅读更多

1.安装jdk(略)

 

2.蒋下面两行加到文件/etc/apt/sources.list.d/cloudera.list

查看debian 的 name of your distributio

lsb_release -c

 

deb http://archive.cloudera.com/debian squeeze-cdh3 contrib
deb-src http://archive.cloudera.com/debian squeeze-cdh3 contrib

 或

deb http://archive.cloudera.com/debian DISTRO-cdh3 contrib
deb-src http://archive.cloudera.com/debian DISTRO-cdh3 contrib

 3.终端运行

curl -s http://archive.cloudera.com/debian/archive.key | apt-key add -

 4 更新

apt-get update

 5 搜索

apt-cache search hadoop

 

hadoop-0.20 - A software platform for processing vast amounts of data

hadoop-0.20-conf-pseudo - Pseudo-distributed Hadoop configuration

hadoop-0.20-datanode - Data Node for Hadoop

hadoop-0.20-doc - Documentation for Hadoop

hadoop-0.20-jobtracker - Job Tracker for Hadoop

hadoop-0.20-namenode - Name Node for Hadoop

hadoop-0.20-native - Native libraries for Hadoop (e.g., compression)

hadoop-0.20-pipes - Interface to author Hadoop MapReduce jobs in C++

hadoop-0.20-secondarynamenode - Secondary Name Node for Hadoop

hadoop-0.20-source - Source code for Hadoop

hadoop-0.20-tasktracker - Task Tracker for Hadoop

hadoop-hive - A data warehouse infrastructure built on top of Hadoop

hadoop-pig - A platform for analyzing large data sets using Hadoop

libhdfs0 - JNI Bindings to access Hadoop HDFS from C

 

6 安装

apt-get install hadoop-0.20

 7 安装相应的

hadoop-0.20-jobtracker - Job Tracker for Hadoop

hadoop-0.20-namenode - Name Node for Hadoop

hadoop-0.20-datanode - Data Node for Hadoop

hadoop-0.20-tasktracker - Task Tracker for Hadoop

hadoop-0.20-secondarynamenode - Secondary Name Node for Hadoop

 

分享到:
评论

相关推荐

    Ubuntu18.04 部署cdh6.3.2文档

    3.3.3.3 cdh3 4.4.4.4 cdh4 ``` 3. **设置 root 用户密码:** - 命令:`sudo passwd root` 4. **允许 root 用户通过 SSH 登录:** - 编辑 `/etc/ssh/sshd_config` 文件。 - 添加 `PermitRootLogin yes` 行。...

    SUSELinux下CDH5安装

    10. **Java开发套件(JDK)**:JDK是安装Cloudera Manager和CDH5的必备组件,因为许多Hadoop服务依赖Java运行时环境。 在实际操作中,除了上述步骤,还需要考虑防火墙配置、系统更新、用户权限设置、数据存储规划等...

    allkeys+RPM-GPG_KEY-cloudera.rar

    在安装CDH时,通常会要求导入这些公钥,以便在使用yum或apt(根据使用的是RHEL/CentOS还是Debian/Ubuntu系统)进行软件包管理时,系统能够自动验证Cloudera软件包的签名。这样,当从Cloudera仓库安装或更新软件时,...

    CDH5与CDH6对比.pdf

    CDH6基于Hadoop3,这意味着它对Hadoop生态系统的各个组件进行了大幅度的更新。例如,Hadoop自身从2.6.0升级到3.0.0,HBase从1.2.0升级到2.1.0,Spark从1.6.0/2.3.0升级到2.4.0,这些升级不仅带来了性能提升,也可能...

    CDH软硬件配置建议

    CDH(Cloudera's Distribution including Apache Hadoop)是由Cloudera公司推出的Hadoop发行版本,它包含了Hadoop生态系统中多个重要组件,并对它们进行了集成和优化。在部署CDH时,选择合适的软硬件配置对于保证...

    hadoop-2.6.0-cdh5.16.2.tar.gz for linux 支持snappy

    首先,确保系统已经安装了Snappy的开发库,通过命令`sudo apt-get install libsnappy-dev`(对于Ubuntu/Debian)或`yum install snappy-devel`(对于CentOS/RHEL)进行安装。接着,需要修改Hadoop的配置文件,如`...

    minimal-cdh-docker-test-cluster

    用于Debian Wheezy的CDH 5.4.4伪分布式集群Docker映像这是的重写######变化Wheezy作为基本图像安装必要的软件包以自动接受许可证的方式安装Obstacle Java 使用GXL项目的最新版本和Cloudera密钥安装Cloudera...

    thumbor_hbase:用于Thumbor(https的hbase存储

    Hadoop / HBase安装用于Thumbor的HBase存储模块最初是在Debian系统上的Cloudera CDH3 Hadoop上开发和测试的。在Ubuntu / Debian系统上安装您可以遵循适用于Ubuntu / Debian Systems Systems的,并安装以下软件包: ...

    CDH软硬件配置建议-20240207.pdf

    本文档基于Cloudera提供的CDH软硬件配置建议,旨在为大数据集群的硬件规划及组件角色规划提供指导。 #### 二、网络拓扑结构 **1. 单机架拓扑** 单机架拓扑适用于较小规模的大数据集群。在这种结构中,所有服务器...

    libmysqlclient.so.18.0.zip

    在描述中提到的问题,CDH(Cloudera Data Hub)是一个大数据平台,而Hue是CDH中一个基于Web的用户界面,用于交互式地操作Hadoop生态系统中的各种服务,包括数据库。当Hue尝试连接到源数据库时,如果缺少这个库文件,...

    用Hadoop进行分布式数据处理第1部分:入门

    echo "deb-src http://archive.cloudera.com/debian intrepid-cdh3 contrib" >> /etc/apt/sources.list.d/cloudera.list ``` - 接下来,添加Cloudera的APT密钥以验证下载的包。 ```bash curl -s ...

    libmysqlclient.so.18.0.0

    描述中提到的问题是关于CDH (Cloudera Data Hub) 安装后,Hue服务在尝试连接到MySQL数据库时遇到了错误。错误信息显示缺少了 `libmysqlclient.so.18` 文件,这通常是由于系统没有正确配置MySQL客户端库或者缺失对应...

    详解linux ntp服务器时间同步设置

    例如,安装Cloudera Manager (CM) 或 Cloudera Distribution Including Hadoop (CDH) 时,如果服务器之间的时间不一致,可能会导致系统出现红色警告或运行异常。因此,了解如何配置Linux NTP (Network Time Protocol...

Global site tag (gtag.js) - Google Analytics