1.安装jdk(略)
2.蒋下面两行加到文件/etc/apt/sources.list.d/cloudera.list
查看debian 的 name of your distributio
lsb_release -c
deb http://archive.cloudera.com/debian squeeze-cdh3 contrib deb-src http://archive.cloudera.com/debian squeeze-cdh3 contrib
或
deb http://archive.cloudera.com/debian DISTRO-cdh3 contrib deb-src http://archive.cloudera.com/debian DISTRO-cdh3 contrib
3.终端运行
curl -s http://archive.cloudera.com/debian/archive.key | apt-key add -
4 更新
apt-get update
5 搜索
apt-cache search hadoop
hadoop-0.20 - A software platform for processing vast amounts of data
hadoop-0.20-conf-pseudo - Pseudo-distributed Hadoop configuration
hadoop-0.20-datanode - Data Node for Hadoop
hadoop-0.20-doc - Documentation for Hadoop
hadoop-0.20-jobtracker - Job Tracker for Hadoop
hadoop-0.20-namenode - Name Node for Hadoop
hadoop-0.20-native - Native libraries for Hadoop (e.g., compression)
hadoop-0.20-pipes - Interface to author Hadoop MapReduce jobs in C++
hadoop-0.20-secondarynamenode - Secondary Name Node for Hadoop
hadoop-0.20-source - Source code for Hadoop
hadoop-0.20-tasktracker - Task Tracker for Hadoop
hadoop-hive - A data warehouse infrastructure built on top of Hadoop
hadoop-pig - A platform for analyzing large data sets using Hadoop
libhdfs0 - JNI Bindings to access Hadoop HDFS from C
6 安装
apt-get install hadoop-0.20
7 安装相应的
hadoop-0.20-jobtracker - Job Tracker for Hadoop
hadoop-0.20-namenode - Name Node for Hadoop
hadoop-0.20-datanode - Data Node for Hadoop
hadoop-0.20-tasktracker - Task Tracker for Hadoop
hadoop-0.20-secondarynamenode - Secondary Name Node for Hadoop
相关推荐
3.3.3.3 cdh3 4.4.4.4 cdh4 ``` 3. **设置 root 用户密码:** - 命令:`sudo passwd root` 4. **允许 root 用户通过 SSH 登录:** - 编辑 `/etc/ssh/sshd_config` 文件。 - 添加 `PermitRootLogin yes` 行。...
10. **Java开发套件(JDK)**:JDK是安装Cloudera Manager和CDH5的必备组件,因为许多Hadoop服务依赖Java运行时环境。 在实际操作中,除了上述步骤,还需要考虑防火墙配置、系统更新、用户权限设置、数据存储规划等...
在安装CDH时,通常会要求导入这些公钥,以便在使用yum或apt(根据使用的是RHEL/CentOS还是Debian/Ubuntu系统)进行软件包管理时,系统能够自动验证Cloudera软件包的签名。这样,当从Cloudera仓库安装或更新软件时,...
CDH6基于Hadoop3,这意味着它对Hadoop生态系统的各个组件进行了大幅度的更新。例如,Hadoop自身从2.6.0升级到3.0.0,HBase从1.2.0升级到2.1.0,Spark从1.6.0/2.3.0升级到2.4.0,这些升级不仅带来了性能提升,也可能...
CDH(Cloudera's Distribution including Apache Hadoop)是由Cloudera公司推出的Hadoop发行版本,它包含了Hadoop生态系统中多个重要组件,并对它们进行了集成和优化。在部署CDH时,选择合适的软硬件配置对于保证...
首先,确保系统已经安装了Snappy的开发库,通过命令`sudo apt-get install libsnappy-dev`(对于Ubuntu/Debian)或`yum install snappy-devel`(对于CentOS/RHEL)进行安装。接着,需要修改Hadoop的配置文件,如`...
用于Debian Wheezy的CDH 5.4.4伪分布式集群Docker映像这是的重写######变化Wheezy作为基本图像安装必要的软件包以自动接受许可证的方式安装Obstacle Java 使用GXL项目的最新版本和Cloudera密钥安装Cloudera...
Hadoop / HBase安装用于Thumbor的HBase存储模块最初是在Debian系统上的Cloudera CDH3 Hadoop上开发和测试的。在Ubuntu / Debian系统上安装您可以遵循适用于Ubuntu / Debian Systems Systems的,并安装以下软件包: ...
本文档基于Cloudera提供的CDH软硬件配置建议,旨在为大数据集群的硬件规划及组件角色规划提供指导。 #### 二、网络拓扑结构 **1. 单机架拓扑** 单机架拓扑适用于较小规模的大数据集群。在这种结构中,所有服务器...
在描述中提到的问题,CDH(Cloudera Data Hub)是一个大数据平台,而Hue是CDH中一个基于Web的用户界面,用于交互式地操作Hadoop生态系统中的各种服务,包括数据库。当Hue尝试连接到源数据库时,如果缺少这个库文件,...
echo "deb-src http://archive.cloudera.com/debian intrepid-cdh3 contrib" >> /etc/apt/sources.list.d/cloudera.list ``` - 接下来,添加Cloudera的APT密钥以验证下载的包。 ```bash curl -s ...
描述中提到的问题是关于CDH (Cloudera Data Hub) 安装后,Hue服务在尝试连接到MySQL数据库时遇到了错误。错误信息显示缺少了 `libmysqlclient.so.18` 文件,这通常是由于系统没有正确配置MySQL客户端库或者缺失对应...
例如,安装Cloudera Manager (CM) 或 Cloudera Distribution Including Hadoop (CDH) 时,如果服务器之间的时间不一致,可能会导致系统出现红色警告或运行异常。因此,了解如何配置Linux NTP (Network Time Protocol...