配置Hadoop环境有几天了,虽说“装”了Ubuntu有两年了,不过这次用硬盘安装还是把系统搞崩溃了,而且是在装Ubuntu之前分盘时弄崩溃了,而且是因为搬电脑时震了一下,然后又采取了很不明智的解决方法——还原系统,而且还一不小心还原了整个盘,200多G的东西瞬间没了,就为了分20G的东西出来装Ubuntu,而且是我好不容易挤出来的20G啊。我的壁纸都有好几G啊,我的音乐也有几十G啊,我保留了好久的演唱会舍不得删啊,虽然这跟主题无关,但我还是不得不吐啊。
吐完回归正题,如果有跟我一样的新手的话,可以看一下,希望能帮上忙。
在Ubuntu下配置Hadoop的步骤其实很简单
1,安装Ubuntu
2,安装配置JDK
3,配置ssh
4,剩下就是安装配置hadoop了
安装教程网上很多,在这里就不重复了。
这几天一直照着网上的教程,敲了很多不懂的命令,多亏了其他几位已经装过hadoop的同学,遇到的问题都能很快解决,今天是配置好了hadoop集群,明天就可开始测试了。不过今天先小结,有的命令用过很多次了,虽然知道是什么用,也只是知其然,下面总结一下在配置时用到的命令和一些问题
sudo 是linux系统管理指令,是允许系统管理员让普通用户执行一些或者全部的root命令的一个工具
apt-get 是一条linux命令,适用于deb包管理式的操作系统,主要用于自动从互联网的软件仓库中搜索、安装、升级、卸载软件或操作系统
ssh-keygen 用来生成密钥和私钥文件,如果把a的密钥添加到b的authorized_keys中,那么a就可以登录b的目标帐号,不用输入密码,配置hadoop时,要让master能控制slave机器,所以要把master的密钥复制到所有的slave机器
scp 是用来远程复制文件,配置ssh时就是把master机器的密钥复制到slave机器上 scp master@masterIP:/home/master/.ssh/id_rsa.pub /home/slave/.ssh/masterNo_rsa.pub
cat 把文档或字符串打印或合并添加到另一个文件,我就是在添加密钥时不小心少打了一个">"覆盖掉了之前添加的密钥。一个是直接输入到另一个文件,两个是添加到文件末。cat masterNo_rsa.pub >> authorized_keys
这样就可以在master机器来控制slave机器了,那么这样的话其实先在每台机器上配置好ssh,然后写个脚本来循环控制每台机器配置jdk和hadoop(如果之前没装的话),这样的话就不用每台机器去配置了。
vi 是所有linux都会有的编辑器,因为老是遇到gtk warning,现在还没弄清楚这个问题,用vi 还是比较直接的方法。
分享到:
相关推荐
Hadoop环境搭建小结 █tar解压 █免密登录 █配置文件 █格式化文件系统....
RedHat Linux 9.0 下 Hadoop 单机配置归类 ...小结 本文档详细介绍了 Red Hat Linux 9.0 下 Hadoop 单机配置的步骤和要求,从 Hadoop 安装前提到 Hadoop 配置的详细步骤,帮助读者快速掌握 Hadoop 的安装和配置。
Hadoop集群机的安装配置与应用小结
实验报告的目的是详细记录使用Hadoop在Windows环境下实现WordCount应用的过程,包括环境配置、WordCount程序的实现以及实验结果分析。本实验旨在理解Hadoop分布式计算的基本原理,并熟悉Hadoop集群的搭建与管理。 #...
一、Linux虚拟网卡配置小结 查看一下windows主机:控制面板->本地服务->VMware相关服务有没有启动 1.如何配置Linux虚拟网卡: 1.如何配置Linux虚拟网卡: 原创文章 26获赞 15访问量 5189 关注 私信
#### 四、小结 本文档提供了在Ubuntu上搭建Hadoop集群的具体步骤和注意事项,通过这些步骤,用户可以在自己的计算机上快速搭建一个功能完整的Hadoop集群。在整个过程中,需要注意硬件资源的合理分配以及各个组件之间...
五、伪分布式安装步骤小结 伪分布式安装是Hadoop技术中的一个重要组件,通过设置SSH免密码、安装JDK和Hadoop、配置环境变量、修改配置文件等步骤,可以完成伪分布式安装。这种安装方式可以模拟一个小规模的集群,...
第1章 HDFS HA及解决方案 1.1 HDFS系统架构 1.2 HA定义 1.3 HDFS HA原因分析及应对措施 1.3.1 可靠性 1.3.2 可维护性 1.4 现有HDFS HA解决方案 1.4.1 Hadoop的元数据备份方案 1.4.2 Hadoop的...8.5 小结
#### 五、小结 通过上述步骤,我们已经完成了Hadoop-Fuse-Dfs的基本安装与配置。这使得用户能够在本地文件系统中轻松访问和管理HDFS中的数据资源,极大地提高了工作效率。需要注意的是,在实际部署过程中还需根据...
#### 小结 实现HDFS的高可用性对于构建可靠的大数据处理平台至关重要。通过本指南提供的信息,读者可以了解到如何在Cloudera的CDH平台上配置HDFS的高可用性,以及在实际部署过程中需要注意的一些关键硬件配置。遵循...
#### 小结 通过上述步骤,我们不仅成功地在生产环境中部署了一个DNS服务器,而且还配置了Hadoop集群使其能够利用DNS服务进行主机名解析,这极大地简化了集群管理和维护的工作量。对于大规模的Hadoop集群而言,这种...
MapReduce编程模型3.1 MapReduce编程模型概述3.1.1 MapReduce编程接口体系...配置与提交3.3.2 InputFormat接口的设计与实现3.3.3 OutputFormat接口的设计与实现3.3.4 Mapper与Reducer解析3.3.5 Partitioner接口的...
#### 四、前期工作小结 - **Hadoop高可用性修正**:针对Hadoop 0.12版本进行了高可用性的改进。 - **文本流数据处理框架**:从Nutch框架出发,创建了一套文本流数据处理的基础框架。 - **Eclipse插件开发**:开发了...
在本实验"MapReduce编程训练(三)"中,我们主要关注的是利用Hadoop MapReduce框架处理大数据,特别是针对全球气温记录的统计分析。实验的主要目标是实现以下几个关键知识点: 1. **自定义数据类型(Custom Data ...
20110.9 小结 206第11章 Hive及Hadoop群 20711.1 Hive 20711.1.1 安装与配置Hive 20811.1.2 查询的示例 21011.1.3 深入HiveQL 21311.1.4 Hive小结 22111.2 其他Hadoop相关的部分 22111.2.1 HBase 22111.2.2 ...
四、小结与教学反思 在完成这一部分的学习后,学生应该能够理解Ambari在Hadoop管理中的角色,以及如何准备和配置一个适合Hadoop运行的基础环境。教师需要强调实践操作的重要性,鼓励学生动手实践,以便更好地理解和...
1.3 小结…..............………………··…………….......….................….......….........……………….. 31 VI 第2 章HDFS 的数据管理与策略选择… . .... .. ....... … … ………… . .. . ... .. .....