`
唐木白
  • 浏览: 20168 次
  • 性别: Icon_minigender_1
  • 来自: 长沙
文章分类
社区版块
存档分类
最新评论

Hadoop配置小结

阅读更多

配置Hadoop环境有几天了,虽说“装”了Ubuntu有两年了,不过这次用硬盘安装还是把系统搞崩溃了,而且是在装Ubuntu之前分盘时弄崩溃了,而且是因为搬电脑时震了一下,然后又采取了很不明智的解决方法——还原系统,而且还一不小心还原了整个盘,200多G的东西瞬间没了,就为了分20G的东西出来装Ubuntu,而且是我好不容易挤出来的20G啊。我的壁纸都有好几G啊,我的音乐也有几十G啊,我保留了好久的演唱会舍不得删啊,虽然这跟主题无关,但我还是不得不吐啊

 

吐完回归正题,如果有跟我一样的新手的话,可以看一下,希望能帮上忙。

 

在Ubuntu下配置Hadoop的步骤其实很简单

 

1,安装Ubuntu

2,安装配置JDK

3,配置ssh

4,剩下就是安装配置hadoop了

 

安装教程网上很多,在这里就不重复了。

这几天一直照着网上的教程,敲了很多不懂的命令,多亏了其他几位已经装过hadoop的同学,遇到的问题都能很快解决,今天是配置好了hadoop集群,明天就可开始测试了。不过今天先小结,有的命令用过很多次了,虽然知道是什么用,也只是知其然,下面总结一下在配置时用到的命令和一些问题

 

sudo 是linux系统管理指令,是允许系统管理员让普通用户执行一些或者全部的root命令的一个工具

 

apt-get   是一条linux命令,适用于deb包管理式的操作系统,主要用于自动从互联网的软件仓库中搜索、安装、升级、卸载软件或操作系统

 

ssh-keygen 用来生成密钥和私钥文件,如果把a的密钥添加到b的authorized_keys中,那么a就可以登录b的目标帐号,不用输入密码,配置hadoop时,要让master能控制slave机器,所以要把master的密钥复制到所有的slave机器

 

scp 是用来远程复制文件,配置ssh时就是把master机器的密钥复制到slave机器上 scp master@masterIP:/home/master/.ssh/id_rsa.pub  /home/slave/.ssh/masterNo_rsa.pub

 

 

cat  把文档或字符串打印或合并添加到另一个文件,我就是在添加密钥时不小心少打了一个">"覆盖掉了之前添加的密钥。一个是直接输入到另一个文件,两个是添加到文件末。cat masterNo_rsa.pub >> authorized_keys

 

 

这样就可以在master机器来控制slave机器了,那么这样的话其实先在每台机器上配置好ssh,然后写个脚本来循环控制每台机器配置jdk和hadoop(如果之前没装的话),这样的话就不用每台机器去配置了。

 

vi 是所有linux都会有的编辑器,因为老是遇到gtk warning,现在还没弄清楚这个问题,用vi 还是比较直接的方法。

1
5
分享到:
评论

相关推荐

    Hadoop搭建小结

    Hadoop环境搭建小结 █tar解压 █免密登录 █配置文件 █格式化文件系统....

    RedHatlinux9.0下Hadoop单机配置归类.pdf

    RedHat Linux 9.0 下 Hadoop 单机配置归类 ...小结 本文档详细介绍了 Red Hat Linux 9.0 下 Hadoop 单机配置的步骤和要求,从 Hadoop 安装前提到 Hadoop 配置的详细步骤,帮助读者快速掌握 Hadoop 的安装和配置。

    Hadoop集群机的安装配置与应用小结

    Hadoop集群机的安装配置与应用小结

    使用hadoop实现WordCount实验报告.docx

    实验报告的目的是详细记录使用Hadoop在Windows环境下实现WordCount应用的过程,包括环境配置、WordCount程序的实现以及实验结果分析。本实验旨在理解Hadoop分布式计算的基本原理,并熟悉Hadoop集群的搭建与管理。 #...

    Hadoop大数据学习–Linux虚拟网卡配置小结–精华篇(二)

    一、Linux虚拟网卡配置小结 查看一下windows主机:控制面板->本地服务->VMware相关服务有没有启动 1.如何配置Linux虚拟网卡: 1.如何配置Linux虚拟网卡: 原创文章 26获赞 15访问量 5189 关注 私信

    在Ubuntu上配置Hadoop集群

    #### 四、小结 本文档提供了在Ubuntu上搭建Hadoop集群的具体步骤和注意事项,通过这些步骤,用户可以在自己的计算机上快速搭建一个功能完整的Hadoop集群。在整个过程中,需要注意硬件资源的合理分配以及各个组件之间...

    Hadoop技术-Hadoop伪分布式安装.pptx

    五、伪分布式安装步骤小结 伪分布式安装是Hadoop技术中的一个重要组件,通过设置SSH免密码、安装JDK和Hadoop、配置环境变量、修改配置文件等步骤,可以完成伪分布式安装。这种安装方式可以模拟一个小规模的集群,...

    高可用性的HDFS:Hadoop分布式文件系统深度实践

    第1章 HDFS HA及解决方案 1.1 HDFS系统架构 1.2 HA定义 1.3 HDFS HA原因分析及应对措施 1.3.1 可靠性 1.3.2 可维护性 1.4 现有HDFS HA解决方案 1.4.1 Hadoop的元数据备份方案 1.4.2 Hadoop的...8.5 小结

    hadoop-fuse-dfs安装.docx

    #### 五、小结 通过上述步骤,我们已经完成了Hadoop-Fuse-Dfs的基本安装与配置。这使得用户能够在本地文件系统中轻松访问和管理HDFS中的数据资源,极大地提高了工作效率。需要注意的是,在实际部署过程中还需根据...

    hadoop之cdh

    #### 小结 实现HDFS的高可用性对于构建可靠的大数据处理平台至关重要。通过本指南提供的信息,读者可以了解到如何在Cloudera的CDH平台上配置HDFS的高可用性,以及在实际部署过程中需要注意的一些关键硬件配置。遵循...

    生产环境下hadoop大集群安装之DNS服务器配置

    #### 小结 通过上述步骤,我们不仅成功地在生产环境中部署了一个DNS服务器,而且还配置了Hadoop集群使其能够利用DNS服务进行主机名解析,这极大地简化了集群管理和维护的工作量。对于大规模的Hadoop集群而言,这种...

    Hadoop技术内幕:深入解析MapReduce架构设计与实现原理

    MapReduce编程模型3.1 MapReduce编程模型概述3.1.1 MapReduce编程接口体系...配置与提交3.3.2 InputFormat接口的设计与实现3.3.3 OutputFormat接口的设计与实现3.3.4 Mapper与Reducer解析3.3.5 Partitioner接口的...

    基于hadoop的海量文本处理系统

    #### 四、前期工作小结 - **Hadoop高可用性修正**:针对Hadoop 0.12版本进行了高可用性的改进。 - **文本流数据处理框架**:从Nutch框架出发,创建了一套文本流数据处理的基础框架。 - **Eclipse插件开发**:开发了...

    Hadoop大数据实训,求最高温度最低温度实验报告

    在本实验"MapReduce编程训练(三)"中,我们主要关注的是利用Hadoop MapReduce框架处理大数据,特别是针对全球气温记录的统计分析。实验的主要目标是实现以下几个关键知识点: 1. **自定义数据类型(Custom Data ...

    Hadoop实战

    20110.9 小结 206第11章 Hive及Hadoop群 20711.1 Hive 20711.1.1 安装与配置Hive 20811.1.2 查询的示例 21011.1.3 深入HiveQL 21311.1.4 Hive小结 22111.2 其他Hadoop相关的部分 22111.2.1 HBase 22111.2.2 ...

    教案27 项目8 平台化快速部署Hadoop 第1部分 探寻大数据平台及基础环境配置.docx

    四、小结与教学反思 在完成这一部分的学习后,学生应该能够理解Ambari在Hadoop管理中的角色,以及如何准备和配置一个适合Hadoop运行的基础环境。教师需要强调实践操作的重要性,鼓励学生动手实践,以便更好地理解和...

    hadoop大数据实战手册

    1.3 小结…..............………………··…………….......….................….......….........……………….. 31 VI 第2 章HDFS 的数据管理与策略选择… . .... .. ....... … … ………… . .. . ... .. .....

Global site tag (gtag.js) - Google Analytics