Hadoop学习笔记:在Windows下搭建运行环境
——IT 进行时(Email & MSN:zhengxianquan AT hotmail.com)
说在前面的话: 作为一名技术人员,喜欢通过自己的实战去学习,也养成了写学习笔记的习惯。个人做企业应用更多,也涉及TB级别的非结构化数据,对于Hadoop倒是第一次接触,分布式计算总归有用武之地。但这个笔记只能说是自己的盲学,就是简单的看看。
Keywords:Hadoop; HDFS; 学习笔记
目录:
1. 准备工作 2
1.1. Supported Platforms 2
1.2. Hadoop需要的基础东西 2
1.3. 安装Cygwin注意事项 2
2. 单机上配置过程 3
2.1. 配置SSH 3
2.1.1. 配置服务 3
2.1.2. 启动Cygwin sshd服务 4
2.1.3. Setup authorization keys 5
2.2. 修订/配置/conf/core-site.xml 7
2.3. 修订/配置/conf/mapred-site.xml 9
2.4. 修订/配置\conf\masters和slaves 9
2.5. 修订/配置\conf\hadoop-env.sh 9
2.6. 其他数据节点类似,重复即可 10
3. 格式化及启动 10
3.1. 启动命令 10
3.2. 如何验证启动成功 11
4. 使用及开发 12
4.1. 常用命令行使用方法 12
4.2. 可以通过浏览器访问 15
5. FAQ 16
5.1. 为什么启动不了? 16
5.2. 配置文件可能导致的问题 17
5.3. JobTracker一直有问题? 19
5.4. 如何验证配置并启动成功? 19
6. 常用命令 20
7. 参考 21
尝试了几次,JavaEYE都不能让我轻松的贴Word的内容上来,不是格式错乱就是干脆把文章截断,真是遗憾。
只能放附件了。
分享到:
相关推荐
在Hadoop生态系统中,Windows平台上的运行环境搭建可能与Linux有所不同,但同样可行。"hadoop windows运行环境 bin.rar"这个压缩包文件很显然是为了帮助Windows用户设置Hadoop的运行环境。在这个过程中,`winutils....
【Hadoop与HBase自学笔记】是一篇详细记录在Windows环境下搭建Hadoop和HBase分布式环境的教程。本文主要分为六个部分,涵盖了从基础环境准备到集群开发的全过程。 1. **安装JDK**:首先,你需要安装Java ...
通过合理的配置和优化,即使是在低配置的硬件环境下,也能顺利地完成Hadoop集群的搭建,这对于学习和研究Hadoop的大数据处理能力非常有帮助。此外,本文还强调了在网络配置、用户权限管理等方面的重要性,这些细节...
接下来,《Hadoop伪分布模式安装笔记成功版本在windows下的虚拟机但是里面没有windows下的eclipse的配置.pdf》这份文档详细记录了在Windows环境下使用虚拟机(如VMware或VirtualBox)安装Hadoop的步骤,特别是伪...
在Windows系统上搭建本地Pyspark开发环境是一个重要的步骤,特别是对于那些希望在数据分析和机器学习项目中使用Apache Spark的用户。以下是一个详细的步骤指南,包括配置Java、Scala、Spark、Hadoop以及整合Anaconda...
### Hadoop学习笔记之全分布模式下SSH免密码登录实现 #### 一、背景介绍 在搭建Hadoop集群时,为了方便管理和数据处理,通常需要在各个节点之间实现SSH免密码登录。这样可以简化后续操作流程,提高效率。 #### 二...
在大数据领域,Linux操作系统扮演着至关重要的角色,因为大多数大数据工具和框架都在Linux环境下运行。以下是对"大数据Linux基础学习笔记"的相关知识点的详细说明: 一、Linux简介 Linux是一种自由和开放源代码的类...
在Windows环境下,为了更好地模拟Linux环境,可以使用Cygwin作为替代方案。Cygwin提供了类Unix环境,便于执行Nutch命令行工具。 #### 三、Nutch基本操作 **1. 配置URL文件** Nutch抓取网页的第一步是定义初始URL...
总的来说,"laptop"和"Java"的组合意味着我们将深入探讨如何在笔记本电脑上搭建和利用Java开发环境,以及如何使用各种相关工具进行Java程序的编写、测试和部署。这涉及到计算机硬件与软件的交互、编程语言的学习和...