- 浏览: 549478 次
- 性别:
- 来自: 杭州
-
文章分类
最新评论
-
GGGGeek:
看完了博主的博文,如果没猜错的话应该是浙大吧?很多优秀的人因为 ...
转《D君的故事》 以时刻警示自己 -
游牧民族:
楼主写的不错,学习了,最近对爬虫比较感兴趣,也写了些爬虫相关的 ...
通用爬虫框架及heritrix爬虫介绍 -
jimmee:
jerome_s 写道ice 你怎么看? 粗略的看了一下ice ...
MessagePack, Protocol Buffers和Thrift序列化框架原理和比较说明 -
jerome_s:
ice 你怎么看?
MessagePack, Protocol Buffers和Thrift序列化框架原理和比较说明 -
jimmee:
nk_tocean 写道照着做了,但是不行啊,还是乱码.先确认 ...
hive编写udf处理非utf-8数据
Ubuntu上“单节点”方式运行Hadoop (Running Hadoop 1.5.3 on Ubuntu in Single-node cluster)
- 博客分类:
- J2SE
对于程序员,在开发中以single-node cluster的方式建立Hadoop环境是很好的选择,只需在在一台PC上就能模拟Hadoop的集群环境,何乐而不为?本文Step-by-Step 讲述了Single-node cluster hadoop环境的配置,参考了http://www.michael-noll.com/wiki /Running_Hadoop_On_Ubuntu_Linux_%28Single-Node_Cluster%29一文。
JAVA 6
首先,请确保您的java-1.6(1.5 以上)已经安装成功,JAVA_HOME也已经设置。
添加一个专门的Hadoop用户
推荐使用专门的系统用户使用Hadoop,因为这样可以隔离开其他的应用软件的安装以及本机上的其他的用户(考虑到: 安全, 权限设置, 备份, 等等).
建立名为hadoop的用户
$ sudo addgroup hadoop
$ sudo adduser --ingroup hadoop hadoop
配置SSH
这一步是必须的,Hadoop使用SSH的方式管理其节点,即使在single-node方式中也需要对其进行配置。否则会出现“connection refused on port 22”错误.
在此之前,请确保您已经安装了SSH,如果没有,可以使用
$ sudo apt-get install openssh-server
下载并安装。
而后,我们为hadoop用户产生一个SSH密钥
young@ubuntu:~$ su - hadoop
hadoop@ubuntu:~$ ssh-keygen -t rsa -P ""
Generating public/private rsa key pair.
Enter file in which to save the key (/home/hadoop/.ssh/id_rsa):
Created directory '/home/hadoop/.ssh'. Your identification has been saved in /home/hadoop/.ssh/id_rsa. Your public key has been saved in /home/hadoop/.ssh/id_rsa.pub. The key fingerprint is: 9d:47:ab:d7:22:54:f0:f9:b9:3b:64:93:12:75:81:27 hadoop@ubuntu hadoop@ubuntu:~$ 第二行命令会创建一个 RSA 密钥对,此时密码为空. 一般而言, 不推荐使用空密码, 但是你总不想每次Hadoop和它的节点交互时,都要经历密码的检验的吧,所以这里设置为空 然后,你需要使用新创建的密钥可以SSH访问你的本地机器。 hadoop@ubuntu:~$ cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys 最后,测试SSH通过Hadoop user连接本地机器 hadoop@ubuntu:~$ ssh localhost The authenticity of host 'localhost (127.0.0.1)' can't be established. RSA key fingerprint is 76:d7:61:86:ea:86:8f:31:89:9f:68:b0:75:88:52:72. Are you sure you want to continue connecting (yes/no)? yes Warning: Permanently added 'localhost' (RSA) to the list of known hosts. Ubuntu 7.04 ... hadoop@ubuntu:~$ 如果出现错误,如 ssh connect to host localhost port 22: connection refused,一般是openssh-server未安装造成的。 如果其他错误,你可以使用 ssh -vvv localhost 来查看错误的细节,然后google吧……
安装Hadoop
解压缩
你须下hadoop 0.15.3.tar.gz 并且解压缩Hadoop包到你喜欢的路径下。我选择/usr/local/hadoop .确保修改所有的文件的所有属性为Hadoop用户和组,如下:
$ cd /usr/local
$ sudo tar xzf hadoop-0.14.2.tar.gz
$ sudo mv hadoop-0.14.2 hadoop
$ sudo chown -R hadoop:hadoop hadoop
配置hadoop-env.sh
打开<Hadoop_install>/conf/hadoop-env.sh
export JAVA_HOME=/usr/lib/jvm/java-1.6-sun(正确的JAVA_HOME路径)
配置hadoop-site.sh
打开<Hadoop_install>/conf/hadoop-site.sh
加入
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
格式化 namenode
$ cd hadoop - 0.15.3
$ bin/hadoop namenode -format
启动单机节点群
$ <HADOOP_INSTALL>/bin/start-all.sh
成功后,使用jps查看,如果成功,则显示 hadoop@sea:/usr/local/hadoop/$ jps 19811 TaskTracker 19674 SecondaryNameNode 19735 JobTracker 19497 NameNode 20879 TaskTracker$Child 21810 Jps
NOTICE: 现在Hadoop的版本已经更新到0.2,配置文件有了变化,如hadoop-site.xml就不再使用了,好像被hadoop-core.xml替代了,但是文档还没有更新……ummm……不过配置也是差不多的,先不多说了
评论
一、cygwin的安装与配置
1、什么是cygwin
cygwin是一个在windows平台上运行的unix模拟环境,是cygnus solutions公司开发的自由软件(该公司开发了很多好东西,著名的还有eCos,不过现已被Redhat收购)。它对于学习unix/linux操作环境,或者从unix到windows的应用程序移植,或者进行某些特殊的开发工作,尤其是使用gnu工具集在windows上进行嵌入式系统开发,非常有用。随着嵌入式系统开发在国内日渐流行,越来越多的开发者对cygwin产生了兴趣。
2、cygwin的安装
(1)下载安装程序,下载地址为: http://www.cygwin.com/setup.exe
(2)选择必须安装的包,根据实践有如下包必须选择安 装,否则很可能cygwin安装失败!
Net Category下的OpenSSL,OpenSSH;
Base Category下的sed;
Editors Category下的vim,Emacs;
Devel Category下的subversion,binutils,gcc,gcc-mingw,gdb
(3)点击下一步。一直到完成
说明:虽然cygwin提供在线安装,个人建议先 完全下载到本地,再进行安装,因为在线安装会出现许多莫名奇妙的问题。
2、cygwin的配置
(1)配置环境变量
CLASSPATH= .;C:\Java\jdk1.6.0_11\lib\dt.jar;C:\Java\jdk1.6.0_11\lib\tools.jar
CYGWIN=ntsec;
JAVA_HOME=C:\Java\JDK1.6.0_11;C:\Java\jre6;
在PATH环境变量中加入如下路径C:\cygwin\bin;C:\cygwin\usr\i686-pc-cygwin\bin;C:\Java\jdk1.6.0_11\bin;
(2)安装sshd服务
启动cygwin输入命令:ssh-host-config;
根据提示进行相应的操作直至安装完成,安装成功后立即启动名称为“CYGWIN sshd”的服务。
(3)配置ssh登录
执行ssh-keygen命令,然后根据提示按三次回车键,最后输入如下命令:
cd ~/.ssh/;
cp id_rsa.pub authorized_keys
至此,cygwin的安装与配置成功,你可以享受cygwin带来的乐趣。
hadoop@hadoop-desktop:~/hadoop-0.19.0$ hadoop fs -copyFromLocal /home/jme/output.log hdfs://localhost/user/tom/quangle.txt
10/09/24 14:31:52 INFO ipc.Client: Retrying connect to server: localhost/127.0.0.1:8020. Already tried 0 time(s).
10/09/24 14:31:53 INFO ipc.Client: Retrying connect to server: localhost/127.0.0.1:8020. Already tried 1 time(s).
copyFromLocal: Call to localhost/127.0.0.1:8020 failed on local exception: Connection refused
修改conf/hadoop-site.xml中9000为8020
<name>fs.default.name</name>
<value>hdfs://localhost:8020</value>
hadoop@hadoop-desktop:~/hadoop-0.19.0$ hadoop fs -copyFromLocal /home/jme/output.log hdfs://localhost/user/tom/quangle.txt
10/09/24 14:20:47 INFO ipc.Client: Retrying connect to server: localhost/127.0.0.1:9000. Already tried 0 time(s).
10/09/24 14:20:48 INFO ipc.Client: Retrying connect to server: localhost/127.0.0.1:9000. Already tried 1 time(s).
Bad connection to FS. command aborted.
把你DataNode上的DFS数据全删了,再重新格式化NameNode即可。
发表评论
-
[转载]并发之痛 Thread,Goroutine,Actor
2017-04-06 19:21 727转自 http://jolestar.com/pa ... -
JVM动态调整字节码
2016-04-14 19:27 1384粗略的点开btrace的源码看了一下,实际上他只是封装了JD ... -
java字节码常量池处理说明
2016-04-13 23:23 12631. 根据java的字节码格式说明,常量池中每一项的大小不一 ... -
Mac OSX 10.10 Yosemite编译OpenJDK 8
2016-04-03 18:14 3662编译时间:2016-04-03 系统版本:Mac OS ... -
Java 并发之 ConcurrentSkipListMap 简述
2015-09-20 20:24 1194JCIP 提到了在 Java 6 中引入了两个新的并发集合类 ... -
hbase等源码导入eclipse流程
2015-09-20 19:00 1805hbase: 1. 下载源码 svn co ht ... -
最简单的平衡树(红-黑树)的实现
2015-09-04 08:04 1279在二叉搜索树(BST)的基础上,要实现一颗平衡树,可以使用 ... -
多线程程序中操作的原子性[转载]
2014-12-06 10:49 12120. 背景 原子操作就是不可再分的操作。在多线程程序中原子 ... -
6. 内存屏障[转载]
2014-11-26 00:07 757原文地址 作者:Martin Thompson 译者: ... -
5.合并写(write combining)[转载]
2014-11-25 21:54 781原文地址 译者:无叶 ... -
4. 内存访问模型的重要性[转载]
2014-11-25 21:53 1115在高性能的计算中,我 ... -
3. Java 7与伪共享的新仇旧恨[转载]
2014-11-25 21:45 937原文:False Shareing && J ... -
2. 伪共享(False Sharing)[转载]
2014-11-25 21:40 906作者:Martin Thompson 译者:丁一 缓存 ... -
lucene索引创建的理解思路
2014-06-29 23:12 1546虽然lucene4很早就出来,但是这里仍然以lucene3. ... -
lucene的拼写检查的实现原理
2014-06-08 18:19 13761. 建索引时, 使用ngram的方式创建索引 Sp ... -
字符串相似算法-(3) NGram Distance
2014-06-08 17:54 4986就是N-Gram version of edit dista ... -
字符串相似算法-(2) Levenshtein distance
2014-06-08 16:32 2314编辑距离概念描述: ... -
字符串相似算法-(1) Jaro-Winkler Distance
2014-06-08 12:05 6886Jaro-Winkler Distance 算法 ... -
tomcat参数编码处理过程
2014-06-07 09:49 19031. org.apache.coyote.http11 ... -
SSLEngine的示例
2014-05-26 19:44 7880为什么要使用SSLEngine, 参考javadoc的说明 ...
相关推荐
ubuntu 搭建 Hadoop 单节点 Hadoop 是一个由 Apache 基金会所开发的分布式系统根底架构,用户可以在不了解分布式底层细节的情况下,开发分布式程序。Hadoop 实现了一个分布式文件系统(HDFS),简称 HDFS。HDFS 有...
hadoop-cluster-docker, 在 Docker 容器中运行 Hadoop 在 Docker 容器内运行Hadoop集群博客:在 Docker 更新中运行Hadoop集群。博客:基于Docker搭建Hadoop集群之升级版 3节点Hadoop集群 1.拉 Docker 图像sudo do
Hadoop Single Node Cluster的详细安装,master主机与data1、data2、data3三台节点连接。
Hadoop 单节点配置详解 Hadoop 是一个开源的大数据处理框架,由Apache基金会维护。它可以在单节点模式下运行,以便于开发、测试和学习。单节点模式下,Hadoop 可以在一台机器上模拟分布式环境,方便用户快速上手和...
【标题】"hadoop-cluster-build"涉及的知识点主要围绕着Hadoop集群的构建,这是一个大数据处理的核心技术。Hadoop是一个开源框架,它允许在廉价硬件上进行大规模数据处理,具有高度可扩展性和容错性。 【描述】...
【Hadoop-Single-Node-Cluster】是针对初学者或者开发者进行本地测试和学习Hadoop环境搭建的一个项目。在这个单节点集群中,所有的Hadoop组件都安装在一个单一的计算机上,便于理解和掌握Hadoop的基本原理和操作。这...
### Ubuntu上运行Hadoop WordCount实例详解 #### 一、环境搭建与配置 在Ubuntu系统上部署并运行Hadoop WordCount实例,首先需要确保已经安装了Hadoop环境,并且版本为hadoop-0.20.2。此版本较旧,主要用于教学或...
3. 伪分布式模式安装:Hadoop 可以在单节点上以伪分布式的方式运行,Hadoop 进程以分离的 Java 进程来运行,节点既作为 NameNode 也作为 DataNode,同时,读取的是 HDFS 中的文件。 4. 分布式模式安装:使用多个...
carbondata-1.4,spark-2.1,hadoop-2.6.0-cdh5.11.1源码编译
根据给定的文件信息,以下是对“hadoop single node setup”相关知识点的详细说明: 1. Hadoop单节点安装的目的 Hadoop单节点安装的主要目的是为了让用户能够在单机上快速地进行简单的Hadoop MapReduce和Hadoop...
标题中的"apache-hadoop-3.1.0-winutils-master.zip"是一个针对Windows用户的Hadoop工具包,它包含了运行Hadoop所需的特定于Windows的工具和配置。`winutils.exe`是这个工具包的关键组件,它是Hadoop在Windows上的一...
本手册旨在指导如何在一台计算机上搭建单节点伪分布式Hadoop环境,使用户能够在实际环境中熟悉Hadoop的配置、启动和数据处理流程。 #### 二、准备工作 - **操作系统**:推荐使用RHEL 6.0(Red Hat Enterprise ...
Hadoop Multi Node Cluster 安装步骤.pdf
在Hadoop生态系统中,"单节点集群"(Single Node Cluster)是一种常见的开发和测试环境配置,它模拟了一个完整的多节点集群,但所有组件都运行在同一台机器上。这对于初学者和开发者来说非常方便,因为它降低了硬件...
hadoop-annotations-3.1.1.jar hadoop-common-3.1.1.jar hadoop-mapreduce-client-core-3.1.1.jar hadoop-yarn-api-3.1.1.jar hadoop-auth-3.1.1.jar hadoop-hdfs-3.1.1.jar hadoop-mapreduce-client-hs-3.1.1.jar ...
1. **下载并解压**:首先,你需要下载hadoop-3.3.1的Windows版本和winutils工具包,并将它们解压到合适的目录,例如`C:\Hadoop`。 2. **配置环境变量**:打开系统环境变量设置,添加新的系统变量`HADOOP_HOME`,...
### Hadoop 单节点模式在 Ubuntu Linux 上的配置与运行 #### 一、环境准备与用户组设置 在 Ubuntu Linux 上部署 Hadoop 单节点模式之前,首先需要进行一定的环境准备,包括创建 Hadoop 用户组及用户,并设置必要的...
`hadoop-common-2.6.0-bin-master.zip` 是一个针对Hadoop 2.6.0版本的压缩包,特别适用于在Windows环境下进行本地开发和测试。这个版本的Hadoop包含了对Windows系统的优化,比如提供了`winutils.exe`,这是在Windows...
docker-hadoop, 在Ubuntu上,用于运行Hadoop的Dockerfile Hadoop的 Docker 映像 支持的标签和相应的Dockerfile 链接2.6.0/Dockerfile2.5.2/Dockerfile2.5.1/Dockerfile2.5.0/Dockerfile2.4.
ubuntu上安装hadoop集群,三个节点