hadoop - - ITeye博客

`

simplehappy

浏览: 118854 次
性别:
来自: 武汉

最近访客更多访客>>

佳佳搭档

suichangkele

jzhfmm

lzqustc

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

TheMatrix： tab切换时，每次都重新加载onCreateView方法，这个 ...
android FragmentTabHost
458832194： ...
android FragmentTabHost
simplehappy： main_relative.xml和main_linear.x ...
android FragmentTabHost
tkpc：感谢Google这么快就搜索到我想要的，楼主的做法是可行的，算 ...
android FragmentTabHost

hadoop

Hadoop Linux IBM SSH XML

阅读更多

http://www.ibm.com/developerworks/cn/linux/l-hadoop-1/

http://www.ibm.com/developerworks/cn/linux/l-hadoop-2/

http://www.ibm.com/developerworks/cn/linux/l-hadoop-3/

http://hadoop.apache.org/common/docs/r0.18.2/cn/quickstart.html#FullyDistributed

http://www.cnblogs.com/wayne1017/archive/2007/03/20/678724.html

1. 部署测试, 3台机器，192.168.1.10为namenode，192.168.1.11/12为datanode

先配置好无密码ssh登录各个机器(包括本机)

下载hadoop-0.21.0.tar.gz, 解压到hadoop-0.21.0, 修改conf目录下的配置文件后拷贝到3台机器上

hadoop-env.sh

修改JAVA_HOME路径

core-site.xml

<configuration>

<property>

<name>fs.default.name</name>

<value>hdfs://192.168.1.10:9900</value>

</property>

</configuration>

hdfs-site.xml

<configuration>

<property>

<name>dfs.replication</name>

<value>2</value>

</property>

</configuration>

mapred-site.xml

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>192.168.1.10:9901</value>

</property>

</configuration>

master

192.168.1.10

slaves

192.168.1.11

192.168.1.12

2. 在192.168.1.10启动服务

2.1 格式化namenode

bin/hadoop namenode -format

2.2 启动

bin/start-all.sh //这个版本的stat-dfs.sh有BUG, 稍微修改一下可用

http://192.168.1.10:50070可以看到namenode的信息, live node应该有2个

有错误的话，可以看logs目录下的日志

3. 命令测试

bin/hadoop fs -ls

创建目录input

bin/hadoop fs -mkdir input

把当前目录下的拷贝的input目录

bin/hadoop fs -put README.txt input

bin/hadoop fs -ls input

显示文件内容

bin/hadoop fs -cat input/README.txt

执行字符个数统计map-reduce, 结果存放到output目录

bin/hadoop jar hadoop-mapred-examples-0.21.0.jar wordcount input output

4.java接口

4.1读写文件

分享到：

FastDFS | 初识sphinx搜索引擎

2010-12-15 21:33
浏览 1250
评论(0)
分类:互联网
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

win环境 hadoop 3.1.1安装包: Hadoop是一个由Apache软件基金会开发的开源框架，它允许使用简单的编程模型在分布式环境中存储和处理大数据。它主要由四个核心组件构成：Hadoop Common、HDFS（Hadoop Distributed File System）、YARN（Yet Another...

hadoop-2.7.0.tar: Hadoop-2.7.0.tar是一个著名的开源分布式存储与计算系统Hadoop的安装包。Hadoop是由Apache软件基金会开发的一个分布式系统基础架构，主要解决大数据问题。Hadoop的设计初衷是可靠、高效、可伸缩地存储和处理大数据集...

hadoop2.7.3 hadoop.dll: 在windows环境下开发hadoop时，需要配置HADOOP_HOME环境变量，变量值D:\hadoop-common-2.7.3-bin-master，并在Path追加%HADOOP_HOME%\bin，有可能出现如下错误： org.apache.hadoop.io.nativeio.NativeIO$Windows....

Hadoop下载 hadoop-2.9.2.tar.gz: Hadoop 是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。最初由 Yahoo 的工程师 Doug Cutting 和 Mike Cafarella Hadoop 是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。最初由 Yahoo...

Hadoop下载 hadoop-3.3.3.tar.gz: Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进 Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不...

windows下的hadoop-3.1.4: 在Windows环境下安装和使用Hadoop可能对于一些初学者来说，是件挑战性较大的任务。不过，随着技术社区的不断发展，越来越多的教程和文章出现，为人们提供了宝贵的指导和帮助。本篇文档将详细介绍如何在Windows操作...

Apache hadoop-3.1.0 版本: Apache Hadoop （hadoop-3.3.4.tar.gz）项目为可靠、可扩展的分布式计算开发开源软件。官网下载速度非常缓慢，因此将hadoop-3.3.4 版本放在这里，欢迎大家来下载使用！ Hadoop 架构是一个开源的、基于 Java 的编程...

hadoop2.7.3 Winutils.exe hadoop.dll: 在IT行业中，Hadoop是一个广泛使用的开源框架，主要用于大数据处理和分布式存储。Hadoop 2.7.3是这个框架的一个稳定版本，它包含了多个改进和优化，以提高性能和稳定性。在这个版本中，Winutils.exe和hadoop.dll是两...

hadoop插件apache-hadoop-3.1.0-winutils-master.zip: Apache Hadoop是一个开源框架，主要用于分布式存储和计算大数据集。Hadoop 3.1.0是这个框架的一个重要版本，提供了许多性能优化和新特性。在Windows环境下安装和使用Hadoop通常比在Linux上更为复杂，因为Hadoop最初...

hadoop2.7.x_winutils_exe&&hadoop_dll: 在IT行业中，Hadoop是一个广泛使用的开源框架，主要用于大数据处理和分布式存储。标题"hadop2.7.x_winutils_exe&&hadoop_dll"暗示我们关注的是Hadoop 2.7.x版本在Windows环境下的两个关键组件：`winutils.exe`和`...

hadoop-2.7.7 linux安装包: 此文件为hadoop-2.7.7.tar.gz，可在linux下直接进行安装，如在windows上安装，则需要hadooponwindows-master.zip，用windows-master里的文件替换解压好后hadoop的bin和etc即可。Hadoop 2.7.7是一款开源的分布式计算...

hadoop2.7.3的hadoop.dll和winutils.exe: 在IT行业中，Hadoop是一个广泛使用的开源框架，主要用于大数据处理和分布式存储。Hadoop 2.7.3是Hadoop发展中的一个重要版本，它包含了众多的优化和改进，旨在提高性能、稳定性和易用性。在这个版本中，`hadoop.dll`...

win环境 hadoop 3.1.0安装包: 在Windows环境下安装Hadoop 3.1.0是学习和使用大数据处理技术的重要步骤。Hadoop是一个开源框架，主要用于分布式存储和处理大规模数据集。在这个过程中，我们将详细讲解Hadoop 3.1.0在Windows上的安装过程以及相关...

hadoop2.7.7对应的hadoop.dll，winutils.exe: 在Hadoop生态系统中，Hadoop 2.7.7是一个重要的版本，它为大数据处理提供了稳定性和性能优化。Hadoop通常被用作Linux环境下的分布式计算框架，但有时开发者或学习者在Windows环境下也需要进行Hadoop相关的开发和测试...

hadoop2.6 hadoop.dll+winutils.exe: 标题 "hadoop2.6 hadoop.dll+winutils.exe" 提到的是Hadoop 2.6版本中的两个关键组件：`hadoop.dll` 和 `winutils.exe`，这两个组件对于在Windows环境中配置和运行Hadoop至关重要。Hadoop原本是为Linux环境设计的，...

hadoop的hadoop.dll和winutils.exe下载: 在Hadoop生态系统中，`hadoop.dll`和`winutils.exe`是两个关键组件，尤其对于Windows用户来说，它们在本地开发和运行Hadoop相关应用时必不可少。`hadoop.dll`是一个动态链接库文件，主要用于在Windows环境中提供...

hadoop.dll & winutils.exe For hadoop-2.7.1: 在大数据处理领域，Hadoop是一个不可或缺的开源框架，它提供了分布式存储和计算的能力。本文将详细探讨与"Hadoop.dll"和"winutils.exe"相关的知识点，以及它们在Hadoop-2.7.1版本中的作用。 Hadoop.dll是Hadoop在...

hadoop2.6.0插件+64位winutils+hadoop.dll: 在IT行业中，Hadoop是一个广泛使用的开源框架，主要用于大数据处理和分布式存储。Hadoop2.6.0是这个框架的一个重要版本，它包含了多项优化和改进，以提高系统的稳定性和性能。在这个压缩包中，我们关注的是与Windows...

winutils+hadoop.dll+eclipse插件（hadoop2.7）: 在Hadoop生态系统中，`winutils.exe`和`hadoop.dll`是Windows环境下运行Hadoop必备的组件，尤其对于开发和测试环境来说至关重要。这里我们深入探讨这两个组件以及与Eclipse插件的相关性。首先，`winutils.exe`是...

Global site tag (gtag.js) - Google Analytics