- 浏览: 106486 次
- 性别:
最新评论
-
小强HelloWorld:
郭太苹 写道你好,请教一个问题,伪分布式模式下执行 bin/h ...
Hadoop学习全程记录——hadoop 入门 -
lumia:
现在弄好了,我是先运行了一个WordCount例子后,然后再在 ...
Hadoop学习全程记录——在Eclipse中运行第一个MapReduce程序 -
lumia:
博主,为什么我做完“第二步”,最后打开DFS Location ...
Hadoop学习全程记录——在Eclipse中运行第一个MapReduce程序 -
ytlviv:
比如说运行 类似这样的bin/hadoop jar MyJob ...
Hadoop学习全程记录——在Eclipse中运行第一个MapReduce程序 -
jinpeng4731:
在eclipse中运行wordcount为啥不能通过http: ...
Hadoop学习全程记录——在Eclipse中运行第一个MapReduce程序
文章列表
接上一篇文章:Hadoop学习全程记录——hive入门
hive是Facebook的产品,最早研发它的目的是用它来对Facebook网站每天产生的海量日志进行分析。有时我们需要分析的数据可能存在数据库中,这时我们可以利用sqoop将mysql中数据导入到hive中。
操作系统:在windows下使用wubi安装了ubuntu 10.10
hadoop版本:hadoop-0.20.2.tar.gz
zookeeper版本:zookeeper-3.3.3.tar.gz
hive版本:hive-0.6.0 .tar.gz
sqoop版本:sqoop-1.2.0-CDH3B4.tar.gz
其 ...
hive是Facebook的产品,很不错。
官方文档:http://wiki.apache.org/hadoop/Hive/GettingStarted有很详细说明。
基本上根据文档能对hive快速入门。在使用过程中可能会出现以下问题:
当执行下面命令时:
$ $HIVE_HOME/bin/hive
可能会出现Invalid maximum heap size: -Xmx4096m提示。
那是因为hive默认hadoop heap size为4096m。如果出现这个提示,你需要修改hadoop heap size的大小。方法如下:
1.执行命令。
$ sudo gedit $HIVE_H ...
接上一篇文章:Hadoop学习全程记录——hadoop 入门
这是Hadoop学习全程记录第2篇,在这篇里我将介绍一下如何在Eclipse下写第一个MapReduce程序。
新说明一下我的开发环境:
操作系统:在windows下使用wubi安装了ubuntu 10.10
hadoop版本:hadoop-0.20.2.tar.gz
Eclipse版本:eclipse-jee-helios-SR1-linux-gtk.tar.gz
为了学习方便这个例子在“伪分布式模式”Hadoop安装方式下开发。
第一步,我们先启动Hadoop守护进程。
如果你读过我第1篇文章Hadoop学习全程记录— ...
几天前开始学习hadoop,从今天起,想把我学习hadoop全过程记录一下。我会记录在学习过程中碰到的问题、困难以及解决方法等等,如果你也是刚学hadoop,我们可以一起讨论。
学了几天,好像入门了,在这里和大家分享,就当全程笔记的第一篇吧。
新说明一下我的开发环境
操作系统:在windows下使用wubi安装了ubuntu 10.10
hadoop版本:hadoop-0.20
Hadoop 快速入门文档:http://hadoop.apache.org/common/docs/r0.18.2/cn/quickstart.html
上面这个地址是最新hadoop快速入门,基本上按照里面 ...