`
phz50
  • 浏览: 106486 次
  • 性别: Icon_minigender_1
社区版块
存档分类
最新评论
文章列表
接上一篇文章:Hadoop学习全程记录——hive入门 hive是Facebook的产品,最早研发它的目的是用它来对Facebook网站每天产生的海量日志进行分析。有时我们需要分析的数据可能存在数据库中,这时我们可以利用sqoop将mysql中数据导入到hive中。 操作系统:在windows下使用wubi安装了ubuntu 10.10 hadoop版本:hadoop-0.20.2.tar.gz zookeeper版本:zookeeper-3.3.3.tar.gz hive版本:hive-0.6.0 .tar.gz sqoop版本:sqoop-1.2.0-CDH3B4.tar.gz 其 ...
hive是Facebook的产品,很不错。 官方文档:http://wiki.apache.org/hadoop/Hive/GettingStarted有很详细说明。 基本上根据文档能对hive快速入门。在使用过程中可能会出现以下问题: 当执行下面命令时: $ $HIVE_HOME/bin/hive 可能会出现Invalid maximum heap size: -Xmx4096m提示。 那是因为hive默认hadoop heap size为4096m。如果出现这个提示,你需要修改hadoop heap size的大小。方法如下: 1.执行命令。 $ sudo gedit $HIVE_H ...
接上一篇文章:Hadoop学习全程记录——hadoop 入门 这是Hadoop学习全程记录第2篇,在这篇里我将介绍一下如何在Eclipse下写第一个MapReduce程序。 新说明一下我的开发环境: 操作系统:在windows下使用wubi安装了ubuntu 10.10 hadoop版本:hadoop-0.20.2.tar.gz Eclipse版本:eclipse-jee-helios-SR1-linux-gtk.tar.gz 为了学习方便这个例子在“伪分布式模式”Hadoop安装方式下开发。 第一步,我们先启动Hadoop守护进程。 如果你读过我第1篇文章Hadoop学习全程记录— ...
几天前开始学习hadoop,从今天起,想把我学习hadoop全过程记录一下。我会记录在学习过程中碰到的问题、困难以及解决方法等等,如果你也是刚学hadoop,我们可以一起讨论。 学了几天,好像入门了,在这里和大家分享,就当全程笔记的第一篇吧。 新说明一下我的开发环境 操作系统:在windows下使用wubi安装了ubuntu 10.10 hadoop版本:hadoop-0.20 Hadoop 快速入门文档:http://hadoop.apache.org/common/docs/r0.18.2/cn/quickstart.html 上面这个地址是最新hadoop快速入门,基本上按照里面 ...
Global site tag (gtag.js) - Google Analytics