`
guoyunsky
  • 浏览: 863617 次
  • 性别: Icon_minigender_1
  • 来自: 上海
博客专栏
3d3a22a0-f00f-3227-8d03-d2bbe672af75
Heritrix源码分析
浏览量:208067
Group-logo
SQL的MapReduce...
浏览量:0
社区版块
存档分类
最新评论
文章列表
本博客属原创文章,转载请注明出处:http://guoyunsky.iteye.com/blogs/1299770/  欢迎加入Hadoop超级群: 180941958        Oozie是个针对Hadoop的工作流,有些自己的语法. 这两天碰到一个异常,查看源码才明白Oozie的join只允许承接fork下来的任务,否则会报以下错误.整个异常如下:   WARN CallableQueueService$CallableWrapper:528 - USER[-] GROUP[-] TOKEN[-] APP[-] JOB[-] ACTION[-] exception calla ...
 本博客属原创文章,转载请注明出处:http://guoyunsky.iteye.com/blog/1289475   欢迎加入Hadoop超级群: 180941958               之前有篇文章http://guoyunsky.iteye.com/blog/1237327介绍解hadoop-lzo相关问题,同时也介绍到了如何安装.但发现这种安装方法会出现一些问题.       同时这种安装方法也是网上流传的安装方法,我这里予以纠正.先说下大概原因:hadoop-lzo-xxx的前身是hadoop-gpl-compression-xxx,之前是放在google code ...
本博客属原创文章,转载请注明出处:http://guoyunsky.iteye.com/blog/1266226   欢迎加入Hadoop超级群: 180941958            压缩是绕不开的话题,因为当今很多程序的压力还是在IO.特别是Hadoop这种分布式存储和运算框架,单台机器的IO,网络通信IO都是压力和挑战.关于Hadoop为什么要用Lzo来压缩而没有选用传统的压缩方法,我这里不再阐述.相关资料很多.有兴趣的可以查看cloudera这篇博客:http://www.cloudera.com/blog/2009/11/hadoop-at-twitter-part-1- ...
  本博客属原创文章,转载请注明出处:http://guoyunsky.iteye.com/blog/1265944 欢迎加入Hadoop超级群: 180941958           刚接触Hadoop时,对SequenceFile和Writable还产生了一点联想,以为是什么神奇的东西.后来也明白,不过就是自己IO的一些协议,用于自己的输入输出.这里介绍下如何从sequence file中读出和写入Writable数据.      Writable类似传输的数据,相对于Java来说等同于对象,只是引用到Hadoop中需要一套协议去进行传输转换这个对象.于是有了里面的 publ ...
本博客属原创文章,转载请注明出处:http://guoyunsky.iteye.com/blog/1257521 欢迎加入Hadoop超级群: 180941958             之前Oozie都是伪分布式测试,获取的都是本地文件.现在开始在分布式环境下测试,从HDFS中获取文件(所以你的APP也要传入到相应的HDFS路径中).我这里采用的例子是$OOZIE_HOME/examples/apps/map-reduce.其中对job.properties做如下设置:  nameNode=hdfs://localhost:9000 jobTracker=localhost:9 ...
本博客属原创文章,转载请注明出处:http://guoyunsky.iteye.com/blog/1254537 欢迎加入Hadoop超级群: 180941958             搭建起了hadoop+oozie+Sqoop,准备写个Oozie工作流,里面通过Sqoop从DB里导数据再写到HDFS.一切就绪,但却报错了.报错如下:    Error: E0701 : E0701: XML schema error, cvc-complex-type.2.4.c: The matching wildcard is strict, but no declaration can ...
  本博客属原创文章,转载请注明出处:http://guoyunsky.iteye.com/blog/1245092 欢迎加入Hadoop超级群: 180941958            Oozie下面有很多例子,提供测试.也可以将源码放入Eclipse中启动提交.这里就一起试下.但发现有些问题,一一解决吧.      运行Oozie例子map-reduce,命令:      $OOZIE_HOME/bin/oozie job -oozie http://localhost:11000/oozie -config /home/guoyun/hadoop/oozie-3.0.2 ...
  本博客属原创文章,转载请注明出处: http://guoyunsky.iteye.com/blog/1243417 欢迎加入Hadoop超级群: 180941958               cloudera里面有基于Oozie的安装,但是通过sudo apt-get install oozie的方式.其中你要将cloudera hadoop的source放入sources.list.由于我升级了最新的Ubuntu.但对应的cloudera hadoop还没有相应的版本.所以添加sources.list无法成功.网上也没什么手动安装的资料,于是我就写点吧.参考来源: ht ...
  本博客属原创文章,转载请注明出处:http://guoyunsky.iteye.com/blogs/1237327    欢迎加入Hadoop超级群: 180941958      完整异常: 11/11/07 10:15:02 ERROR lzo.GPLNativeCodeLoader: Could not load native gpl library java.lang.UnsatisfiedLinkError: no gplcompression in java.library.path at java.lang.ClassLoader.loadLibrary(Cl ...
       给Hadoop Sqoop 写的一点小代码被他们收录进Sqoop1.4,地址:https://issues.apache.org/jira/browse/SQOOP-367 ,这里发帖纪念下.也终于对开源有了个直白的认识.以前一直只知道索取,即使改源码也只是在自己机器上改下,但不知道其实可以提交给他们,被他们收录,采纳.然后给其他人使用.       这里要很感谢公司的一位老兄,这点小代码也是直接copy你的.也是你让我懂得了这些,不然不知道要到什么时候.       有时就差一个机会,我想人生最大的痛苦莫过于此.其实以前离开源很近很近,使用开源,参与邮件列表提问,回答问题 ...
      本博客属创文章,转载请注明出处:http://guoyunsky.iteye.com/blog/1235954          本博客已迁移到本人独立博客: http://www.yun5u.com/articles/hadoop-mapreduce-sql-order-by-sort-improve-fix.html        请先阅读:                  ...
   本博客属原创文章,转载请注明出处:http://guoyunsky.iteye.com/blog/1235953        请先阅读:                       1.Hadoop MapReduce 学习笔记(一) 序言和准备            2.
   本博客属原创文章,转载请注明出处:http://guoyunsky.iteye.com/blog/1235952          请先阅读:                       1.Hadoop MapReduce 学习笔记(一) 序言和准备            2.Hadoop MapReduce 学习笔记(二) 序言和准备 2                3.Hadoop MapReduce 学习笔记(八) MapReduce实现类似SQL的order by/排序                 4.Hadoop MapReduce 学习笔记(九) Map ...
   本博客属原创文章,转载请注明出处:http://guoyunsky.iteye.com/blog/1235949           请先阅读:                       1.Hadoop MapReduce 学习笔记(一) 序言和准备            2.Hadoop MapReduce 学习笔记(二) 序言和准备 2                 3.Hadoop MapReduce 学习笔记(八) MapReduce实现类似SQL的order by/排序       下一篇: Hadoop MapReduce 学习笔记(九) MapRedu ...
    本博客属原创文章,转载请注明出处:http://guoyunsky.iteye.com/blog/1235945          请先阅读:                       1.Hadoop MapReduce 学习笔记(一) 序言和准备            2.Hadoop MapReduce 学习笔记(二) 序言和准备 2       下一篇: Hadoop MapReduce 学习笔记(九) MapReduce实现类似SQL的order by/排序 正确写法       排序是很重要的一个环节,类似SQL中的SELECT ...
Global site tag (gtag.js) - Google Analytics