本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
zysnba - xiangjie88
- sgqt
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wallimn
- wy_19921005
- vipbooks
- benladeng5225
- 龙儿筝
- javashop
- ranbuijj
- fantaxy025025
- zw7534313
- qepwqnp
- e_e
- 解宜然
- zysnba
- ssydxa219
- sam123456gz
- sichunli_030
- arpenker
- tanling8334
- kaizi1992
- xpenxpen
- gaojingsong
- jh108020
- wiseboyloves
- xiangjie88
- ganxueyun
- xyuma
- wangchen.ily
- lemonhandsome
- jbosscn
- mengjichen
- zxq_2017
- luxurioust
- lzyfn123
- forestqqqq
- nychen2000
- Xeden
- zhanjia
- wjianwei666
- ajinn
- hanbaohong
- 喧嚣求静
- jickcai
- kingwell.leng
- mwhgJava
- silverend
- lich0079
- lchb139128
最新文章列表
大数据系列5:Pig – 大数据分析平台
wget http://mirror.bit.edu.cn/apache/pig/pig-0.11.1/pig-0.11.1.tar.gz
tar -xzvf pig-0.11.1.tar.gz
sudo vi /etc/profile
增加:
export PIG_HOME=/home/ysc/pig-0.11.1
exportPATH=$PATH:$PIG_HOME/bin
so ...
NUTCH公开课:从搜索引擎到网络爬虫
Hadoop是大数据的核心技术之一,而Nutch集Hadoop之大成,是Hadoop的源头。学习Hadoop,没有数据怎么办?用Nutch抓!学了Hadoop的Map Reduce以及HDFS,没有实用案例怎么办?学习Nutch!Nutch的很多代码是用Map Reduce和HDFS写的,哪里还能找到比Nutch更好的Hadoop应用案例呢?
大数据这个术语最早的引用可追溯到Nutch。 ...
hadoop pig vertica
hadoop pig vertica是hadoop pig udf loader and storer的DB版,在github上开源,感谢感谢
本文就不贴代码了,附件里有源码,想了解的可以下载
先贴一张vertica的目录
其中verticaLoader,verticaStorer是vertica给出的接口类,是hadoop pig的loader和storer的UDF
...
hadoop pig入门总结
在这里贴一个pig源码的分析,做pig很长时间没做笔记,不包含任何细节,以后有机会再说吧
http://blackproof.iteye.com/blog/1769219
hadoop pig入门总结
pig简介
pig数据类型
pig latin语法
pig udf自定义
pig derived衍生
推荐书籍 programming pig
推荐网站 http: ...
Pig 调优实践经验总结(转载)
Pig 调优实践经验总结
张贵宾
guibin.beijing@gmail.com
2012-01-17
本文会不断更新,欢迎大家补充。
1. pig.maxCombinedSplitSize 和 pig.splitCombination
在实际使用PIG处理数据时,会经常要处理大批量的小文件。在这种情况下,如果不对Pig脚本进行任何特别设置,默认情况下很有可能会遇到类似这样 ...
pig的一些基本函数的应用
1.
加载数据:
records
=load './Desktop/data.txt' using PigStorage as
(year:int,temperature:int, quality:int);
2.
查看数据:
dump
records;
3.
根据
quality
字段对
records
...
pig的UDF函数的使用
<!--
@page { margin: 0.79in }
P { margin-bottom: 0.08in }
A:link { so-language: zxx }
-->
在
pig
中使用
UDF
函数:
1
,编写
UDF
函数:
imp ...
Pig UDF(LOAD)示例代码分析
参考文档: Hadoop:The Definitive Guide3E Chapter11.Pig
代码具体地址: tomwhite-hadoop-book-32dae01\ch11\src\main\java\com\hadoopbook\pig
工具类
public class Range {
private final ...