本月博客排行
-
第1名
wy_19921005 -
第2名
benladeng5225 -
第3名
duanfei - Anmin
- wddpwzzhao123
- steven789654
年度博客排行
-
第1名
龙儿筝 -
第2名
宏天软件 -
第3名
wy_19921005 - benladeng5225
- kaizi1992
- tanling8334
- vipbooks
- sam123456gz
- arpenker
- zysnba
- fantaxy025025
- xiangjie88
- wallimn
- e_e
- jh108020
- ganxueyun
- Xeden
- xyuma
- wangchen.ily
- zhanjia
- johnsmith9th
- zxq_2017
- forestqqqq
- jbosscn
- daizj
- xpenxpen
- 喧嚣求静
- kingwell.leng
- lchb139128
- kristy_yy
- javashop
- lzyfn123
- sunj
- yeluowuhen
- ajinn
- lerf
- lemonhandsome
- chenqisdfx
- xiaoxinye
- lyndon.lin
- flashsing123
- bosschen
- zhangjijun
- sunnylocus
- 青否云后端云
- lyj86
- paulwong
- sgqt
- hudiemeng870329
- mft8899
最新文章列表
Apache Pig的前世今生
最近,散仙用了几周的Pig来处理分析我们网站搜索的日志数据,感觉用起来很不错,今天就写篇笔记介绍下Pig的由来,除了搞大数据的人,可能很少有人知道Pig是干啥的,包括一些是搞编程的,但不是搞大数据的,还包括一些既不是搞编程的,也不是搞大数据的,而是从事其他行业的朋友,所以很有可能望文生义,一看标题,就乐了,心里就开始默默的翻译了===》 Apache 猪的笔记,看起来Apache的猪,比较厉害啊,都 ...
Apache Pig如何自定义UDF函数?
近日由于工作所需,需要使用到Pig来分析线上的搜索日志数据,散仙本打算使用hive来分析的,但由于种种原因,没有用成,而Pig(pig0.12-cdh)散仙一直没有接触过,所以只能临阵磨枪了,花了两天时间,大致看完了pig官网的文档,在看文档期间,也是边实战边学习,这样以来,对pig的学习,会更加容易,当然本篇不是介绍如何快速学好一门框架或语言的文章,正如标题所示,散仙打算介绍下如何在Pig中,使用 ...
pig处理json格式数据,取top100
在如下数据类型中
文件A:这里面是sequenceFile格式文件,key是long型时间戳,value是一个Text类型字符串(是JSON格式)
{"app":"bshare","data":{"ip":"1032096474","keyword":"%E6%9D% ...
pig:group by之后的其它统计方法一
pig:group by之后的其它统计方法一
复制代码
1 --测试Top N后的其它统计
2 A = LOAD '/TraceParser/blackcore/' USING PigStorage() as (lk_id:chararray,host:chararray);
3 --DUMP A;
4
5 B = GROUP A BY lk_id;
6 B = FOREACH B ...
Pig – 大数据分析平台
wget http://mirror.bit.edu.cn/apache/pig/pig-0.11.1/pig-0.11.1.tar.gz
tar -xzvf pig-0.11.1.tar.gz
sudo vi /etc/profile
增加:
export PIG_HOME=/home/ysc/pig-0.11.1
exportPATH=$PATH:$PIG_HO ...
大数据潮流已经来临 ---- ITSoku带你一周快速掌握Hadoop开发与实战!
大数据的潮流已经来临,未来也将是数据的时代,Hadoop正是为大数据而来,为此ITSoku搜集了目前最好的相关视频,然后进行整理出能让我们在最短的时间中掌握该技术的整套视频专辑,分享给各位想学习Hadoop的朋友们,只希望大家学习Hadoop更容易更高效一些。
1. 炼数成金 hadoop 视频教程 (此专辑更注重于理论)
2.Hadoop实战视频专辑 (此专辑更注重于实战)
以 ...
pig自定义输出文件名,重写StoreFunc
需要实现四个方法:
getOutputFormat()
prepareToWrite(RecordWriter writer)
putNext(Tuple tuple)
setStoreLocation(String location, Job job)
setStoreLocation(String location, Job job)
设置 ...
大数据系列5:Pig – 大数据分析平台
wget http://mirror.bit.edu.cn/apache/pig/pig-0.11.1/pig-0.11.1.tar.gz
tar -xzvf pig-0.11.1.tar.gz
sudo vi /etc/profile
增加:
export PIG_HOME=/home/ysc/pig-0.11.1
exportPATH=$PATH:$PIG_HOME/bin
so ...