本月博客排行
年度博客排行
-
第1名
宏天软件 -
第2名
青否云后端云 -
第3名
龙儿筝 - gashero
- wallimn
- vipbooks
- benladeng5225
- wy_19921005
- fantaxy025025
- e_e
- zysnba
- ssydxa219
- sam123456gz
- javashop
- arpenker
- tanling8334
- kaizi1992
- xpenxpen
- wiseboyloves
- xiangjie88
- ranbuijj
- ganxueyun
- sichunli_030
- xyuma
- wangchen.ily
- jh108020
- lemonhandsome
- zxq_2017
- jbosscn
- Xeden
- luxurioust
- zhanjia
- lzyfn123
- forestqqqq
- ajinn
- nychen2000
- wjianwei666
- hanbaohong
- daizj
- 喧嚣求静
- mwhgJava
- silverend
- kingwell.leng
- lchb139128
- lich0079
- kristy_yy
- johnsmith9th
- jveqi
- java-007
- sunj
最新文章列表
hive函数
用pig的时候,超不爱用pig带的函数,一般都自己写
但是用hive,就越来越懒,变成了能不写就不写自己的udf,哈哈
https://cwiki.apache.org/confluence/display/ ...
hive gateway(client) configuration
配置hive gateway机器
Caused by: MetaException(message:Could not connect to meta store using any of the URIs provided. Most recent failure: org.apache.thrift.transport.TTransportException: GSS initiate fail ...
HiveServer2 JDBC GUI客户端
做了这么多年JAVA没有做过一个开源软件,最近一直在做hadoop的东西,也在使用hive发现,现在市面上没有见到关于hive server2 gui 的客户端,由于自己使用较多所以自己就写了一个,方便自己,现在开源出来也方便一下其他人吧。下载地址:https://github.com/tinycalf/HiveTools
如果你也正需要就下载试用一下吧。
如果您觉得在使用过程中遇到了一些问题 ...
一套数据,多种引擎续---两种数据格式(Parquet/ORCfile)浅析
最近主要在研究大数典型应用adhoc query,要实现秒级的adhoc query,通常有3种思路:
1、用搜索技术,将查询都建立索引,然后用搜索技术来实现。这种技术目前主要限制是索引建立和存储成本高,索引建立不及时,例如支付宝的higo。
2、实时计算,对不能指定维度的查询,理论上认为是实时计算,每个列上建立函数索引,这种典型的代表是mesa。关于mesa,前面我有篇简单的介绍性文章《
hive join
hive(0.9.0):1.支持equality joins, outer joins, and left semi joins2.只支持等值条件3.支持多表join原理hive执行引擎会将HQL“翻译”成为map-reduce任务,如果多张表使用同一列做join则将被翻译成一个reduce,否则将被翻译成多个map-reduce任务。eg:SELECT a.val, b.val, c.val F ...
Hive并行排序
set hive.optimize.sampling.orderby=true;set hive.optimize.sampling.orderby.number=10000;set hive.optimize.sampling.orderby.percent=0.1f;
记录一下,Hive中并行排序参数;
hive.optimize.sampling.orderby ...