- 浏览: 5747 次
- 性别:
- 来自: 北京
文章列表
今天浏览Cloudera的官博,发现了一篇介绍《Kudu: New Apache Hadoop Storage for Fast Analytics on Fast Data》的文章,摘记如下:
1. 什么是Kudu
This new open source complement to HDFS and Apache HBase is designed to fill gaps in Hadoop’s storage layer that have given rise to stitched-together, hybrid architectures.
可以看出这个新组件有两 ...
impala参考资料
- 博客分类:
- 转载
记录一些有用的Impala资料
1. 入门资料
>>官网翻译:
http://my.oschina.net/weiqingbin/blog?catalog=423691
2. 实用进阶
>>代码&架构分析:
Impala/Hive现状分析与前景展望:http://yanbohappy.sinaapp.com/?p=220
Impala架构和RPC:http://yanbohappy.sinaapp.com/?p=314
SQL解析与执行计划生成:http://yanbohappy.sinaapp.co ...
impala-2.1.2-CDH5.3.2
- 博客分类:
- impala
最近在整理impala编译的东西,简单记录几个要点:
根据官网的信息(https://github.com/cloudera/Impala/wiki/How-to-build-Impala):
1. 首次编译impala,推荐使用命令:
${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format
2.仅编译BE
${IMPALA_HOME}/bin/make_debug.sh [-notests] -build_shared_libs
编译后的文件在 be/bulid里面,编译出来的东西有200MB+,和官方的比 ...
1. 为什么学习SQL自人类社会形成之日起,社会的运转就在不断地产生和使用各种信息(文献、档案、资料、数据等);在如今所谓的信息时代,由于计算机和互联网的作用,信息的产生和使用达到前所未有的广度和深度。如何 ...
SQL在执行过程中的优化途径,主要包括如下几个:
谓词下推(前推);
调整执行顺序:大小表Join;
合并:多个Limit合并;
表达式提前计算;
分区裁剪;