本人新浪微博:http://weibo.com/guoyunwb
前几天Apache Pig 0.10.1刚发布,今天就发现apache Hive 0.10.0也已经发布了,此次升级主要解决了JIRA上面350多个问题.这里列出主要的改进:
1.支持创建Cube和Rollup
2.优化更好的处理skew
3.在Windows上运行Hive,无需依赖cygwin
4.类似sql的explain功能
5.之前在client端验证授权,现在可以可选的且通过安全模板去验证
6.简单的查询速度将更快
7.更好的支持YARN
8.联合查询的优化
9.支持恢复删除后的表
10.支持类似mysql的show tables功能
11.支持Arvo格式的数据
12.join的改进(一方数据很多,一方数据很少)
13.connection更可靠(元数据间client和server的connection以及元数据server和DB之间的连接)
14.提供更多的统计信息
15.HWI界面的美观
具体请查看更新日志:https://issues.apache.org/jira/secure/ReleaseNote.jspa?version=12320745&styleName=Text&projectId=12310843
更多技术文章、感悟、分享、勾搭,请用微信扫描:
相关推荐
Hive-0.10.0-cdh4.2.1是Cloudera Distribution Including Apache Hadoop(CDH)的一个版本,专为CDH4.2.1定制,提供了对Hadoop生态系统的增强和优化。 1. **Hive架构**:Hive主要由四部分组成:客户端、元数据存储...
Hive-0.10.0是Hive的一个早期版本,尽管较新版本可能包含更多改进和功能,但在2013年发布时,它已经为大数据处理提供了稳定的基础。 标题"hive-0.10.0-bin.tar.gz"表明这是一个包含Hive 0.10.0二进制文件的归档包,...
标题中的“hive-0.10.0-cdh4.3.0.tar.gz”是一个针对Hive的软件发行版本,具体来说是Hive 0.10.0集成在Cloudera Distribution Including Apache Hadoop(CDH)4.3.0版本的压缩包。Hive是Apache Software Foundation...
Hive是Apache软件基金会开发的一个数据仓库工具,它允许用户使用SQL-like查询语言(HQL)来处理存储在Hadoop分布式文件系统(HDFS)上的大数据集。Hive-0.10.0是该软件的一个早期版本,尽管较新版本可能包含更多改进...
Hive是Apache软件基金会开发的一个数据仓库工具,它允许用户使用SQL-like的语言(HQL,Hive Query Language)对大规模存储在Hadoop分布式文件系统(HDFS)中的数据进行查询、分析和处理。Hive-0.11.0是Hive的一个...
最后,我们可以创建新的笔记,导入数据,使用支持的解释器(如Spark SQL、Pig、Hive等)执行查询和分析。Zeppelin的集成特性使得它能够与其他大数据组件如Hadoop、Kafka、HBase等协同工作,提供一个完整的数据处理和...
##### 3.6 hive-0.10.0-cdh4.2.0(适用于 Impala)的安装配置 - **环境兼容性**:确认与 Impala 的版本兼容性。 - **下载与解压**:下载 hive-0.10.0-cdh4.2.0 并解压。 - **配置**:根据 CDH4.2.0 文档调整配置文件...
验证HIVE表中数据的工具。 用法 组装脂肪罐: sbt clean assembly spark-submit --master local data-validator-assembly-0.10.0.jar --help data-validator v0.10.0 Usage: data-validator [options] --version ...