本人新浪微博:http://weibo.com/guoyunwb
前几天Apache Pig 0.10.1刚发布,今天就发现apache Hive 0.10.0也已经发布了,此次升级主要解决了JIRA上面350多个问题.这里列出主要的改进:
1.支持创建Cube和Rollup
2.优化更好的处理skew
3.在Windows上运行Hive,无需依赖cygwin
4.类似sql的explain功能
5.之前在client端验证授权,现在可以可选的且通过安全模板去验证
6.简单的查询速度将更快
7.更好的支持YARN
8.联合查询的优化
9.支持恢复删除后的表
10.支持类似mysql的show tables功能
11.支持Arvo格式的数据
12.join的改进(一方数据很多,一方数据很少)
13.connection更可靠(元数据间client和server的connection以及元数据server和DB之间的连接)
14.提供更多的统计信息
15.HWI界面的美观
具体请查看更新日志:https://issues.apache.org/jira/secure/ReleaseNote.jspa?version=12320745&styleName=Text&projectId=12310843
更多技术文章、感悟、分享、勾搭,请用微信扫描:
相关推荐
hive0.10.0和hbase0.94.4集成的hive-hbase-handler.Jar包,经测试没有问题。
Apache Hive(apache-hive-3.1.3-bin.tar.gz、apache-hive-3.1.3-src.tar.gz)是一种分布式容错数据仓库系统,支持大规模分析,并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache...
Apache Hive(apache-hive-1.2.2-bin.tar.gz、apache-hive-1.2.2-src.tar.gz)是一种分布式容错数据仓库系统,支持大规模分析,并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache...
Apache Hive Essentials,2015,第一版,Packt Publishing
apache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tarapache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tarapache-hive-2.1.1-bin.tar apache-hive-2.1.1-...
Hive-0.10.0-cdh4.2.1是Cloudera Distribution Including Apache Hadoop(CDH)的一个版本,专为CDH4.2.1定制,提供了对Hadoop生态系统的增强和优化。 1. **Hive架构**:Hive主要由四部分组成:客户端、元数据存储...
Apache Hive 是一个基于Hadoop的数据仓库工具,它允许用户使用SQL-like语言(称为HQL,Hive Query Language)来查询、管理和处理大数据集。在大数据领域,Hive扮演着重要的角色,因为它为非结构化和半结构化数据提供...
在Hive 0.10.0版本中,用户可能会遇到一个常见的问题,那就是在使用`desc table`命令查看表的元数据时,中文注释无法正常显示,而是以乱码或者问号的形式呈现。这给使用中文文档注释的开发者带来了不便,因为无法...
Apache Hive事务操作设计及未来发展 Apache Hive是一款基于Hadoop的数据仓库工具,支持对大规模数据的存储、查询和分析。随着大数据时代的到来,Apache Hive的事务操作设计变得越来越重要。本文将对Apache Hive的...
在"apache-hive-2.1.0-bin.tar.zip"这个压缩包中,我们找到了 Apache Hive 2.1.0 版本的二进制发布版。 在了解 Hive 的具体功能和特点之前,先来看看这个版本的组成部分。"apache-hive-2.1.0-bin"通常包含以下几...
hive-jdbc-0.10.0-cdh4.7.0 JAVA用于连接hive的jdbc
《Apache Hive Essentials》是Packt Publishing在2015年发布的一本专著,全面介绍了Apache Hive这一大数据处理的重要工具。Hive是由Facebook开源的,主要用于处理和存储大规模的结构化数据,它提供了SQL(HQL)接口...
Apache Hive 是一个基于Hadoop的数据仓库工具,它允许用户通过SQL-like语言(称为HQL,Hive Query Language)对大规模数据集进行分析和查询。在Hadoop生态系统中,Hive扮演着数据仓库和数据分析的重要角色,尤其适用...
Apache Hive 是一个基于 Hadoop 的数据仓库工具,用于组织、查询和分析大量数据。它提供了一个SQL-like(HQL,Hive SQL)接口,使得非专业程序员也能方便地处理存储在Hadoop分布式文件系统(HDFS)中的大规模数据集...
Apache Hive(hive-storage-2.8.1.tar.gz、hive-storage-2.7.3.tar.gz)是一种分布式容错数据仓库系统,支持大规模分析,并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache ...
Apache Hive 是一个基于 Hadoop 的数据仓库工具,用于查询、管理和处理存储在 Hadoop 分布式文件系统(HDFS)中的大规模数据集。Hive 提供了一种结构化的数据模型和SQL-like 查询语言(HQL,Hive SQL),使得非...
Hive-0.10.0是Hive的一个早期版本,尽管较新版本可能包含更多改进和功能,但在2013年发布时,它已经为大数据处理提供了稳定的基础。 标题"hive-0.10.0-bin.tar.gz"表明这是一个包含Hive 0.10.0二进制文件的归档包,...
标题中的“hive-0.10.0-cdh4.3.0.tar.gz”是一个针对Hive的软件发行版本,具体来说是Hive 0.10.0集成在Cloudera Distribution Including Apache Hadoop(CDH)4.3.0版本的压缩包。Hive是Apache Software Foundation...
Apache Hive 是一个基于Hadoop的数据仓库工具,它允许通过SQL-like查询语言(称为HQL)对大规模数据集进行分析和管理。Hive是Apache软件基金会的一部分,为大数据处理提供了便捷的接口,使得非Hadoop专家也能操作...