目前Hive 0.11 版本已经发本,本文旨在分析0.11的新特性。
Bug 修复:(我个人遇到很多)
Hive 0.11版修复了hive本身存在的数10处bug,重点包括:
[HIVE-2264] - Hive server is SHUTTING DOWN when invalid queries beeing executed
[HIVE-2332] - If all of the parameters of distinct functions are exists in group by columns, query fails in runtime
[HIVE-3197] - Hive compile errors under Java 7 (JDBC 4.1)
[HIVE-3308] - Mixing avro and snappy gives null values
[HIVE-3648] - HiveMetaStoreFsImpl is not compatible with hadoop viewfs
从中可以发现hive 与 jdk 1.7还是有很多的问题有待解决,所以目前还是不要尝试为好。
同时有很多新的特性,比如nvl 函数等,我们在实际应用中可以使用
[HIVE-446] - Implement TRUNCATE
[HIVE-2935] - Implement HiveServer2
[HIVE-3825] - Add Operator level Hooks
[HIVE-3682] - when output hive table to file,users should could have a separator of their own choice
[HIVE-3682] - when output hive table to file,users should could have a separator of their own choice
[HIVE-2693] - Add DECIMAL data type
[HIVE-2288] - Adding the oracle nvl function to the UDF
[HIVE-3552] - HIVE-3552 performant manner for performing cubes/rollups/grouping sets for a high number of grouping set keys
相关推荐
自己翻译的 hive 0.11 官方教程。 自己阅读,能找到大部分学习内容
Apache Hive(apache-hive-3.1.3-bin.tar.gz、apache-hive-3.1.3-src.tar.gz)是一种分布式容错数据仓库系统,支持大规模分析,并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache...
Apache Hive(apache-hive-1.2.2-bin.tar.gz、apache-hive-1.2.2-src.tar.gz)是一种分布式容错数据仓库系统,支持大规模分析,并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache...
Apache Hive Essentials,2015,第一版,Packt Publishing
apache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tarapache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tar apache-hive-2.1.1-bin.tarapache-hive-2.1.1-bin.tar apache-hive-2.1.1-...
Apache Hive 是一个基于Hadoop的数据仓库工具,它允许用户通过SQL-like语言(称为HQL,Hive Query Language)对大规模数据集进行分析和查询。在0.14.0版本中,Hive提供了多种增强的功能和性能优化,使得大数据处理变...
Apache Hive 3.1.2是该软件的一个稳定版本,它包含了一系列优化和改进,以提高性能和用户体验。 Hive的核心功能包括元数据管理、查询解析、优化以及将SQL查询转换为MapReduce或Tez任务的能力。元数据描述了数据的...
Apache Hive 是一个基于 Hadoop 的数据仓库工具,用于组织、查询和分析大量数据。它提供了一个SQL-like(HQL,Hive SQL)接口,使得非专业程序员也能方便地处理存储在Hadoop分布式文件系统(HDFS)中的大规模数据集...
在"apache-hive-2.1.0-bin.tar.zip"这个压缩包中,我们找到了 Apache Hive 2.1.0 版本的二进制发布版。 在了解 Hive 的具体功能和特点之前,先来看看这个版本的组成部分。"apache-hive-2.1.0-bin"通常包含以下几...
Apache Hive 是一个基于Hadoop的数据仓库工具,它允许用户通过SQL-like语言(称为HQL,Hive Query Language)对大规模数据集进行分析和查询。在Hadoop生态系统中,Hive扮演着数据仓库和数据分析的重要角色,尤其适用...
`apache-hive-1.2.2-bin.tar.gz` 是 Apache Hive 的预编译版本,适用于 CentOS 系统。这个压缩包包含了运行 Hive 所需的所有组件和库,用户可以直接解压并安装,而无需自己编译源代码。 在使用这个压缩包之前,确保...
"apache-hive-3.1.3-bin.tar.gz" 是 Apache Hive 3.1.3 版本的二进制发行版,包含所有必要的文件和组件,让用户能够在本地或集群环境中安装和运行 Hive。 在这个压缩包中,`apache-hive-3.1.3-bin` 文件夹包含了...
Apache Hive是一款基于Hadoop的数据仓库工具,支持对大规模数据的存储、查询和分析。随着大数据时代的到来,Apache Hive的事务操作设计变得越来越重要。本文将对Apache Hive的事务操作设计进行详细的介绍,并探讨其...
Apache Hive 是一个基于Hadoop的数据仓库工具,它允许用户通过SQL-like的语言(称为HQL,Hive Query Language)对大规模数据集进行分析和查询。在Linux环境下安装Apache Hive 2.3.9版本,需要遵循一定的步骤,涉及到...
总的来说,《Apache Hive Essentials》这本书将深入探讨如何使用Hive进行大数据分析,包括创建和管理表,编写复杂的查询,优化查询性能,以及与Hadoop生态系统的集成。对于想要掌握Hive的初学者和数据分析师来说,是...
10. **Hive on Spark**:虽然在2.1.0版本中,Hive默认还是使用MapReduce作为计算引擎,但该版本已经支持使用Apache Spark进行更高效的计算,尤其是在交互式查询和实时分析场景下。 下载并解压`apache-hive-2.1.0-...
Apache Hive 是一个基于Hadoop的数据仓库工具,它允许用户通过SQL-like语言(称为HQL,Hive Query Language)对大规模数据集进行分析和查询。在标题"apache-hive-1.2.1"中,我们可以推测这是一个关于Apache Hive ...
在这个"apache-hive-2.3.0-bin.tar.gz"压缩包中,包含了Apache Hive 2.3.0版本的所有二进制文件,用于在Linux系统上部署和运行。 **Hive的主要组件和功能:** 1. **元数据存储**:Hive将元数据(如表结构、分区...
Apache Hive(hive-storage-2.8.1.tar.gz、hive-storage-2.7.3.tar.gz)是一种分布式容错数据仓库系统,支持大规模分析,并使用 SQL 促进读取、写入和管理驻留在分布式存储中的 PB 级数据。Hive 构建在 Apache ...