目前Hive 0.11 版本已经发本,本文旨在分析0.11的新特性。
Bug 修复:(我个人遇到很多)
Hive 0.11版修复了hive本身存在的数10处bug,重点包括:
[HIVE-2264] - Hive server is SHUTTING DOWN when invalid queries beeing executed
[HIVE-2332] - If all of the parameters of distinct functions are exists in group by columns, query fails in runtime
[HIVE-3197] - Hive compile errors under Java 7 (JDBC 4.1)
[HIVE-3308] - Mixing avro and snappy gives null values
[HIVE-3648] - HiveMetaStoreFsImpl is not compatible with hadoop viewfs
从中可以发现hive 与 jdk 1.7还是有很多的问题有待解决,所以目前还是不要尝试为好。
同时有很多新的特性,比如nvl 函数等,我们在实际应用中可以使用
[HIVE-446] - Implement TRUNCATE
[HIVE-2935] - Implement HiveServer2
[HIVE-3825] - Add Operator level Hooks
[HIVE-3682] - when output hive table to file,users should could have a separator of their own choice
[HIVE-3682] - when output hive table to file,users should could have a separator of their own choice
[HIVE-2693] - Add DECIMAL data type
[HIVE-2288] - Adding the oracle nvl function to the UDF
[HIVE-3552] - HIVE-3552 performant manner for performing cubes/rollups/grouping sets for a high number of grouping set keys
相关推荐
Shark 是一个大型的数据仓库系统为 Spark 的设计与 Apache Hive 兼容。它处理 Hive QL 的性能比 Apache Hive 快 30 倍。支持 Hive 查询语言、元存储、序列化... AMPLab's Hive 0.11 Spark 0.9.x 标签:Shark
JDBC API v3.x支持JRE v4.0或v5.0 JDBC API v4.x支持JRE v6.0或更高版本JDBC API v4.1.x支持JRE v7.0或更高版本适用于Apache Hive的Cloudera JDBC驱动程序支持Hive 0.11、0.12、0.13、0.14、1.0和1.1。 有关更多...
执行`$HIVE_HOME/bin/hive --service hiveserver2`命令会启动Hive Server 2,并调用`org.apache.hive.service.server.HiveServer2`的`main`方法。启动时,Hive Server 2会在日志中输出相关信息,包括主机名、版本、...
但是C ++库仅写入ORC文件的原始(Hive 0.11)版本,并且将来会进行扩展。 发布: 最新: Maven Central: 下载: 当前的构建状态: 主分支 错误跟踪: 子目录是: C ++-C ++读写器 cmake_modules-cmake模块 ...
- **Apache框架**:选择了Hadoop 2.7.2、Flume 1.7.0、Kafka 0.11.0.2等稳定且功能丰富的版本,确保系统的稳定性和性能。 - **其他组件**:包括Hive 1.2.1用于大规模数据计算,Sqoop 1.4.6用于数据导入导出,MySQL...
总的来说,Apache Atlas是大数据环境中不可或缺的元数据管理工具,它为企业提供了强大的数据资产管理能力,帮助数据分析师和治理团队更好地理解、控制和利用他们的数据资产。通过学习和熟练使用Atlas,可以提高数据...
在组件版本选择上,比如选择了Hadoop 2.7.2、Flume 1.7.0、Kafka 0.11.0.2等,这些组件各具特色,如Flume支持断点续传和事务,Kafka支持多个消费者接口。 此外,还选择了如Hive 1.2.1用于大规模数据计算,Sqoop ...
- 框架版本选型:根据CDH官网的兼容性选择合适版本,如Hadoop 2.7.2、Flume 1.7.0、Kafka 0.11.0.2等。 - 技术特性:如Hive支持大规模数据计算,Spark提供内存运算,提升效率,Zookeeper用于协调服务,Hbase是...
Cloudera Manager是一款强大的管理工具,专为简化Apache Hadoop及其相关组件的部署、配置和监控而设计。在Linux环境中安装Cloudera Manager可以帮助用户更有效地管理Hadoop集群,确保高效的数据处理和分析。本文将...