`

Apache Hive 0.11 版本分析

 
阅读更多

 

     目前Hive 0.11 版本已经发本,本文旨在分析0.11的新特性。

 

     Bug 修复:(我个人遇到很多)

     

       Hive 0.11版修复了hive本身存在的数10处bug,重点包括:

 

                   [HIVE-2264] - Hive server is SHUTTING DOWN when invalid queries beeing executed

              [HIVE-2332] - If all of the parameters of distinct functions are exists in group by columns, query fails in runtime

               [HIVE-3197] - Hive compile errors under Java 7 (JDBC 4.1)

               [HIVE-3308] - Mixing avro and snappy gives null values

               [HIVE-3648] - HiveMetaStoreFsImpl is not compatible with hadoop viewfs

 

       从中可以发现hive 与 jdk 1.7还是有很多的问题有待解决,所以目前还是不要尝试为好。

 

       同时有很多新的特性,比如nvl 函数等,我们在实际应用中可以使用

 

               [HIVE-446] - Implement TRUNCATE

               [HIVE-2935] - Implement HiveServer2

               [HIVE-3825] - Add Operator level Hooks

               [HIVE-3682] - when output hive table to file,users should could have a separator of their own choice

               [HIVE-3682] - when output hive table to file,users should could have a separator of their own choice

               [HIVE-2693] - Add DECIMAL data type

               [HIVE-2288] - Adding the oracle nvl function to the UDF

               [HIVE-3552] - HIVE-3552 performant manner for performing cubes/rollups/grouping sets for a high number of grouping set keys

 

                

              

1
2
分享到:
评论

相关推荐

    数据仓库系统Shark.zip

    Shark 是一个大型的数据仓库系统为 Spark 的设计与 Apache Hive 兼容。它处理 Hive QL 的性能比 Apache Hive 快 30 倍。支持 Hive 查询语言、元存储、序列化... AMPLab's Hive 0.11 Spark 0.9.x 标签:Shark

    hive2-jdbc:Hive JDBC连接示例,包括简单和kerberos身份验证方法

    JDBC API v3.x支持JRE v4.0或v5.0 JDBC API v4.x支持JRE v6.0或更高版本JDBC API v4.1.x支持JRE v7.0或更高版本适用于Apache Hive的Cloudera JDBC驱动程序支持Hive 0.11、0.12、0.13、0.14、1.0和1.1。 有关更多...

    hadoop security

    执行`$HIVE_HOME/bin/hive --service hiveserver2`命令会启动Hive Server 2,并调用`org.apache.hive.service.server.HiveServer2`的`main`方法。启动时,Hive Server 2会在日志中输出相关信息,包括主机名、版本、...

    orc:Apache ORC-用于Hadoop工作负载的最小,最快的列式存储

    但是C ++库仅写入ORC文件的原始(Hive 0.11)版本,并且将来会进行扩展。 发布: 最新: Maven Central: 下载: 当前的构建状态: 主分支 错误跟踪: 子目录是: C ++-C ++读写器 cmake_modules-cmake模块 ...

    大数据设计方案.docx

    - **Apache框架**:选择了Hadoop 2.7.2、Flume 1.7.0、Kafka 0.11.0.2等稳定且功能丰富的版本,确保系统的稳定性和性能。 - **其他组件**:包括Hive 1.2.1用于大规模数据计算,Sqoop 1.4.6用于数据导入导出,MySQL...

    尚硅谷大数据技术之Atlas元数据管理1

    总的来说,Apache Atlas是大数据环境中不可或缺的元数据管理工具,它为企业提供了强大的数据资产管理能力,帮助数据分析师和治理团队更好地理解、控制和利用他们的数据资产。通过学习和熟练使用Atlas,可以提高数据...

    自我介绍13.docx大数据项目+项目介绍+面试辅导

    在组件版本选择上,比如选择了Hadoop 2.7.2、Flume 1.7.0、Kafka 0.11.0.2等,这些组件各具特色,如Flume支持断点续传和事务,Kafka支持多个消费者接口。 此外,还选择了如Hive 1.2.1用于大规模数据计算,Sqoop ...

    如何面试2.docx 大数据项目+项目介绍+面试辅导

    - 框架版本选型:根据CDH官网的兼容性选择合适版本,如Hadoop 2.7.2、Flume 1.7.0、Kafka 0.11.0.2等。 - 技术特性:如Hive支持大规模数据计算,Spark提供内存运算,提升效率,Zookeeper用于协调服务,Hbase是...

    linux安装Cloudera manager1

    Cloudera Manager是一款强大的管理工具,专为简化Apache Hadoop及其相关组件的部署、配置和监控而设计。在Linux环境中安装Cloudera Manager可以帮助用户更有效地管理Hadoop集群,确保高效的数据处理和分析。本文将...

Global site tag (gtag.js) - Google Analytics