最后更新2016-11-24
1. 关于建立数据表
create table在本地系统创建。create external table在HDFS。
例子:
CREATE EXTERNAL TABLE atr_click_reqid ( atr_reqid string) PARTITIONED BY (datecol string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' STORED AS INPUTFORMAT 'org.apache.hadoop.mapred.TextInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' LOCATION '/tmp/atr/0510click'; ALTER TABLE test.atr_click_reqid ADD IF NOT EXISTS PARTITION(datecol='20160510') LOCATION '/tmp/atr/0510click/20160510/';
【注意】
创建失败有可能是权限问题导致。
【注意】
如果使用LOAD命令,会导致原目录的数据被移动。所有尽量使用LOCATION命令。
2. 关于安装
安装过程非常简单。安装官网的说明,分分钟搞定。
无须在所有机器进行安装。提交任务的机器安装即可。
3. 有不解的问题咋办?
到 https://issues.apache.org/jira/browse 找别人提交的问题会很有帮助
4. 空值处理
hive没有IFNULL函数,因此可以使用CASE WHEN这样的语句来处理空值
例子:
SELECT CASE WHEN a IS NULL THEN 0 ELSE a END FROM tb_1;
或者
SELECT IF(a IS NULL,0, a ) FROM tb_1;
【注意】
如果不处理空值,会有两个情况发生。
- SUM()函数处理集合中有null值,会导致最后的结果为null
- join操作时,null值与任何值(包括null)都无法匹配并成功join
相关推荐
在大数据处理领域,Hive是一个基于Hadoop的数据仓库工具,它允许用户使用SQL-like的语言(称为HQL)来查询和管理大规模数据集。Hive 2.1.1是其一个稳定版本,提供了诸多增强的功能和性能优化。在这个场景中,我们...
1. **元数据**:Hive 存储关于数据的元数据,如表结构、分区信息、列类型等,这些信息用于解析查询并指导数据的物理存储。 2. **HQL(Hive Query Language)**:类似于 SQL 的查询语法,使得用户可以方便地对大数据...
"hive"表示这是关于Hive的话题,"jetty"指出了与Jetty服务器的关联,"安全漏洞"强调了安全性的核心问题,而"大数据"则表明这是在大数据分析的背景下讨论的问题。 从压缩包子文件的文件名称列表"apache-hive-3.1.2-...
"打怪升级之小白的大数据之旅--hive测试数据"这个标题,暗示了我们将通过实际操作Hive来学习和探索大数据的奥秘。Hive作为一个基于Hadoop的数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供SQL查询...
create table test_hive(id bigint,account string,expense double,time string) row format delimited fields terminated by '\t'; #建分区表(有大量数据增加的需要建分区表) create table test_part(id bigint...
Linux 环境下 Hive 的安装部署 CLI 和 Beeline 命令行的基本使用 常用 DDL 操作 分区表和分桶表 视图和索引 常用 DML 操作 数据查询详解 三、Spark Spark Core Spark SQL Spark Streaming 五、Flink 核心概念综述 ...
本文件包含hadoop集群搭建的详细步骤,包含基础环境搭建,Hadoop集群搭建,Hive搭建。小白放心食用,无坑。 其中基础环境搭建包括虚拟机安装、centos7、网络配置、xshell、notepad等环境的安装。注:本文里安装的...
欢迎下载使用,可用于小白学习、进阶。 该资源主要针对计算机、通信、人工智能、自动化等相关专业的学生、老师或从业者下载使用,亦可作为期末课程设计、课程大作业、毕业设计等。 项目整体具有较高的学习借鉴价值!...
欢迎下载使用,可用于小白学习、进阶。该资源主要针对计算机、通信、人工智能、自动化等相关专业的学生、老师或从业者下载使用,亦可作为期末课程设计、课程大作业、毕业设计等。项目整体具有较高的学习借鉴价值!...
欢迎下载使用,可用于小白学习、进阶。该资源主要针对计算机、通信、人工智能、自动化等相关专业的学生、老师或从业者下载使用,亦可作为期末课程设计、课程大作业、毕业设计等。项目整体具有较高的学习借鉴价值!...
基于SpringBoot+Hive的用户行为分析系统源码+全部资料齐全.zip基于SpringBoot+Hive的用户行为分析系统源码+全部资料齐全.zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分达到95分 2、...
从零学习Kerberos安全认证机制,并和Hadoop、YARN、HIVE进行集成,通过知识点 + 案例教学法帮助小白快速掌握Hadoop集成Kerberos安全技术。 课程亮点 1,专项攻破Hadoop安全配置。 2,生动形象,化繁为简,讲解通俗...
【适用人群】:适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【项目介绍】:通过hive-sql分析字段的血缘关系 表级别血缘关系 测试类:...
《Hive编程指南》是一本深入讲解Hive在Hadoop生态系统中应用的书籍,由Edward Capriolo、Dean Wampler和Jason Rutherglen三位专家共同撰写。书中详细介绍了Hive的基础知识,包括Hadoop和MapReduce的概念,以及Hive在...
Hive: 2.1.1 HBase: 1.2.2 Zookeeper: 3.4.8 基于docker-compose管理镜像和容器,并进行集群的编排 所有软件的二进制包均通过网络下载。其中包含自行编译的Hadoop和Protobuf二进制包,保存在Github上,其它软件的二...
基于Hive+Echats上网流量的用户行为大数据分析系统源码+全部资料齐全.zip基于Hive+Echats上网流量的用户行为大数据分析系统源码+全部资料齐全.zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,...
基于java+hadoop和hive的微博热词跟踪系统源码+数据集+详细文档(高分毕业设计).zip基于java+hadoop和hive的微博热词跟踪系统源码+数据集+详细文档(高分毕业设计).zip 【备注】 1、该资源内项目代码都经过测试...
python3.7+django+hive+mysql5.7+vue 适用人群:学习不同技术领域的小白或进阶学习者;可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 当人们打开系统的网址后,首先看到的就是首页界面。在这里,...
3、本项目适合计算机相关专业(如软件工程、计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶...