一 什么是Hive
Hive是构建于Hadoop HDFS之上的一个数据仓库,它本身就是一个数据库。
二什么是数据仓库
数据仓库就是一个数据库,数据仓库是一个面向主题的、集成的、不可更新的、随时间不变化的数据集合,它用于支持企业或组织的决策分析处理。
面向主题:数据仓库中的数据是按照一定的主题进行组织的,是用户进行决策时关注的重点方面。例如商品推荐系统,主题当然是商品信息。
集成的:数据仓库中的数据时来自分散的操作性数据,将操作性地数据从原来的数据中抽取出来,进行加工处理,满足一定的条件才能进入数据仓库。原来的数据可以来自于oracle数据库或Mysql数据库,也可以来自一个文本文件或者来自其他系统。我们把不同的数据集成起来,就形成了数据仓库。
不可更新的:主要是用来数据查询,不会在数据仓库中进行更新或删除。
三 数据仓库的结构和建立过程
四 OLTP应用
1、定义
OLTP:联机事务处理
2、典型应用
银行转账
五 OLAP应用
1、定义
OLAP:联机分析处理
2、典型应用
商品推荐系统
六 数据仓库中的数据模型
1、星型模型
2、雪花模型
相关推荐
Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化...Hive概念及常用操作文件包含Hive的基本概念与架构,以及在平常的工作中常用的一些操作,包括HQL的开发运行,以及优化。
第 1 章 Hive 基本概念 1.1 什么是 Hive Hive:由 Facebook 开源用于解决海量结构化日志的数据统计。 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并 提供类 SQL 查询功能。 本质...
HIVE基本概念 HIVE是什么?HIVE是一种数据仓库工具,主要用于处理和分析大规模数据。它将结构化数据文件转换为表格形式,以便更容易地执行查询和分析操作。 为什么使用HIVE?HIVE可以处理大规模数据,并且可以与...
1. **Hive基本概念** Hive是由Facebook开源的一种数据仓库工具,设计用来处理海量的结构化日志数据统计。它基于Hadoop,可以把结构化的数据文件映射成数据库表,并提供SQL-like查询功能。Hive的本质是将HQL(Hive ...
1. **Hive基本概念**:Hive是一种数据仓库工具,它可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,适合于数据汇总、分析。Hive构建在Hadoop之上,利用HDFS进行数据存储,MapReduce进行数据...
#### 第一章 Hive基本概念 ##### 1.1 Hive简介 **Hive** 是一个基于 **Hadoop** 的数据仓库工具,它能够将结构化的数据文件映射成一张表,并提供类似于SQL的查询功能,即 **Hive Query Language (HQL)**。通过这种...
Hive基本概念** Hive的核心特性在于它的数据抽象和SQL支持。它可以将任意结构化的数据文件映射为数据库表,让用户无需编写复杂的MapReduce程序就能执行SQL查询。HiveQL语句被解释器解析、编译和优化,最终转化为...
1. **Hive基本概念**: - **数据仓库**:Hive提供了一个数据仓库解决方案,用于存储、管理和分析大规模结构化数据。 - **HQL(Hive Query Language)**:Hive的语言接口,类似于SQL,用于查询和管理数据仓库。 2....
【Hive基本概念】 Hive是由Facebook开源的一种大数据处理工具,专门用于处理大规模的结构化日志数据统计。它基于Hadoop平台,提供了一种类SQL的查询语言——HiveQL(Hive Query Language),使得非程序员也能方便地...
1. **Hive基本概念**:包括Hive的数据模型,表的创建,分区和桶的概念,以及数据加载和查询的基本语法。 2. **Hive数据类型**:介绍Hive支持的多种数据类型,如STRING, INT, FLOAT, BOOLEAN等,以及如何处理不同...
【大数据技术之 Hive 学习文档】 Hive 是一个基于 Hadoop 的数据仓库工具,它允许用户使用类似...通过理解和掌握 Hive 的基本概念、优缺点、架构以及与数据库的区别,用户可以更好地运用 Hive 解决实际的大数据问题。
1. Hive基本概念: Hive是由Facebook开源的,主要用于解决海量数据的离线分析问题。它将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,将SQL语句转换为MapReduce任务运行在Hadoop上,极大地简化了大数据...
**Hive基本概念** Hive是基于Hadoop的数据仓库工具,它可以将结构化的数据文件映射为一张数据库表,并提供SQL-like查询语言(HQL)进行数据查询、分析。Hive设计的目标是使数据分析人员能够利用熟悉的关系型数据库...
#### 第1章 Hive基本概念 ##### 1.1 什么是Hive **Hive** 是一个基于 **Hadoop** 的数据仓库工具,它能够将结构化的数据文件映射成一张表,并提供类似于SQL的查询功能,即Hive Query Language (HQL)。这一工具最初...
1. **Hive基本概念**: - **Hive架构**:包括客户端、元数据存储、HiveServer、Hive Metastore、MapReduce(或Tez、Spark)等组件,它们协同工作以处理SQL查询。 - **元数据**:描述Hive表和分区的信息,如表名、...
Hive 基本概念 Hive 应用场景。 Hive 与hadoop的关系。 Hive 与传统数据库对比。 Hive 的数据存储机制。 Hive 基本操作 Hive 中的DDL操作。 在Hive 中如何实现高效的JOIN查询。 Hive 的内置函数应用。 Hive shell...
01. Hive基本概念 02. Hive架构 03. Hive数据组织 04. 常用HQL介绍