`
cakin24
  • 浏览: 1388650 次
  • 性别: Icon_minigender_1
  • 来自: 西安
社区版块
存档分类
最新评论

Hive基本概念

    博客分类:
  • Hive
阅读更多
一 什么是Hive
Hive是构建于Hadoop HDFS之上的一个数据仓库,它本身就是一个数据库。
 
二什么是数据仓库
数据仓库就是一个数据库,数据仓库是一个面向主题的、集成的、不可更新的、随时间不变化的数据集合,它用于支持企业或组织的决策分析处理。
面向主题:数据仓库中的数据是按照一定的主题进行组织的,是用户进行决策时关注的重点方面。例如商品推荐系统,主题当然是商品信息。
集成的:数据仓库中的数据时来自分散的操作性数据,将操作性地数据从原来的数据中抽取出来,进行加工处理,满足一定的条件才能进入数据仓库。原来的数据可以来自于oracle数据库或Mysql数据库,也可以来自一个文本文件或者来自其他系统。我们把不同的数据集成起来,就形成了数据仓库。
不可更新的:主要是用来数据查询,不会在数据仓库中进行更新或删除。
 
三 数据仓库的结构和建立过程


 
 
四 OLTP应用
1、定义
OLTP:联机事务处理
2、典型应用
银行转账


 
 
五 OLAP应用
1、定义
OLAP:联机分析处理
2、典型应用
商品推荐系统


 
 
六 数据仓库中的数据模型


 
1、星型模型


 
2、雪花模型


 

 

 
  • 大小: 188.3 KB
  • 大小: 100.9 KB
  • 大小: 164.3 KB
  • 大小: 162.7 KB
  • 大小: 43.9 KB
  • 大小: 103.4 KB
分享到:
评论

相关推荐

    Hive基本概念及常用操作.rar

    Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化...Hive概念及常用操作文件包含Hive的基本概念与架构,以及在平常的工作中常用的一些操作,包括HQL的开发运行,以及优化。

    快速学习-Hive 基本概念

    第 1 章 Hive 基本概念 1.1 什么是 Hive Hive:由 Facebook 开源用于解决海量结构化日志的数据统计。 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并 提供类 SQL 查询功能。 本质...

    HIVE安装及详解

    HIVE基本概念 HIVE是什么?HIVE是一种数据仓库工具,主要用于处理和分析大规模数据。它将结构化数据文件转换为表格形式,以便更容易地执行查询和分析操作。 为什么使用HIVE?HIVE可以处理大规模数据,并且可以与...

    尚硅谷大数据技术之 Hive1

    1. **Hive基本概念** Hive是由Facebook开源的一种数据仓库工具,设计用来处理海量的结构化日志数据统计。它基于Hadoop,可以把结构化的数据文件映射成数据库表,并提供SQL-like查询功能。Hive的本质是将HQL(Hive ...

    Hive用户指南(Hive_user_guide)_中文版pdf

    1. **Hive基本概念**:Hive是一种数据仓库工具,它可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,适合于数据汇总、分析。Hive构建在Hadoop之上,利用HDFS进行数据存储,MapReduce进行数据...

    尚硅谷 hive 课程教学文档

    #### 第一章 Hive基本概念 ##### 1.1 Hive简介 **Hive** 是一个基于 **Hadoop** 的数据仓库工具,它能够将结构化的数据文件映射成一张表,并提供类似于SQL的查询功能,即 **Hive Query Language (HQL)**。通过这种...

    Hive技术调研

    Hive基本概念** Hive的核心特性在于它的数据抽象和SQL支持。它可以将任意结构化的数据文件映射为数据库表,让用户无需编写复杂的MapReduce程序就能执行SQL查询。HiveQL语句被解释器解析、编译和优化,最终转化为...

    Hive 编程指南

    1. **Hive基本概念**: - **数据仓库**:Hive提供了一个数据仓库解决方案,用于存储、管理和分析大规模结构化数据。 - **HQL(Hive Query Language)**:Hive的语言接口,类似于SQL,用于查询和管理数据仓库。 2....

    hive文档.docx

    【Hive基本概念】 Hive是由Facebook开源的一种大数据处理工具,专门用于处理大规模的结构化日志数据统计。它基于Hadoop平台,提供了一种类SQL的查询语言——HiveQL(Hive Query Language),使得非程序员也能方便地...

    hive函数大全.7z

    1. **Hive基本概念**:包括Hive的数据模型,表的创建,分区和桶的概念,以及数据加载和查询的基本语法。 2. **Hive数据类型**:介绍Hive支持的多种数据类型,如STRING, INT, FLOAT, BOOLEAN等,以及如何处理不同...

    大数据技术之hive学习文档

    【大数据技术之 Hive 学习文档】 Hive 是一个基于 Hadoop 的数据仓库工具,它允许用户使用类似...通过理解和掌握 Hive 的基本概念、优缺点、架构以及与数据库的区别,用户可以更好地运用 Hive 解决实际的大数据问题。

    hive综合应用案例-用户学历查询.zip

    1. Hive基本概念: Hive是由Facebook开源的,主要用于解决海量数据的离线分析问题。它将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,将SQL语句转换为MapReduce任务运行在Hadoop上,极大地简化了大数据...

    Hive使用手册1

    **Hive基本概念** Hive是基于Hadoop的数据仓库工具,它可以将结构化的数据文件映射为一张数据库表,并提供SQL-like查询语言(HQL)进行数据查询、分析。Hive设计的目标是使数据分析人员能够利用熟悉的关系型数据库...

    大数据技术之Hive全方位解析

    #### 第1章 Hive基本概念 ##### 1.1 什么是Hive **Hive** 是一个基于 **Hadoop** 的数据仓库工具,它能够将结构化的数据文件映射成一张表,并提供类似于SQL的查询功能,即Hive Query Language (HQL)。这一工具最初...

    HiveSQL使用考核题.zip

    1. **Hive基本概念**: - **Hive架构**:包括客户端、元数据存储、HiveServer、Hive Metastore、MapReduce(或Tez、Spark)等组件,它们协同工作以处理SQL查询。 - **元数据**:描述Hive表和分区的信息,如表名、...

    《Hive的开发指南》

    Hive 基本概念 Hive 应用场景。 Hive 与hadoop的关系。 Hive 与传统数据库对比。 Hive 的数据存储机制。 Hive 基本操作 Hive 中的DDL操作。 在Hive 中如何实现高效的JOIN查询。 Hive 的内置函数应用。 Hive shell...

    Hive简介01.pptx

    01. Hive基本概念 02. Hive架构 03. Hive数据组织 04. 常用HQL介绍

Global site tag (gtag.js) - Google Analytics