hive 与 hbase区别这个应该易懂 - 痴迷无限好 - ITeye博客

`

gelongmei

浏览: 212636 次
性别:
来自: 深圳

最近访客更多访客>>

ssydxa219

gx864102252

zllhit

wukunlsy

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

gelongmei：威武我大酒神
shell脚本不换行刷新数据

hive 与 hbase区别这个应该易懂

阅读更多

共同点：
1.hbase与hive都是架构在hadoop之上的。都是用hadoop作为底层存储

区别：

2.Hive是建立在Hadoop之上为了减少MapReduce jobs编写工作的批处理系统，HBase是为了支持弥补Hadoop对实时操作的缺陷的项目。
3.想象你在操作RMDB数据库，如果是全表扫描，就用Hive+Hadoop,如果是索引访问，就用HBase+Hadoop 。
4.Hive query就是MapReduce jobs可以从5分钟到数小时不止，HBase是非常高效的，肯定比Hive高效的多。
5.Hive本身不存储和计算数据，它完全依赖于HDFS和MapReduce，Hive中的表纯逻辑。
6.hive借用hadoop的MapReduce来完成一些hive中的命令的执行
7.hbase是物理表，不是逻辑表，提供一个超大的内存hash表，搜索引擎通过它来存储索引，方便查询操作。
8.hbase是列存储。
9.hdfs作为底层存储，hdfs是存放文件的系统，而Hbase负责组织文件。
10.hive需要用到hdfs存储文件，需要用到MapReduce计算框架。

分享到：

hadoop使用过程的坑 | 这个是比较靠谱的SPARK HADOOP 安装方法

2017-03-01 14:36
浏览 266
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

hbase 教程简单易懂初学者必备: 《HBase教程：简单易懂，初学者必备》在大数据处理领域，HBase作为一款分布式、列式存储的NoSQL数据库，因其高效、可扩展的特性，深受广大开发者的青睐。尤其对于初学者而言，掌握HBase的基本概念、操作与应用是至...

第15章-Sqoop+Hive+Hbase+Kettle+R某技术论坛日志分析项目案例.docx: 本案例详细介绍了如何利用一系列大数据处理工具，包括Sqoop、Hive、Hbase、Kettle以及R语言，对一个技术论坛的日志数据进行分析的过程。这一过程涵盖了数据预处理、存储、查询和可视化等多个环节，旨在帮助读者全面...

centOS 6.10 hadoop+spark+hive+HBase集群搭建: hadoop+spark+hive Linux centos大数据集群搭建，简单易懂，从0到1搭建大数据集群

Hbase中文文档和官方英文文档PDF.7z: 这个压缩包文件包含的"**Hbase中文文档和官方英文文档PDF**"是学习和理解HBase的重要资源，无论是对于初学者还是经验丰富的开发者来说，都是不可或缺的参考资料。 **Hbase中文文档**：中文文档通常会提供更易懂的...

HBase不睡觉书PDF版.zip: 这本书以其通俗易懂、深入浅出的写作风格，为初学者和对大数据领域感兴趣的读者提供了宝贵的资源。 HBase的核心特性包括： 1. 分布式架构：HBase采用水平扩展的方式，通过增加廉价服务器来提高存储和处理能力，...

通俗易懂的Hbase升级版教程（含配套资料）: 在本课程中，主要讲述了HBase详细的架构原理及特点、HBase内部各个角色的详细介绍、安装配置、HBase的Shell操作、新旧版本的读写数据详细流程、HBase的API操作、使用MapReduce以及Hive对HBase数据分析、Rowkey设计、...

hive apache教程译文: - Hive 不是一个关系型数据库。 - 不适合用于在线事务处理 (OLTP)。 - 不适合实时查询及行级更新操作。 - **适合的场景** - 处理离线数据分析 (OLAP)。 - 对于大规模数据集进行批处理查询。 #### 三、Hive的...

Hadoop学习文档.pdf: 2. HBase与传统数据库的区别：比较HBase与传统关系型数据库在设计和功能上的不同。 3. HBase实战：通过实战案例，教授如何使用HBase解决实际问题。 Spark 1. Spark的安装：介绍如何安装Spark，并讨论基于YARN和...

hadoop全部笔记.zip: HADOOP笔记详细文档。其中包括HDFS、yarn、mapreduce、hive、Hbase等原理讲解图片与各个组件的详细说明，以及相应mapreduce代码案例实例。以及对伪分布式、全分布式通俗易懂的说明。

参加大数据在线学习后能从事什么职位职业方如何.docx: 2. 大数据应用开发类人才：这类人才主要负责基于大数据技术的应用程序开发，例如使用Hive、HBase、Pig等工具进行数据处理和分析。大数据应用开发工程师是这一领域的主要角色，他们需要具备编程能力，熟悉Java、...

大数据工作流程学习教案.pptx: 例如，当需要将数据从SQL数据库转移到HDFS、Hive或HBase等分布式存储系统时，工具如Sqoop就起到了关键作用，它允许在不同系统间进行数据的高效迁移。数据存储是大数据处理中的核心部分，主要依赖于分布式文件系统...

ETL工具pdi-7.1.0.0-12（Kettle）.zip: 3. **大数据支持**：与Hadoop、Spark等大数据平台集成，支持HDFS、Hive、HBase等大数据源的处理。 4. **调度与工作流**：通过PDI的作业功能，可以构建复杂的定时任务和工作流。总结，PDI（Kettle）作为一款强大的...

The Big Ideas Behind Reliable, Scalable, and Maintainable Systems: Designing.Data-Intensive.Applications 设计数据密集型应用详细阐述了分笔试系统的理论基础通俗易懂看完之后再去学习hadoop hive hbase kafka将加深你的理解

大数据。基于hadoop的网站日志分析系统（附带web展示页面）: 在这个系统中，Hbase用于存储分析后的日志数据，支持快速的随机读取和实时查询，提供高效的数据检索能力。 3. **MapReduce**：MapReduce是Hadoop中的分布式计算模型，它将大规模数据处理分解为两个主要阶段——Map...

Hadoop 傻瓜入门: 3. Hadoop与结构化数据的结合，包括使用Hadoop来现代化数据仓库，以及探索如HBase、Hive和Sqoop等数据工具。 4. 实操Hadoop，深入掌握配置Hadoop集群的细节和对Hadoop日常管理的全面概览。 5. 利用额外资源提升...

2022年MathorCup大数据竞赛初赛赛题【600010002】: 大数据技术涵盖了数据采集、存储、处理、分析和可视化等多个环节，涉及的技术栈包括Hadoop、Spark、Flink等分布式计算框架，以及NoSQL数据库、Hive、HBase等数据存储解决方案。在这个竞赛中，参赛者可能需要利用...

scala 学习: Scala与Spark的结合，让Scala的学习者有机会接触到大数据生态圈中的Hadoop、Hive、HBase等重要工具和概念，为未来进入大数据行业打下坚实的基础。综上所述，Scala语言不仅有其独特的编程魅力，还因大数据技术的...

大数据分析公司网站模板是一款适合股票证券类数据公司网站模板下载。.zip: 同时，数据仓库如Hive或HBase可以用于存储历史数据，便于后期分析和挖掘。在数据挖掘方面，模板可以包含预设的分析模型，比如趋势预测、异常检测、关联规则挖掘等。这些模型可以帮助用户发现潜在的投资机会或者...

kettle 开发视频文档2: 在大数据领域，Kettle支持与Hadoop、Hive、HBase等平台的无缝集成。它可以通过Hadoop的MapReduce或Spark引擎执行分布式处理，提高数据处理的效率和扩展性。Kettle的Hadoop连接器允许用户从HDFS读取数据，或者将处理...

Global site tag (gtag.js) - Google Analytics