`

(分析比较到位)NoSql 分析 hbase,mongodb,redis

 
阅读更多

hbase,mongodb,redis都属于nosql型存储方案。在实际的项目实践上看,他们的系统存储及处理的数量由大到小。HBase基于列存储,提供<key, family:qualifier, timestamp>三项坐标方式定位数据,由于其qualifier的动态可扩展型(无需schema设计,可存储任意多的qualifier),特别适合存储稀疏表结构的数据(比如互联网网页类)。HBase不支持二级索引,读取数据方面只支持通过key或者key范围读取,或者全表扫描。

 

MongoDb在类SQL语句操作方面目前比HBase具备更多一些优势,有二级索引,支持相比于HBase更复杂的集合查找等。BSON的数据结构使得处理文档型数据更为直接。MongoDb也支持mapreduce,但由于HBase跟Hadoop的结合更为紧密,Mongo在数据分片等mapreduce必须的属性上不如HBase这么直接,需要额外处理
HBase与Mongodb的读写性能正好相反,HBase写优于随机读,MongoDB似乎写性能不如读性能。

Redis为内存型KV系统,处理的数据量要小于HBase与MongoDB

 

 

1.Mongodb bson文档型数据库,整个数据都存在磁盘中,hbase是列式数据库,集群部署时每个familycolumn保存在单独的hdfs文件中。 
2.Mongodb 主键是“_id”,主键上面可以不建索引,记录插入的顺序和存放的顺序一样,hbase的主键就是row key,可以是任意字符串(最大长度是 64KB,实际应用中长度一般为 10-100bytes),在hbase内部,row key保存为字节数组。存储时,数据按照Row key的字典序(byte order)排序存储。设计key时,要充分排序存储这个特性,将经常一起读取的行存储放到一起。 
字典序对int排序的结果是1,10,100,11,12,13,14,15,16,17,18,19,2,20,21,…,9,91,92,93,94,95,96,97,98,99。要保持整形的自然序,行键必须用0作左填充。 
3.Mongodb支持二级索引,而hbase本身不支持二级索引 
4.Mongodb支持集合查找,正则查找,范围查找,支持skip和limit等等,是最像mysql的nosql数据库,而hbase只支持三种查找:通过单个row key访问,通过row key的range,全表扫描 
5.mongodb的update是update-in-place,也就是原地更新,除非原地容纳不下更新后的数据记录。而hbase的修改和添加都是同一个命令:put,如果put传入的row key已经存在就更新原记录,实际上hbase内部也不是更新,它只是将这一份数据已不同的版本保存下来而已,hbase默认的保存版本的历史数量是3。 
6.mongodb的delete会将该行的数据标示为已删除,因为mongodb在删除记录时并不是真把记录从内存或文件中remove,而是将该删除记录数据置空(写0或特殊数字加以标识)同时将该记录所在地址放到一个list列表“释放列表”中,这样做的好就是就是如果有用户要执行插入记录操作时,mongodb会首先从该“释放列表”中获取size合适的“已删除记录”地址返回,这种方法会提升性能(避免了malloc内存操作),同时mongodb也使用了bucket size数组来定义多个大小size不同的列表,用于将要删除的记录根据其size大小放到合适的“释放列表”中。Hbase的delete是先新建一个tombstonemarkers,然后读的时候会和tombstonemarkers做merge,在 发生major compaction时delete的数据记录才会真真删除。 
7.mongodb和hbase都支持mapreduce,不过mongodb的mapreduce支持不够强大,如果没有使用mongodb分片,mapreduce实际上不是并行执行的 
8.mongodb支持shard分片,hbase根据row key自动负载均衡,这里shard key和row key的选取尽量用非递增的字段,尽量用分布均衡的字段,因为分片都是根据范围来选择对应的存取server的,如果用递增字段很容易热点server的产生,由于是根据key的范围来自动分片的,如果key分布不均衡就会导致有些key根本就没法切分,从而产生负载不均衡。 
9.mongodb的读效率比写高,hbase默认适合写多读少的情况,可以通过hfile.block.cache.size配置,该配置storefile的读缓存占用Heap的大小百分比,0.2表示20%。该值直接影响数据读的性能。如果写比读少很多,开到0.4-0.5也没问题。如果读写较均衡,0.3左右。如果写比读多,果断默认0.2吧。设置这个值的时候,你同时要参考hbase.regionserver.global.memstore.upperLimit,该值是memstore占heap的最大百分比,两个参数一个影响读,一个影响写。如果两值加起来超过80-90%,会有OOM的风险,谨慎设置。 
10.hbase采用的LSM思想(Log-Structured Merge-Tree),就是将对数据的更改hold在内存中,达到指定的threadhold后将该批更改merge后批量写入到磁盘,这样将单个写变成了批量写,大大提高了写入速度,不过这样的话读的时候就费劲了,需要merge disk上的数据和memory中的修改数据,这显然降低了读的性能。mongodb采用的是mapfile+Journal思想,如果记录不在内存,先加载到内存,然后在内存中更改后记录日志,然后隔一段时间批量的写入data文件,这样对内存的要求较高,至少需要容纳下热点数据和索引。

分享到:
评论

相关推荐

    nosql精通教学PPT资源包

    nosql精通教学PPT资源包 Mongodb资料 Redis资料 HBase资料nosql精通教学PPT资源包 Mongodb资料 Redis资料 HBase资料nosql精通教学PPT资源包 Mongodb资料 Redis资料 HBase资料nosql精通教学PPT资源包 Mongodb资料 ...

    nosql课程设计、教学设计、Redis,MongoDB课程设计,HBase教学设计

    nosql课程设计、教学设计、Redis,MongoDB课程设计,HBase教学设计nosql课程设计、教学设计、Redis,MongoDB课程设计,HBase教学设计nosql课程设计、教学设计、Redis,MongoDB课程设计,HBase教学设计nosql课程设计、...

    实验四:NoSQL和关系数据库的操作比较

    本实验旨在对比分析四种不同的数据库管理系统:MySQL、HBase、Redis和MongoDB。这些数据库在处理大数据时各有特点,理解它们的概念及不同点是实验的关键。 1. **MySQL**:作为经典的关系型数据库管理系统(RDBMS)...

    NoSql数据库之Redis笔记

    ### NoSQL数据库之Redis知识点详解 #### 一、NoSQL数据库概述 - **NoSQL**:Not Only SQL,指的是非关系型数据库。这类数据库的设计旨在处理海量数据,并且支持高并发访问,通常用于大规模分布式存储环境中。 - *...

    NoSQL研究及选型报告

    MongoDB是一种流行的文档型NoSQL数据库,它以JSON格式存储数据,易于理解和操作。MongoDB的安装配置相对简单,可以通过官方提供的二进制包或包管理器进行安装。在备份恢复方面,MongoDB提供了mongodump和...

    nosql分布式数据库期末考试题.docx

    【描述】:该文档是关于Nosql分布式数据库的一份期末考试试题,涵盖了多种NoSQL数据库的相关知识,包括选择题和填空题,涉及MySQL、MongoDB、Redis、HBase等数据库的特点、优缺点、操作语句以及相关概念。...

    数据存储实验4-NoSQL和关系数据库的操作比较.doc(实验报告)

    使用HBase、Redis、MongoDB等NoSQL数据库,设计出学生表,使用相应的Shell命令和Java API,执行insert、select、update等操作,并给出截图。 ### 实验结论 通过本次实验,了解了关系数据库和NoSQL数据库的概念和...

    HBase编程开发

    HBase与关系数据库的关系以及其它NoSQL的关系 HBase的Java API编程接口 HBase的表设计、行键设计等 在非Java语言中使用HBase HBase的使用场景,与MongoDB、Redis、Memcache的区分

    NoSQL就业形势分析1

    这份报告分析了 NoSQL 领域内几种主要数据库的就业趋势,包括 Cassandra、Redis、Voldemort、SimpleDB、CouchDB、MongoDB、HBase、Hypertable 和 Riak。 Cassandra 曾经是需求量最大的 NoSQL 数据库,但在最近的...

    狂神说-Redis完整版笔记

    【Redis完整版笔记】深入解析Redis作为NoSQL数据库的关键特性 Redis是一款高性能的Key-Value内存数据库,广泛应用于...同时,了解NoSQL的其他类型如MongoDB和HBase,可以帮助我们根据具体需求选择合适的数据库技术。

    NOSQL数据库-redis快速入门

    此外,NOSQL数据库通常具有特定的API和语法,适应不同的业务场景,如MongoDB适合内容管理系统,Redis则是一款多功能的数据结构服务器,而Hbase和Cassandra则常用于海量数据处理。 Redis是一款高性能的键值对数据库...

    Seven.Databases.in.Seven.Weeks.2nd.Edition.2018.4

    postgresql hbase mongodb couchdb neo4j dynamodb redis

    redis常用命令,redis配置文件,redis持久化,redis事务,redis主从复制,jedis的使用

    Redis 入门详解 Redis 是一种开源、基于内存的数据结构存储系统,可以用作数据库、消息队列、缓存层等。下面是对 Redis 的常用命令、配置文件、持久化、事务、主从复制、Jedis 使用的详细讲解。 Redis 常用命令 ...

    HBaseRedisMongoDBCouchbaseLev

    【描述】这份文档涵盖了五种流行的NoSQL数据库——HBase、Redis、MongoDB、Couchbase以及LevelDB之间的详细对比,共计20页。这些数据库在大数据处理、高性能存储以及灵活性方面各有特色,它们的选择通常取决于特定的...

    Nosql数据库原理与应用综合项目

    运行环境:包括Ubuntu 16.04、Windows 11操作系统,Hadoop 2.7.1大数据框架,以及Redis、MongoDB、HBase、Neo4j等NoSQL数据库。 数据集与预处理:通过Python爬取,得到14371个二手房数据,经过合并、字段调整、空值...

    最全面的redis教程

    【Redis教程】全面解析Redis——NoSQL数据库的明星 Redis是一个高效的Key-Value数据库,由Salvatore Sanfilippo在2008年为解决MySQL性能问题而诞生,随后因其出色的表现,迅速成为NoSQL数据库领域的热门选择。Redis...

    NoSQL数据库试验.docx

    本实验主要涉及了Redis、MongoDB和HBase这三种NoSQL数据库的使用。 1. **Redis**: - Redis是一个内存中的数据存储系统,支持多种数据结构,如字符串、哈希、列表、集合和有序集合。在实验中,我们学习了如何在...

Global site tag (gtag.js) - Google Analytics