与关系型数据库相比,MongoDB的优点:
①弱一致性(最终一致),更能保证用户的访问速度:
举例来说,在传统的关系型数据库中,一个COUNT类型的操作会锁定数据集,这样可以保证得到“当前”情况下的精确值。这在某些情况下,例 如通过ATM查看账户信息的时候很重要,但对于Wordnik来说,数据是不断更新和增长的,这种“精确”的保证几乎没有任何意义,反而会产生很大的延 迟。他们需要的是一个“大约”的数字以及更快的处理速度。
但某些情况下MongoDB会锁住数据库。如果此时正有数百个请求,则它们会堆积起来,造成许多问题。我们使用了下面的优化方式来避免锁定:
每次更新前,我们会先查询记录。查询操作会将对象放入内存,于是更新则会尽可能的迅速。在主/从部署方案中,从节点可以使用“-pretouch”参数运行,这也可以得到相同的效果。
使用多个mongod进程。我们根据访问模式将数据库拆分成多个进程。
②文档结构的存储方式,能够更便捷的获取数据。
对于一个层级式的数据结构来说,如果要将这样的数据使用扁平式的,表状的结构来保存数据,这无论是在查询还是获取数据时都十分困难。
举例1:
就拿一个“字典项”来说,虽然并不十分复杂,但还是会关系到“定义”、“词性”、“发音”或是“引用”等内容。大部分工程师会将这种模型使用关系型数据库 中的主键和外键表现出来,但把它看作一个“文档”而不是“一系列有关系的表”岂不更好?使用 “dictionary.definition.partOfSpeech='noun'”来查询也比表之间一系列复杂(往往代价也很高)的连接查询方便 且快速。
举例2:在一个关系型数据库中,一篇博客(包含文章内容、评论、评论的投票)会被打散在多张数据表中。在MongoDB中,能用一个文档来表示一篇博客, 评论与投票作为文档数组,放在正文主文档中。这样数据更易于管理,消除了传统关系型数据库中影响性能和水平扩展性的“JOIN”操作。
CODE↓
> db.blogposts.save({ title : "My First Post", author: {name : "Jane", id :1},
comments : [{ by: "Abe", text: "First" },
{ by : "Ada", text : "Good post" }]
})
> db.blogposts.find( { "author.name" : "Jane" } )
> db.blogposts.findOne({ title : "My First Post", "author.name": "Jane",
comments : [{ by: "Abe", text: "First" },
{ by : "Ada", text : "Good post" } ]
})
> db.blogposts.find( { "comments.by" : "Ada" } )
> db.blogposts.ensureIndex( { "comments.by" : 1 } );
举例③:
MongoDB是一个面向文档的数据库,目前由10gen开发并维护,它的功能丰富,齐全,完全可以替代MySQL。在使用MongoDB做产品原型的过程中,我们总结了MonogDB的一些亮点:
使用JSON风格语法,易于掌握和理解:MongoDB使用JSON的变种BSON作为内部存储的格式和语法。针对MongoDB的操作都使用JSON风格语法,客户端提交或接收的数据都使用JSON形式来展现。相对于SQL来说,更加直观,容易理解和掌握。
Schema-less,支持嵌入子文档:MongoDB是一个Schema-free的文档数据库。一个数据库可以有多个Collection,每 个Collection是Documents的集合。Collection和Document和传统数据库的Table和Row并不对等。无需事先定义 Collection,随时可以创建。
Collection中可以包含具有不同schema的文档记录。这意味着,你上一条记录中的文档有3个属性,而下一条记录的文档可以有10个属 性,属性的类型既可以是基本的数据类型(如数字、字符串、日期等),也可以是数组或者散列,甚至还可以是一个子文档(embeddocument)。这 样,可以实现逆规范化(denormalizing)的数据模型,提高查询的速度。
图1 MongoDB是一个Schema-free的文档数据库
图2是一个例子,作品和评论可以设计为一个collection,评论作为子文档内嵌在art的comments属性中,评论的回复则作为 comment子文档的子文档内嵌于replies属性。按照这种设计模式,只需要按照作品id检索一次,即可获得所有相关的信息了。在MongoDB 中,不强调一定对数据进行Normalize,很多场合都建议De-normalize,开发人员可以扔掉传统关系数据库各种范式的限制,不需要把所有 的实体都映射为一个Collection,只需定义最顶级的class。MongoDB的文档模型可以让我们很轻松就能将自己的Object映射到
collection中实现存储。
图2 MongoDB支持嵌入子文档
③内置GridFS,支持大容量的存储。
GridFS是一个出色的分布式文件系统,可以支持海量的数据存储。
内置了GridFS了MongoDB,能够满足对大数据集的快速范围查询。
④内置Sharding。
提供基于Range的AutoSharding机制:一个collection可按照记录的范围,分成若干个段,切分到不同的Shard上。
Shards可以和复制结合,配合Replicasets能够实现Sharding+fail-over,不同的Shard之间可以负载均衡。查询是对 客户端是透明的。客户端执行查询,统计,MapReduce等操作,这些会被MongoDB自动路由到后端的数据节点。这让我们关注于自己的业务,适当的 时候可以无痛的升级。MongoDB的Sharding设计能力最大可支持约20petabytes,足以支撑一般应用。
这可以保证MongoDB运行在便宜的PC服务器集群上。PC集群扩充起来非常方便并且成本很低,避免了“sharding”操作的复杂性和成本。
⑤第三方支持丰富。(这是与其他的NoSQL相比,MongoDB也具有的优势)
现在网络上的很多NoSQL开源数据库完全属于社区型的,没有官方支持,给使用者带来了很大的风险。
而开源文档数据库MongoDB背后有商业公司10gen为其提供供商业培训和支持。
而且MongoDB社区非常活跃,很多开发框架都迅速提供了对MongDB的支持。不少知名大公司和网站也在生产环境中使用MongoDB,越来越多的创新型企业转而使用MongoDB作为和Django,RoR来搭配的技术方案。
⑥性能优越:
在使用场合下,千万级别的文档对象,近10G的数据,对有索引的ID的查询不会比mysql慢,而对非索引字段的查询,则是全面胜出。 mysql实际无法胜任大数据量下任意字段的查询,而mongodb的查询性能实在让我惊讶。写入性能同样很令人满意,同样写入百万级别的数 据,mongodb比我以前试用过的couchdb要快得多,基本10分钟以下可以解决。补上一句,观察过程中mongodb都远算不上是CPU杀手。
与关系型数据库相比,MongoDB的缺点:
①mongodb不支持事务操作。
所以事务要求严格的系统(如果银行系统)肯定不能用它。(这点和优点①是对应的)
②mongodb占用空间过大。
关于其原因,在官方的FAQ中,提到有如下几个方面:
1、空间的预分配:为避免形成过多的硬盘碎片,mongodb每次空间不足时都会申请生成一大块的硬盘空间,而且申请的量从64M、128M、256M那 样的指数递增,直到2G为单个文件的最大体积。随着数据量的增加,你可以在其数据目录里看到这些整块生成容量不断递增的文件。
2、字段名所占用的空间:为了保持每个记录内的结构信息用于查询,mongodb需要把每个字段的key-value都以BSON的形式存储,如果 value域相对于key域并不大,比如存放数值型的数据,则数据的overhead是最大的。一种减少空间占用的方法是把字段名尽量取短一些,这样占用 空间就小了,但这就要求在易读性与空间占用上作为权衡了。我曾建议作者把字段名作个index,每个字段名用一个字节表示,这样就不用担心字段名取多长 了。但作者的担忧也不无道理,这种索引方式需要每次查询得到结果后把索引值跟原值作一个替换,再发送到客户端,这个替换也是挺耗费时间的。现在的实现算是
拿空间来换取时间吧。
3、删除记录不释放空间:这很容易理解,为避免记录删除后的数据的大规模挪动,原记录空间不删除,只标记“已删除”即可,以后还可以重复利用。
4、可以定期运行db.repairDatabase()来整理记录,但这个过程会比较缓慢
③MongoDB没有如MySQL那样成熟的维护工具,这对于开发和IT运营都是个值得注意的地方。
相关推荐
MongoDB是一种非关系型(NoSQL)数据库,它以文档存储的方式管理数据,与传统的关系型数据库相比有着明显的区别。这种面向文档的设计使得MongoDB在灵活性和扩展性方面表现优异,能够很好地支持大规模的数据存储需求...
1. 学习曲线陡峭:MongoDB 的查询语法和数据模型不同于传统的关系型数据库,对于初学者来说可能存在一定的学习成本。 2. 不支持事务:MongoDB 不支持事务操作,对于需要事务支持的应用场景不太适合。 Windows 下 ...
关系型数据库和非关系型数据库 关系型数据库是指采用了关系模型来组织数据的数据库。简单来说,关系模型指的就是二维表格模型,而一个关系型数据库就是由二维表及其之间的联系所组成的一个数据组织。常见的关系型...
MongoDB 是一个开源的、基于分布式的、面向文档存储的非关系型数据库。 MongoDB 的出现是为了解决大规模数据集合、多种数据种类带来的挑战,尤其是大数据应用难题,包括超大规模数据的存储。 MongoDB 的特点: 1....
MongoDB是一种流行的非关系型数据库(NoSQL),它采用了文档存储的方式,以JSON对象(BSON格式)作为数据模型。MongoDB强调高性能、高可用性和可扩展性,尤其适合处理大规模的数据存储需求。由于其非关系性的特性,...
NoSQL数据库的出现是为了应对传统关系型数据库无法解决的一些问题,特别是在大规模数据处理方面。CAP理论(Consistency,Availability,Partition Tolerance)指出,在分布式系统中,一致性(Consistency)、可用性...
本文主要探讨了两种主要的数据库类型:关系型数据库(Relational Database Management System,简称RDBMS)和非关系型数据库(NoSQL Database),并分析了它们的基本概念、主流产品、优缺点以及适用场景。...
非关系型数据库优缺点 非关系型数据库是一种NoSQL数据库, Redis是其中的一种,具有高性能、丰富的数据类型、原子性等特点。下面是Redis的优缺点和优化方案: Redis 的优点 1. 支持数据的持久化,可以将内存中的...
MongoDB是一个流行的非关系型数据库(NoSQL),其设计目标是为了处理大规模数据,特别是在写入负载高和数据结构灵活的场景下。MongoDB的特点在于其基于分布式文件存储的架构,允许快速存储和检索半结构化的JSON-like...
#### NoSQL与关系型数据库的比较 - **NoSQL**:灵活性强,可扩展性好,适用于非结构化数据存储。 - **关系型数据库**:ACID特性强,支持SQL查询语言,适用于事务处理。 ### NoSQL, NewSQL, 关系数据库优缺点 #### ...
NoSQL数据库与传统的关系型数据库相比,其主要优点包括高并发读写能力、海量数据存储、高可扩展性以及高可用性。然而,NoSQL数据库也有其缺点,例如缺乏事务一致性,缺乏读写实时性,以及不支持复杂的查询操作。 ...
总结来说,MongoDB的关系处理策略与关系型数据库不同,主要依靠嵌入和引用关系来实现数据间的联系。嵌入关系适合处理紧密相关的数据,而引用关系则适用于处理独立且可能需要单独查询的数据。理解这两种关系模型及其...
非关系型数据库-NoSQL 非关系型数据库(NoSQL)是指不使用传统的表格关系来存储数据的数据库系统。NoSQL 数据库的出现是为了弥补关系型数据库的不足之处,如大量数据的写入处理、对有数据更新的表做索引或表结构...
相较于传统的关系型数据库,MongoDB 的主要特点是文档型存储和 schema-free 的设计,允许动态结构,方便数据管理和更新。 1. **文档型存储**:MongoDB 中的基本存储单元是文档,类似于 JSON 对象,可以包含各种复杂...
接下来是MySQL,这是一款开源的关系型数据库管理系统,属于SQL家族的一员。MySQL因其高效、可靠和易用性而广泛应用于Web开发。它支持ACID(原子性、一致性、隔离性、持久性)事务,保证了数据的一致性。MySQL适用于...
关系型数据库和非关系型数据库(NoSQL)是两种主要的数据库管理模式,它们各自具有不同的优缺点,适用于不同的应用场景。 关系型数据库(Relational Database Management System, RDBMS)是基于埃德加·科德提出的...
NoSQL(Not Only SQL)是一场数据库革命性的运动,提出了非关系型数据存储的概念。NoSQL数据库的优点包括高并发读写、海量数据存储、高可扩展性和高可用性;而其缺点在于缺乏事务一致性、缺乏读写实时性和不支持复杂...
这两者分别代表了文档型数据库(NoSQL)和关系型数据库(SQL)的典型代表,它们各有优缺点,适用于不同的应用场景。 **MongoDB** 是一个开源、分布式、面向文档的NoSQL数据库,以JSON格式存储数据,强调灵活性和高...
非关系型数据库与传统的关系型数据库(RDBMS)不同,它不依赖于固定的表结构,而是采用键值对、文档、列族或图形等多种数据模型。这种灵活性使得NoSQL数据库在处理大量分布式数据时表现出色,尤其适用于高并发、大...