Mongodb中有一些限制,需要开发者预先了解
一、BSON文档
1、BSON文档尺寸:一个document文档最大尺寸为16M;大于16M的文档需要存储在GridFS中。
2、文档内嵌深度:BSON文档的结构(tree)深度最大为100。
二、Namespaces
1、collection命名空间:<database>.<collection>,最大长度为120字节。这也限定了database和collection的名字不能太长。
2、命名空间的个数:对于MMAPV1引擎,个数最大为大约为24000个,每个collection以及index都是一个namespace;对于wiredTiger引擎则没有这个限制。
3、namespace文件的大小:对于MMAPV1引擎而言,默认大小为16M,可以通过在配置文件中修改。wiredTiger不受此限制。
三、indexes
1、index key:每条索引的key不得超过1024个字节,如果index key的长度超过此值,将会导致write操作失败。
2、每个collection中索引的个数不得超过64个。
3、索引名称:我们可以为index设定名称,最终全名为<database name>.<collection name>.$<index name>,最长不得超过128个字节。默认情况下<index name>为filed名称与index类型的组合,我们可以在创建索引时显式的指定index名字,参见createIndex()方法。
4、组合索引最多能包含31个field。
四、Data
1、Capped Collection:如果你在创建“Capped”类型的collection时指定了文档的最大个数,那么此个数不能超过2的32次方,如果没有指定最大个数,则没有限制。
2、Database Size:MMAPV1引擎而言,每个database不得持有超过16000个数据文件,即单个database的总数据量最大为32TB,可以通过设置“smallFiles”来限定到8TB。
3、Data Size:对于MMAVPV1引擎而言,单个mongod不能管理超过最大虚拟内存地址空间的数据集,比如linux(64位)下每个mongod实例最多可以维护64T数据。wiredTiger引擎没有此限制。
4、每个Database中collection个数:对于MMAPV1引擎而然,每个database所能持有的collections个数取决于namespace文件大小(用来保存namespace)以及每个collection中indexes的个数,最终总尺寸不超过namespace文件的大小(16M)。wiredTiger引擎不受到此限制。
五、Replica Sets
1、每个replica set中最多支持50个members。
2、replica set中最多可以有7个voting members。(投票者)
3、如果没有显式的指定oplog的尺寸,其最大不会超过50G。
六、Sharded Clusters
1、group聚合函数,在sharding模式下不可用。请使用mapreduce或者aggregate方法。
2、Coverd Queries:即查询条件中的Fields必须是index的一部分,且返回结果只包含index中的fields;对于sharding集群,如果query中不包含shard key,索引则无法进行覆盖。虽然_id不是“shard key”,但是如果查询条件中只包含_id,且返回的结果中也只需要_id字段值,则可以使用覆盖查询,不过这个查询似乎并没有什么意义(除非是检测此_id的document是否存在)。
3、对于已经存有数据的collections开启sharding(原来非sharding),则其最大数据不得超过256G。当collection被sharding之后,那么它可以存储任意多的数据。
4、对于sharded collection,update、remove对单条数据操作(操作选项为multi:false或者justOne),必须指定shard key或者_id字段;否则将会抛出error。
5、唯一索引:shards之间不支持唯一索引,除非这个“shard key”是唯一索引的最左前缀。比如collection的shard key为{"zipcode":1,"name": 1},如果你想对collection创建唯一索引,那么唯一索引必须将zipcode和name作为索引的最左前缀,比如:collection.createIndex({"zipcode":1,"name":1,"company":1},{unique:true})。
6、在chunk迁移时允许的最大文档个数:如果一个chunk中documents的个数超过250000(默认chunk大小为64M)时,或者document个数大于 1.3 *(chunk最大尺寸(有配置参数决定)/ document平均尺寸),此chunk将无法被“move”(无论是balancer还是人工干预),必须等待split之后才能被move。
七、shard key
1、shard key的长度不得超过512个字节。
2、“shard key索引”可以为基于shard key的正序索引,或者以shard key开头的组合索引。shard key索引不能是multikey索引(基于数组的索引)、text索引或者geo索引。
3、Shard key是不可变的,无论何时都不能修改document中的shard key值。如果需要变更shard key,则需要手动清洗数据,即全量dump原始数据,然后修改并保存在新的collection中。
4、单调递增(递减)的shard key会限制insert的吞吐量;如果_id是shard key,需要知道_id是ObjectId()生成,它也是自增值。
对于单调递增的shard key,collection上的所有insert操作都会在一个shard节点上进行,那么此shard将会承载cluster的全部insert操作,因为单个shard节点的资源有限,因此整个cluster的insert量会因此受限。如果cluster主要是read、update操作,将不会有这方面的限制。为了避免这个问题,可以考虑使用“hashed shard key”或者选择一个非单调递增key作为shard key。(rang shard key 和hashed shard key各有优缺点,需要根据query的情况而定)。
八、Operations
1、如果mongodb不能使用索引排序来获取documents,那么参与排序的documents尺寸需要小于32M。
2、Aggregation Pileline操作
Pipeline stages限制在100M内存,如果stage超过此限制将会发生错误,为了能处理较大的数据集,请开启“allowDiskUse”选项,即允许pipeline stages将额外的数据写入临时文件。
九、命名规则
1、database的命名区分大小写。
2、database名称中不要包含:/ \.''$*<>:|?
3、database名称长度不能超过64个字符。
4、collection名称可以以“_”或者字母字符开头,但是不能包含"$"符号,不能为空字符或者null,不能以“system.”开头,因为这是系统保留字。
5、document字段名不能包含“.”或者null,且不能以“$”开头,因为$是一个“引用符号”。
相关推荐
本文将深入探讨MongoDB中的一些关键参数限制和阀值,这些限制在设计和管理数据库时需要特别注意。 1. BSON文档限制: - **文档大小**:单个BSON文档的最大尺寸为16MB。如果需要存储更大的文档,应使用GridFS存储...
MongoDB 是一个流行的开源文档数据库系统,其4.4版本提供了丰富的配置参数来优化和管理数据库的性能、安全性和稳定性。以下是对这些参数的详细解释: ### 验证参数 这些参数涉及到数据库的安全认证和权限控制: - `...
然而,MongoDB 的索引使用也存在一定的限制,这些限制旨在保证系统的稳定性和性能。下面我们将详细讨论 MongoDB 索引的限制及其相关知识点。 1. **系统限制** - **额外开销**:每个索引都需要占用存储空间,并在...
MongoDB限制内存批处理.bat,这个仅仅是个批处理,实际可以参考我的博客里的dos命令,上次批处理只是为了方便他人
MongoDB是一款开源、分布式、高性能的NoSQL数据库,它不使用传统的表格和列式结构来存储数据,而是采用键值对、文档、集合和图形数据模型。这种设计使得MongoDB在处理非结构化和半结构化数据时表现出色,特别适合大...
MongoDB 会打印出一些信息,包括数据库端口和 Web 端口,分别是 27017 和 28017。用户可以在浏览器中打开 http://localhost:28017 查看 MongoDB 的相关信息。 4. MongoDB 的 Windows 服务安装 每次运行 MongoDB ...
03mongodb应用范围和限制.mp4
检查mongodb字段是否有重复值
MongoDB 的配置文件的参数可以分为一般参数、Windows 参数、复制参数、副本集参数和隐含参数等几种。其中, 一般参数是 MongoDB 的基本配置参数,包括数据文件的存放路径、错误日志文件、绑定 IP、端口号等。Windows...
这个库允许开发者通过使用注解和基于Java的配置来处理MongoDB的操作。以下是对标题和描述中提到的知识点的详细说明: 1. **@Document** 注解:在Java实体类上使用`@Document`注解表示该类将映射到MongoDB的一个集合...
MongoDB是一个流行的开源、分布式文档型数据库,设计用于处理大量数据并提供高可用性和高性能。在Java应用程序中,为了与MongoDB进行交互,我们需要使用Java MongoDB驱动程序。这个压缩包包含的就是Java连接MongoDB...
MongoDB 的jar和源码,版本3.0.1
- 网络安全:通过修改配置文件中的`bindIp`参数,限制MongoDB只监听特定的IP地址或接口,防止未授权的远程访问。 5. **备份与恢复** - 备份:MongoDB提供了`mongodump`工具,可以将数据库备份为JSON或BSON格式的...
"MongoDB 在 Linux 下的配置和启动" MongoDB 是一个流行的 NoSQL 数据库,广泛应用于大数据存储和实时数据处理。在 Linux 环境下,配置和启动 MongoDB 需要遵循一定的步骤,本文将详细介绍在 Linux 下配置和启动 ...
MongoDB是一款开源、分布式、高性能的NoSQL数据库,以其灵活性、可扩展性和高可用性而备受开发者喜爱。本文将详细讲解MongoDB的安装过程,包括4.2.0和4.0.7两个版本,以及MongoDB Compass的安装与使用。 首先,我们...
Spring Data MongoDB是一个强大的Java库,它为开发人员提供了一种简单的方式来访问和操作MongoDB数据库。这个库是Spring Data框架的一部分,旨在简化数据访问层的实现,尤其在使用NoSQL数据库如MongoDB时。MongoDB...
MongoDB是一种开源的非关系型数据库系统,其特点在于分布式文件存储、高性能、易部署、易使用和存储格式灵活。MongoDB采用C++编写,支持存储各种复杂的数据类型,尤其擅长处理大量的数据。它的数据模型与传统的关系...
MongoDB是一款开源、高性能、无模式的文档型数据库,广泛应用于大数据存储、实时分析和现代应用程序开发。在Windows操作系统上,特别是32位系统中,MongoDB提供了支持,以满足那些仍在使用32位系统的用户需求。...
这个“mongodb-测试数据”压缩包显然包含了一些用于测试MongoDB功能的样例数据集,特别是针对增、删、改、查(CRUD)操作的学习和性能测试。 在深入探讨MongoDB的测试数据之前,我们先来了解一下MongoDB的基本概念...