MongoDB 最大文档大小
本篇文章描述了在 MongoDB 中存储文档的默认最大大小限制。如果数据超过大小限制,它还会教育替代解决方案。
我们还将了解如何有效使用 BSON 文档的默认最大大小限制。
MongoDB 最大文档大小
在 MongoDB 中,文档(对象)以 BSON 格式存储。BSON(Binary JSON
)是类 JSON 文档的二进制序列化。
使用这种格式,我们可以使用不同的扩展来使用不属于 JSON 的数据类型的各种表示。
例如,我们在 BSON 中有一个 Date
和 BinData
类型,这在 JSON 中不可用。根据 MongoDB 文档,单个 BSON 文档的大小限制为 16MB
。
我们有文档的最大大小限制,以确保一个文档在传输过程中不能使用不受限制的 RAM 量或带宽。请记住,我们可以将 BSON 文档嵌套多达 100 个级别,其中每个数组/对象添加一个级别。
在当今世界,我们周围都有数据。因此,我们的数据可能会增加 16 兆字节的 BSON 文档的大小限制。
在这种情况下,MongoDB 通过提供 GridFS
API 来帮助我们存储大于 16MB
的文档。
什么是 GridFS
API
GridFS
是一个 MongoDB 规范,我们可以使用它来存储和访问超过 BSON 文档限制 (16MB
) 的大文件,例如音频、视频或图像文件。它类似于用于存储文件的文件系统,但数据存储在 MongoDB 集合中。
GridFS
API 将文件分成块并将每个数据块存储在单独的文档中,其中每个文档的大小为 255KB
。GridFS
默认包含两个集合,fs.files
和 fs.chunks
,存储文件的元数据和块。
每个块都由唯一的 _id
(ObjectId
)字段识别,而 fs.files
用作父文档。fs.chunks
文档中的 files_id
字段将块链接到其父级。
有效地使用默认 BSON 文档大小限制
BSON 文档大小限制 (16MB
) 很大。例如,War of the Worlds
的整个未压缩文本只有 364k
(HTML),但总是有例外。
如果你的数据超过限制,你可以使用我们之前讨论过的 GridFS
API 或制定有效使用 16MB
的策略。
让我们有一个场景,我们想要开发一个 XYZ 应用程序。应用程序需要四种数据类型——Booleans
、numbers
、strings
和 dates
(表示为 UNIX ms)。
由于有 16MB
的大小限制,MongoDB 可以轻松存储大约 200 万个 64 位
数字值(日期
和 布尔值
也是如此)。
在这里,string
类型值需要特别注意,因为每个 UTF-8 字符占用一个 byte
。我们需要优化所有包含 string
类型值的列的大小。
我们可以尝试以下方法来减小具有 string
类型值的列的大小。
-
我们可以使用
stringify()
和zip()
方法作为zip(JSON.stringify(column.values));
。 - 我们可以创建一个字典,并将所有唯一的 string 类型值插入到字典中。然后,用索引替换字符串值。
- 如果我们在一个字段中有许多重复的字符串值,这种方法很有用。如果有人想存储一列哈希,这种方法将无济于事,但他们可以使用 GridFS API。
- 我们还可以将列拆分成不同的块,并将这些块保存在链接到主文档的其他一些文档中。
相关文章
比较 MongoDB 中的字段
发布时间:2023/04/21 浏览次数:51 分类:MongoDB
-
在本文中,我们将了解如何比较 MongoDB 中的两个字段。 此外,我们将看到一个相关的示例和解释,以使主题更容易理解。
清除或删除 MongoDB 中的集合
发布时间:2023/04/21 浏览次数:147 分类:MongoDB
-
本篇文章将告诉大家如何删除 MongoDB 数据库中的集合以及删除 MongoDB 中的集合的不同方法。
向 MongoDB 集合中的每个文档添加新字段
发布时间:2023/04/21 浏览次数:107 分类:MongoDB
-
您将在这篇文章中了解 $set 和 $setOnInsert 操作。 此外,利用这两个运算符,快速描述了向 MongoDB 中的集合添加字段的挑战。
MongoDB 截断集合
发布时间:2023/04/21 浏览次数:178 分类:MongoDB
-
可以根据需要选择两个选项之一来截断下面的集合。 在今天的文章中,我们将学习如何在 MongoDB 中截断集合。
删除 MongoDB 中的重复项
发布时间:2023/04/21 浏览次数:151 分类:MongoDB
-
在本文中,我们将了解如何删除 MongoDB 中的重复条目,并且我们还将看到一个带有适当解释的示例,以使主题更容易理解。
使用 NodeJS 检查 MongoDB 中是否存在集合
发布时间:2023/04/21 浏览次数:194 分类:MongoDB
-
在本文中,我们将检查 MongoDB 数据库中是否存在一个集合,并且我们还将查看与主题相关的示例,以使主题更容易理解。 为此,我们将使用 Node.js。
MongoDB 中的唯一索引
发布时间:2023/04/21 浏览次数:144 分类:MongoDB
-
在这篇教学文章中,您将了解唯一索引、它们是什么以及如何在 MongoDB 中使索引唯一。 此外,还简要详细地解释了使用户的电子邮件在 MongoDB 中唯一。
在 MongoDB 中创建索引
发布时间:2023/04/21 浏览次数:104 分类:MongoDB
-
索引有助于有效解决查询。 如果没有索引,MongoDB 必须遍历集合中的每个文档才能找到与查询匹配的文档。因此,在今天的文章中,我们将学习如何在 MongoDB 中创建索引。
MongoDB 中的稀疏索引
发布时间:2023/04/21 浏览次数:142 分类:MongoDB
-
在本文中,我们将讨论 MongoDB 中的稀疏索引。 此外,我们将提供一个相关示例并进行解释,以使该主题更容易理解。