Docs 菜单
Docs 主页
/
数据库手册
/

词汇表

$cmd
一个虚拟 集合,用于显示 MongoDB 的数据库命令。要使用数据库命令,请参阅 发出命令。
_id
每个 MongoDB 文档 中都需要的字段。_id 字段必须具有唯一值。您可以将 _id 字段视为文档的主键。如果创建的新文档中没有 _id 字段,MongoDB 会自动创建该字段,并为该字段分配一个唯一的 BSON ObjectId
绝对系统 CPU 利用率

系统 CPU 利用率,相对于股票CPU 的云实例可用的 CPU 总量。

  • 当云提供商限制云实例的 CPU 利用率时,该实例的绝对系统 CPU 利用率等于分配给该实例的基准 CPU 利用率。

  • 当云提供商将 CPU 添加到基线 CPU 以上时(例如通过突发机制),实例上的规范化内核 CPU 利用率和用户 CPU 利用率的总和可能会超过该实例的基线 CPU。 在这种情况下,规范化的内核 CPU 利用率和用户 CPU 利用率之和仍然小于云实例共享的 CPU 总量。 另请参阅相对系统 CPU 利用率、基线 CPU 利用率和可突发实例。

累加器
聚合管道中的某一表达式,它可用于维护聚合管道中各文档之间的状态。有关累加器操作的列表,请参阅 $group
操作
用户可以对资源执行的操作。操作和资源结合起来创建权限。请参阅操作
管理库
获授权的数据库。用户必须有权访问 admin 数据库才能运行某些管理命令。有关管理命令的列表,请参阅管理命令
高级持续性威胁
在安全领域,是指获得并保持对网络、磁盘和/或内存的长期访问权限,并在较长时间内不被发现的攻击者。
聚合
减少和汇总大量数据的操作。MongoDB 的 aggregate()mapReduce() 方法是聚合操作的两个示例。如需了解更多信息,请参阅聚合操作。
聚合管道
包括一个或多个处理文件的阶段。聚集操作符无需使用 map-reduce 即可计算聚集值。有关操作符列表,请参阅聚合参考
警报

当数据库操作或服务器使用率达到影响集群性能的阈值时, Atlas发送的通知。要学习;了解可以设立哪些条件来触发警报,请参阅查看警报条件。

提示

分析节点
专用的只读节点,可用于隔离您不希望影响操作工作负载的查询。 分析节点 可用于处理分析数据,例如由 BI 工具执行的报告查询。 您可以在专用地理区域托管分析节点, 优化读取性能并减少延迟。
API

促进客户端与 MongoDB Atlas 之间交互的通信协议。 您可以使用 Administration API, 自动执行 Atlas UI 中的许多任务。

近似最近邻 (ANN)搜索

用于快速查找数据集中与给定查询点接近的点的计算技术。Atlas Vector Search使用 ANN搜索在数据中查找与查询中的向量嵌入最接近的向量嵌入,而无需扫描每个向量。

投票节点
一个副本集节点,仅用于在选举中投票。仲裁节点不复制数据。仲裁节点会参与主节点选举,但不能成为主节点。有关更多详情,请参阅复制集仲裁节点。
Atlas
MongoDB Atlas 是一项云托管的数据库即服务。
Atlas Search

细粒度文本索引,支持对数据进行高级文本搜索,而无需任何额外管理。Atlas Search提供多种文本分析器选项、基于分数的结果排名以及丰富的查询语言

Atlas 用户

用于访问权限Atlas应用程序的帐户。您可以授予Atlas用户访问权限Atlas组织、项目或两者的访问权限,某些权限由用户角色定义。 Atlas 用户与数据库用户不同。 Atlas用户不能访问权限任何MongoDB数据库。

Atlas user role

授予 Atlas 用户的一组权限。您可以在组织项目级别授予权限。

Atlas Vector Search
Atlas中的一项功能,允许您通过将查询向量与索引向量进行比较以找到最接近的匹配项,从而对向量嵌入执行语义搜索。
原子操作
原子操作是一种写入操作,它要么完全完成,要么根本没有完成。对于涉及写入多个文档的分布式事务,对每个文档的所有写入都必须成功才能使事务成功。原子操作无法部分完成。请参见原子性和事务
身份验证
验证用户身份。请参阅自管理部署的身份验证。
授权
提供对数据库和操作的访问权限。请参阅自管理部署中基于角色的访问控制
自动伸缩 (Auto-Scaling)

可配置选项, 使集群根据集群使用情况自动增加或减少集群层、存储容量, 或两者兼而有之。

自动加密
使用正在使用的加密时,根据预先配置的加密模式自动执行加密和解密。自动加密共享库将 MongoDB 查询语言转换为正确的调用,这意味着您无需为特定的加密和解密调用重写应用程序。
B树
数据库管理系统通常用来存储索引的数据结构。MongoDB 使用 B-Tree 索引。
备份

用于封装集群在特定时间状态的数据副本。 备份可在发生数据丢失事件时提供安全措施。

Atlas提供完全托管的云备份。

备份光标备份游标
指向备份文件列表的可追加游标。备份游标仅供内部使用。
平衡器
内部 MongoDB 进程,在分片集群的上下文中运行并管理数据块的迁移。管理员必须禁用分片集群上所有维护操作的负载均衡器。请参见分片集群负载均衡器。
基线 CPU 利用率
股票CPU 的云实例可用的 CPU 总量的比例。 云提供商根据实例的集群层为每个云实例分配一定数量的基准 CPU。 通常,基线 CPU 利用率介于绝对系统20 50CPU 利用率的 % 和 % 之间。另请参阅相对系统 CPU 利用率和可突发实例。
大端

一种字节顺序,其中多字节数据值的最高有效字节(大端)存储在最低内存地址。

大端字节序示例图
点击放大
阻塞排序
在返回输出之前必须在内存中执行的排序。内存排序可能会影响大型数据集的性能。使用索引排序以避免内存排序。
有界集合扫描
查询优化器使用的计划,用于排除具有特定字段值范围的文档。例如,如果日期字段值的范围超出了指定的日期范围,查询计划就会排除该范围内的文档。请参见集合扫描
BSON
一种序列化格式,用于在 MongoDB 中存储文档和进行远程过程调用。“BSON”是“binary”和“JSON”这两个词的合成词。您可以将 BSON 视为 JSON(JavaScript 对象表示法)文档的二进制表示形式。请参阅BSON 类型MongoDB 扩展 JSON (v2)。
BSON类型
BSON 序列化格式支持的类型集。有关 BSON 类型的列表,请参阅 BSON 类型。
可突发实例
股票通用物理 CPU 的云实例类型,对于某些云提供商,使用“CPU信用”模型。 使用可突发实例时,根据对实例资源的不同需求,部分共享 CPU 可能可供每个虚拟实例使用,也可能变为不可用。 要学习;了解更多信息,请参阅Amazon Web Services可突发实例 Azure磁盘突发和GCP CPU 突发。另请参阅基线 CPU 利用率、绝对系统 CPU 利用率和相对系统 CPU 利用率。
CAP 定理
对于计算系统的三种属性,即一致性、可用性和分区容错性,分布式计算系统可以满足其中任意两项,但不能同时提供全部三项。
固定集合
一种固定大小的集合,当该集合达到其最大大小时,它会自动覆盖其最旧的条目。复制中使用的 MongoDB oplog 就是一种固定大小集合。请参阅固定大小集合
关联基数
一组值中元素数量的度量。例如,组 A = { 2, 4, 6 } 包含 3 个元素,关联基数为 3。请参阅分片键关联基数
笛卡尔积
两个数据集组合的结果,组合数据集包含所有可能的值组合。
CFQ
完整公平排队 (cfq) 是一种 I/O 操作调度器,为传入请求进程分配带宽。
校验和
用于确保数据完整性的计算值。md5 算法有时被用作校验和。
数据段
一个分片中连续的分片键值范围。数据块范围包括下边界,但不包括上边界。当数据块的增长大于配置的数据块大小时,MongoDB 会对其进行拆分。默认数据块大小为 128 MB。当一个分片包含的集合数据块远多于其他分片时,MongoDB 会迁移数据块。如需了解详细信息,请参阅使用数据块进行数据分区分片集群负载均衡器管理分片集群负载均衡器
客户端

使用数据库进行数据持久化和存储的应用程序层。驱动程序提供了应用程序层与数据库服务器之间的接口层。

客户端也可以是单个线程或进程。

客户端关联性
与指定数据源的一致客户端连接。
云备份

使用集群云服务提供商的本地快照功能进行本地化集群备份存储。

Atlas 支持在以下集群上的云备份:

集群

包含MongoDB 部署的节点集。集群可以是副本集分片的部署。

集群类

可针对 Amazon Web Services 上托管的 M40+ 集群进行配置。

集群的存储类。您所选择的类会影响 集群存储性能和集群成本。您可以选择以下类之一:

  • Low CPU

  • General

  • Local NVMe SSD

集群层

规定集群中每个数据承载服务器的内存、存储、vCPU 和 IOPS规格。 集群存储大小和整体性能随着集群层的增加而增加。

cluster-to-cluster sync
分片集群之间同步数据。也称为 C2C 同步。
集群化集合
集合是指一组按集群化索引键排序的存储文档。请参阅集群化集合。
CMK
客户主密钥的缩写,请参阅客户主密钥。
集合
MongoDB 文档的分组。集合相当于 RDBMS 表。集合位于单个数据库中。集合不强制实施架构。集合中的文档可以具有不同的字段。通常,集合中的文档都具有相似或相关的用途。请参阅命名空间。
集合扫描(collection scan)
集合扫描是一种查询执行策略,其中 MongoDB 必须检查集合中的每个文档,以确定它是否与查询条件匹配。这些查询效率非常低,并且不使用索引。有关查询执行策略的详细信息,请参阅查询优化
提交
保存 startSession 命令开始后所做的数据更改。事务中的操作在使用 commitTransaction 命令提交之前不是永久性的。
commitQuorum
索引构建期间,提交法定人数指定在主节点执行提交之前有多少个从节点必须准备好提交其本地索引构建。
复合索引
由两个或多个键组成的索引。请参阅复合索引
并发控制
并发控制确保数据库操作可以并发执行,而不会影响正确性。悲观并发控制(例如在带 的系统中使用)会阻塞任何可能发生冲突的操作,即使这些操作可能并未发生冲突。乐观并发控制(WiredTiger 使用的方法)会将检查延迟到可能发生冲突之后,并结束和重试任何写入冲突中的操作之一。
config database
包含分片集群元数据的内部数据库。通常情况下,您不会修改 config 数据库。有关 config 数据库的更多信息,请参阅配置数据库
config server
一个 mongod 实例,用于存储与分片集群相关的所有元数据。请参见配置服务器。
配置分片
一个 mongod 实例,用于存储与 分片集群 关联的所有元数据,还可以存储应用程序数据。请参阅配置分片。
连接池
驱动程序维护的数据库连接缓存。当需要连接数据库时,这些缓存的连接会被重复使用,而不是打开新的连接。
连接风暴
驱动程序尝试打开与部署的连接的数量超出该部署可以处理的范围的场景。当新连接请求失败时,驱动程序会请求建立更多连接,以响应部署速度减慢或无法打开新连接的情况。这些连续的请求可能会使部署超载并导致中断。
container
一组软件及其依赖库,它们打包在一起,便于在计算环境之间进行传输。Container 在操作系统上作为划分的进程运行,并且可以被赋予自己的资源限制。常见的 container 技术有 Docker 和 Kubernetes。
竞争因子
尝试修改相同资源(例如文档字段)的多个操作会导致冲突,从而延迟操作。争用因子是与 Queryable Encryption 一起使用的一项设置,用于在内部对加密字段/值对进行分区并优化操作。参见争用。
余弦相似度
使用两个向量之间的角度来确定这些向量之间的相似度的指标。 余弦相似度对向量方向敏感。 在为Atlas Vector Search的向量嵌入创建索引时,可以使用余弦相似度函数。 如果向量已标准化为单位长度,请改用点积相似度函数。
CPU 窃取
CPU 使用率超过保证基线 CPU信用累积率的百分比。 CPU 窃取与在突发策略中依赖信用模型的云提供商相关。 CPU 信用是累积的 CPU 利用率单位。信用以恒定速率累积,以提供有保证的性能水平。您可以使用这些信用来提高 CPU 性能。当信用余额耗尽时, MongoDB仅提供 CPU 性能的保证基线,并将超额部分显示为 窃取百分比。另请参阅相对系统 CPU 利用率、基线 CPU 利用率和突发实例。
CRUD
数据库基本操作的首字母缩写词:创建、读取、更新和删除。请参阅 MongoDB CRUD 操作。
CSV
一种文本数据格式,由逗号分隔的值组成。CSV 文件可用于在关系数据库之间交换数据,因为 CSV 文件具有表格数据。您可以使用 mongoimport 导入 CSV 文件。
cursor
指向查询结果设立的指针。客户端可以遍历游标来检索结果。默认下,未在会话中打开的游标会在10 分钟不活动后自动超时。在会话中打开的游标会随着会话的结束或超时而关闭。请参阅游标。
自定义角色

您可以保存并分配给数据库用户的自定义MongoDB权限操作和MongoDB角色设立。当 Atlas 的内置角色无法描述所需的权限设立时,创建自定义角色。

客户主密钥
用于加密数据加密密钥的密钥。客户主密钥应托管在远程密钥提供程序中。
daemon
后台的非交互式进程。
数据目录
mongod 存储数据文件的文件系统位置。dbPath 指定了数据目录。
数据加密密钥
用于加密 MongoDB 文档中字段的密钥。加密的数据加密密钥存储在密钥保管库集合中。数据加密密钥由客户主密钥加密。
数据资源管理器

在 Atlas 中用于查看集群数据并与之交互的工具。 您还可以使用数据浏览器来管理索引,运行聚合管道来处理数据。

Data Federation

MongoDB 的解决方案,用于使用MongoDB查询语言查询存储在低成本 S 3存储桶、 Atlas集群和HTTP端点中的数据。 分析应用程序可以使用Atlas Data Federation来利用存档数据,满足数据处理需求。

数据文件
存储文档数据和索引。dbPath 选项指定数据文件在文件系统中的位置。
数据摄取管道
使用 RAG 组织和转换数据并将其存储在矢量数据库(例如Atlas)中的工作流。
数据分区
将数据划分为多个范围的分布式系统架构。分片使用分区。请参阅使用数据块进行数据分区。
数据中心可知性
允许客户端根据成员的位置对系统中的成员进行寻址的属性。副本集使用标记实现数据中心感知。查看数据中心感知
database
用于存放集合的容器。每个数据库在文件系统中都有一组文件。一个 MongoDB server 通常拥有多个数据库。
数据库命令
除插入、更新、删除或查询之外的 MongoDB 操作。有关数据库命令的列表,请参阅数据库命令。要使用数据库命令,请参阅发出命令
数据库渗漏
数据库外渗是指授权方从安全系统中获取数据,并与未授权方共享或存储在不安全的系统中。这可能是恶意的或意外的。
数据库分析器
一种工具,启用后会在数据库的 system.profile 集合中保留所有长时间运行的操作的记录。分析器最常用于诊断慢查询。请参阅数据库分析器。
数据库用户

用于验证客户端端访问权限MongoDB 集群的凭证。您可以为数据库用户分配特权,以确定该用户对集群的访问权限级别。数据库用户与Atlas用户不同。数据库用户可以访问权限MongoDB部署,但不能访问Atlas应用程序。

数据库文件路径
MongoDB 数据文件存储的位置。请参阅 dbPath
DDL(数据定义语言)
DDL 包括用于创建和修改集合和索引的命令。
死信队列(DLQ)
死信队列是 Atlas 数据库中的一个集合, 用于存储在接收过程中抛出错误的文档。
专用集群

包含层级M10及更高层级集群的集群类别。

层级
推荐环境

M10M20

  • 开发中

  • 低流量生产

M30 以及更大的

生产

专用配置服务器
一个 mongod 实例,用于存储与分片集群相关的所有元数据。
DEK
数据加密密钥。更多详情,请参阅数据加密密钥。
延迟成员
无法成为主节点并在指定的延迟内应用操作的副本集节点。延迟可用于保护数据免受人为错误的影响(即无意中删除的数据库)或对生产数据库产生不可预见影响的更新。请参阅延迟的副本集节点。
密集向量
大部分或所有维度都包含非零值的数据的数字表示形式。 Atlas Vector Search使用包含更多数据的密集向量来捕获更复杂的关系。
部署
一群组包含您的数据的MongoDB服务器。 Atlas 托管的集群是集群(副本集或分片的集群)。
维度
构成多维空间中数据的特征或属性的组件或元素的数量。 Atlas Vector Search在索引时和查询时最多支持 4096 个维度。
文档
MongoDB 集合中的一条记录,MongoDB 中数据的基本单位。文档类似于 JSON 对象,但以一种类型更丰富的格式(称为BSON)存在于数据库中。请参阅文档
点符号
MongoDB 使用点符号来访问数组的元素以及嵌入式文档的字段。请参阅点符号
点积相似度
衡量多维空间中两个向量之间的相似度,并返回一个标量值。当向量点大致相同的方向时,该标量值为正;当向量点相反的方向时,该标量值为负;当向量没有相似性时,该标量值为零。 Atlas Vector Search支持在搜索最近邻时使用 dotproduct 相似度函数。如果向量标准化为单位长度,则建议使用此相似度函数而不是余弦相似度。
排干
数据块从一个分片删除或“转移”到另一个分片的过程。管理员必须先清空分片,然后再将其从集群中删除。请参阅从分片集群中删除分片
驱动
一种以特定语言与 MongoDB 交互的客户端库。请参阅驱动程序。
持久性
如果一个写入操作在一个或多个服务器进程关闭(或崩溃)和重新启动时仍然持续存在,则该操作就具有持久性。对于单个 mongod 服务器,写入操作在写入服务器的日志文件后被认为具有持久性。对于副本集,当写入操作在大多数投票节点上实现持久性并写入大多数投票节点的日志后,该写入操作被认为具有持久性。
可选举节点
有资格成为副本集主节点 (primary node in the replica set)节点的节点。在选举期间, Atlas会优先考虑最高优先级地区中的节点以获得主节点 (primary node in the replica set)资格。为了确保可靠的选举,整个地区的可选举节点总数必须为3 、5 或7 。
选举
在启动时和出现故障时,副本集的节点选择主节点的进程。请参阅副本集选举
内嵌
用数字大量表示文本、图像、音频、视频等数据,可以将其解释为多维空间中的坐标。 Atlas支持在Atlas 集群中存储嵌入, Atlas Vector Search支持对最多 4096 维度的向量嵌入进行索引和查询。
加密密钥

专门为加密和解密数据而生成的随机位串。

除了Atlas提供的默认静态加密之外, AtlasProject Owners 还可以为其数据配置额外的加密层。项目所有者可以将其与 Atlas 兼容的客户密钥管理提供商与MongoDB加密存储引擎结合使用。

在配置静态加密时,Atlas 支持以下客户密钥管理提供程序:

加密模式
Queryable Encryption中,是指定义哪些字段可查询以及这些字段允许使用哪些查询类型的JSON schema
字节序
在计算中,“字节序”指的是字节的排列顺序。这种排序可以指通过通信介质的传输,或者更常见的是,基于字节的重要性和位置,字节在计算机内存中的排序方式。有关详情,请参阅大端小端。
信封加密
一种加密程序,其中使用数据加密密钥对数据进行加密,数据加密密钥由另一个称为客户主密钥的密钥加密。 加密的密钥作为 BSON 文档存储在一个名为 KeyVault 的 MongoDB 集合中。
欧几里得相似度
使用多维空间中两个向量之间的距离计算相似度的公式。 欧几里得距离对向量的大小敏感。 Atlas Vector Search支持使用 euclidean 相似度函数来索引向量和搜索最近邻。
最终一致性
分布式系统的一种属性,允许逐渐传播对系统的更改。在数据库系统中,这意味着可读成员不需要具有最新的更新。
显式加密
使用正在使用的加密时,请在处理加密数据时明确指定加密或解密操作、KeyID 以及查询类型(针对 Queryable Encryption)或算法(针对客户端字段级加密)。与自动加密相比。
表达式(expression)

解析为值的查询组件。表达式是无状态的,这意味着它们返回一个值而不会改变用于构建表达式的任何值。

在 MongoDB 查询语言中,您可以从以下组件构建表达式:

组件
例子

常量

3

操作符

字段路径表达式

"$<path.to.field>"

例如, { $add: [ 3, "$inventory.total" ] } 是一个由 $add 操作符和两个输入表达式组成的表达式:

表达式返回将 3 添加到输入文档中路径 inventory.total 处的值的结果。

故障切换
发生故障时,允许副本集从节点变为主节点的过程。请参阅自动故障转移
字段
文档中的名称/值对。一个文档具有零个或多个字段。字段类似于关系数据库中的列。请参阅文档结构。
字段路径
文档中字段的路径。要指定字段路径,请使用在字段名称前添加美元符号 ($) 的字符串。
防火墙
一种系统级网络过滤器,用于根据 IP 地址和其他参数来限制访问。防火墙是安全网络的一部分。请参阅防火墙。
免费套餐

免费使用的集群层,可为数据托管提供小规模开发环境。免费集群永不过期,并提供对Atlas特性和功能子集的访问权限。免费集群也可以通过其实例大小 M0 来表示。

fsync

将内存中所有脏页刷新到存储的系统调用。当应用程序写入数据时,MongoDB 将数据记录在存储层。

为了提供持久数据,WiredTiger 使用检查点。有关详细信息,请参阅日志和 WiredTiger 存储引擎

geohash
geohash 值是对坐标网格上位置的二进制表示形式。请参阅 Geohash 值。
GeoJSON
一种基于 JavaScript Object Notation (JSON) 的地理空间数据交换格式。GeoJSON 可用于地理空间查询。有关受支持的 GeoJSON 对象,请参阅地理空间数据。有关 GeoJSON 格式规范,请参阅 https://tools.ietf.org/html/rfc7946#section-3.1
geospatial
与地理位置有关。请参阅地理空间查询
全局集群

具有已定义地理区域的集群,可支持全球分布式应用程序实例和客户端的位置感知读写操作。您可以在 M30 层及更高层级的集群上启用全局分片。

全局写入区域

代表Atlas全球集群分布子集的地理区域。每个Atlas全球集群最多支持 9个不同的全局写入区域。每个区域由一个最高优先级地区和一个或多个可选区域、只读区域或分析区域组成。

可用的地理区域取决于所选的云服务提供商。

GridFS
在 MongoDB 数据库中存储大型文件的惯例。所有官方 MongoDB 驱动程序都支持 GridFS 惯例,mongofiles 程序也是如此。请参阅用于自管理部署的 GridFS。
GROUP
请参阅项目。
groupId
请参阅项目 ID
哈希片键
一种的分片键,它使用分片键字段中值的哈希值将文档在分片集群的成员之间分配。请参阅哈希索引
健康管理器
健康管理器以指定的强度级别健康管理器组件上运行健康检查。健康管理器检查按指定时间间隔运行。健康管理器可以配置为自动将出现故障的 mongos 移出集群。
健康管理器组件
一组功能,经过配置的健康管理器可以运行健康检查。例如,您可以配置健康管理器来自动监控和管理 DNS 或 LDAP 集群健康状况问题。有关详情,请参阅健康管理器组件
隐藏成员
无法成为主节点且对客户端应用程序不可见的副本集节点。请参阅隐藏的副本集节点。
分层 bavigable 小世界图
在多维空间中执行高效最近邻搜索的算法。Atlas Vector Search使用 Hierarchical Navigable Small Worlds 执行 ANN搜索。
高可用性

高可用性是指系统设计具有持久性、冗余性和自动故障转移功能。系统支持的应用程序可以长期无故障运行。根据最佳实践部署时,MongoDB 副本集支持高可用性。

有关副本集部署架构的指导,请参阅副本集部署架构

最高优先级地区

多区域集群中的地区,Atlas 在选举期间优先考虑该地区的主节点资格。

混合搜索
结合不同搜索方法(例如全文搜索和语义搜索)以发挥各自优势的方法。 使用倒数排名融合 (RRF) 等技术组合结果。
idempotent
一个操作多次运行时,相同的输入会产生相同的结果。
影响

Performance Advisor 建议索引的预计性能改进。

内存中排序

在返回输出之前必须在内存中执行的排序。内存排序可能会影响大型数据集的性能。使用索引排序以避免内存排序。

请参阅排序和索引使用,详细了解索引排序操作。

正在使用的加密
一种加密:在数据传输、存储和处理过程中保护数据的安全,并实现对已加密数据进行受支持查询。MongoDB 提供两种“正在使用的加密”方法:Queryable Encryption客户端字段级加密
索引(index)
一种优化查询的数据结构。请参见索引。
索引边界
MongoDB 使用索引运行查询时搜索的索引值范围。要了解详情,请参阅多键索引边界
索引排序
索引提供排序结果的排序。使用索引的排序操作通常比内存中排序性能更好。有关更多信息,请参阅使用索引对查询结果进行排序
init script
Linux 平台的初始化系统用来启动、重启或停止守护进程的 shell 脚本。如果您通过软件包管理器安装 MongoDB,则会在安装过程中为您的系统提供一个初始化脚本。请参阅操作系统的相应安装指南
初始化系统
初始化系统是 Linux 平台上自内核启动后第一个启动的进程,负责管理系统上的所有其他进程。初始化系统使用初始化脚本启动、重启或停止守护进程,例如 mongodmongos。最近的 Linux 版本通常使用 systemd 初始化系统和 systemctl 命令。Linux 旧版本通常使用 System V 初始化系统和 service 命令。请参阅操作系统的安装指南。
初始化同步
将数据从现有副本集节点复制到新的副本集节点的副本集操作。请参阅 初始同步。
意向锁
资源上的,指示锁持有者将使用比具有意向锁的资源更细粒度的并发控制来读取(意向共享)或写入(意向独占)资源。意向锁允许并发读取和写入资源。请参阅 MongoDB 使用哪种类型的锁定?
接口终结点

AWS 具有私有 IP 地址的VPC端点,通过Amazon Web Services PrivateLink 将流量发送到 Atlas 私有端点服务。

中断点
某个操作可以安全终止的时间点。MongoDB 仅在指定的中断点终止操作。请参阅终止正在运行的操作。
IP 访问列表

可访问 Atlas 项目 内集群的 IP 地址和 CIDR 块列表。对于通过公共互联网的客户端连接,Atlas 仅允许从相应项目的 IP 访问列表中的条目连接到集群。 访问列表最多可包含200个条目。

Atlas还支持通过非公共网络进行客户端连接,例如网络对等互连或私有端点。无论IP访问列表如何,这些类型的连接都会正常工作。要学习;了解更多信息,请参阅设置网络对等互连了解Atlas中的私有端点。

IPv6
IP(互联网协议)标准的修订版,具有大地址空间以支持互联网主机。
ISODate
mongosh 用于显示日期的国际日期格式。格式为 YYYY-MM-DD HH:MM.SS.millis
JavaScript
一种脚本语言。mongosh、旧版 mongo Shell 和某些服务器端功能使用 JavaScript 解释器。有关更多信息,请参阅服务器端 JavaScript
journal
一个顺序二进制事务日志,用于在硬中止时使数据库进入有效状态。日志首先将数据写入日志,然后写入核心数据文件。MongoDB 默认为 MongoDB 2.0 及更高版本的 64 位构建启用日志功能。日志文件已预先分配,并作为文件存在于 数据目录 中。请参阅 日志。
JSON
JavaScript Object Notation。一种纯文本格式,用于表达结构化数据,并支持多种编程语言。有关更多信息,请参阅 http://www.json.org。某些 MongoDB 工具以 JSON 格式渲染 MongoDB BSON 文档的近似值。请参阅 MongoDB 扩展 JSON (v2)
JSON文档
JSON 文档是结构化格式的字段和值的集合。有关示例 JSON 文档,请参阅 http://json.org/example.html
JSONP
JSON with Padding(带填充的 JSON)。指一种将 JSON 注入到应用程序中的方法。存在潜在的安全问题
巨型块
增长超过指定数据块大小且无法分割为更小数据块的数据块。有关详细信息,请参阅不可分割/巨型数据块
K 最近邻搜索
给定具有定义的相似度函数 S 的点设立P ,对于查询点q ,查找 P 中具有最佳 S*(*p , q ) 值的 k 个点的设立。Atlas Vector Search ENN搜索返回精确的前 k 个点,ANN搜索返回与 q 相似的 k 个点,但不一定是与 q 最相似的 k 个点。
密钥材料
加密算法用于加密和解密数据的随机位串。
密钥保管库集合
一个 MongoDB 集合,可将加密的数据加密密钥存储为 BSON 文档。
LDAP
验证用户身份并授权用户访问集群数据的跨平台协议。您可以使用 Atlas,通过 TLS 使用自己的 LDAP 服务器管理来自所有 MongoDB 客户端的用户身份验证和授权。一个 LDAPS 配置适用于 Atlas 项目中的所有集群。
最低权限
一种授权策略,仅为用户授予该用户的工作所需的访问权限。
传统坐标对
MongoDB 2.4 版之前用于地理空间数据的格式。这种格式将地理空间数据存储为平面坐标系上的点(例如 [ x, y ])。请参阅地理空间查询。
线串(LineString)
线串(LineString)是包含两个或更多位置的数组。如 GeoJSON LineString 规范所述,具有四个或更多位置的封闭线串称为线环 (LinearRing):https://tools.ietf.org/html/rfc7946#section-3.1.4。要在 MongoDB 中使用线串,请参阅 GeoJSON 对象
链接令牌(Link-Token)

字符串其中包含在从 Cloud Manager 或 Ops Manager 部署 实时迁移到 Atlas 中的集群期间从 Cloud Manager 或 Ops Manager 连接到 Atlas 所需的信息。

当准备好从 Cloud Manager 或 Ops Manager 部署实时迁移数据时,您可以在 Atlas 中生成链接令牌, 然后将其输入到 Cloud Manager 或 Ops Manager 组织的设置中。您使用相同的链接令牌, 按顺序逐个迁移 Cloud Manager 或 Ops Manager 组织中的每个部署。 您可以在 Atlas 中生成多个链接令牌。 为每个 Cloud Manager 或 Ops Manager 组织使用一个唯一的链接令牌。

小端

一种字节顺序,多字节数据值的最低有效字节(小端)存储在最低内存解决。

小端示例图
点击放大
实时迁移

将现有源副本集或分片集群无缝移动到 Atlas 的进程。 在实时迁移进程中, Atlas 使目标集群与远程源保持同步, 直到您将应用程序切换到 Atlas 集群。 Atlas 提供两种实时迁移模式:

  • 推送实时迁移,在 Atlas 用户界面中称为 Live Migration from Ops Manager or Cloud Manager,即 Atlas 将部署从 Cloud Manager 或 Ops Manager 推送到 Atlas。

  • 拉取实时迁移,在 Atlas 用户界面中称为 General Live Migration(一般实时迁移),即 Atlas 将部署从云或本地部署拉取到 Atlas。

MongoDB 使用锁确保并发性不会影响正确性。MongoDB 使用读锁写锁意向锁。有关更多信息,请参阅 MongoDB 使用哪种类型的锁?
日志文件
包含服务器事件,例如传入连接、运行的命令以及遇到的问题。有关详细信息,请参阅日志消息
LVM
逻辑卷管理器。逻辑卷管理器是一个从物理设备中提取磁盘映像的程序,并提供许多对系统管理有用的原始磁盘操作和快照功能。有关逻辑卷管理器和 MongoDB 的信息,请参阅在 Linux 上使用逻辑卷管理器进行备份和恢复
维护窗口

Atlas应开始对集群进行每周维护的日期和时间。您可以在“项目设置”中设立维护窗口。

重要

维护窗口注意事项

紧急维护活动安全补丁等紧急维护活动不能等待您选择的窗口。Atlas将在需要时启动这些维护活动。

持续维护操作为集群安排维护后,在当前维护工作完成之前,您无法更改维护窗口。

维护需要复制集选举Atlas执行维护的方式与MongoDB手册中描述的维护过程相同。此过程需要在每个副本集的维护窗口期间至少进行一次副本集选举

维护尽可能接近小时开始维护总是尽可能接近计划时间开始,但正在进行的集群更新或意外的系统问题可能会延迟开始时间。

map-reduce
一种聚合过程,由选择数据的“映射”(map) 阶段和转换数据的“缩减”(reduce) 阶段组成。在 MongoDB 中,您可以使用 map-reduce 对数据运行任意聚合。有关 map-reduce 的实现,请参阅 Map-Reduce。有关聚合的所有方法,请参阅聚合操作。
映射类型
编程语言中将键与值相关联的结构。键可以包含嵌入的键和值对(例如,字典、哈希、映射和关联数组)。这些结构的属性取决于语言规范和实施。通常,映射类型中键的顺序是任意的,不保证一致性。
MD5
一种哈希算法,可计算所提供数据的校验和。该算法会返回一个唯一值来识别数据。MongoDB 使用 md5 来识别 GridFS 的数据块。请参阅 filemd 5。
平均数
一组数字的平均值。
中位数
在数据集中,中位数是百分位数值,其中 50% 的数据小于或等于该值。
成员
一个单独的 mongod 进程。一个副本集有多个成员。成员也称为节点
metadata collection
可查询加密中,MongoDB 使用内部集合来支持对加密字段的查询。请参阅元数据集合
MIME
多用途互联网邮件扩展。一组标准的类型和编码定义,用于声明多个数据存储、传输和电子邮件上下文中的数据编码和类型。mongofiles 工具提供了一个选项,用于指定 MIME 类型以描述插入到 Grid FS 存储空间中的文件。
模式
一组数字中出现次数最多的数字。
mongo

旧版 MongoDB shell。mongo 进程将旧版 Shell 作为连接到 mongodmongos 实例的守护进程启动。Shell 有一个 JavaScript 接口。

从 MongoDB v 5.0 开始,mongo 已被弃用,mongosh 取代 mongo 成为客户端 shell。 请参阅 mongosh

mongod
MongoDB 数据库服务器。mongod 进程将 MongoDB 服务器作为守护进程启动。MongoDB 服务器管理数据请求和后台操作。参见 mongod
MongoDB Charts

Atlas 数据的可视化工具。您可以从 Atlas 集群中 启动 MongoDB Charts,并使用 MongoDB Charts 应用程序 查看数据,开始将数据可视化。

mongos
MongoDB 分片集群查询路由器。mongos 进程将 MongoDB 路由器作为守护进程启动。MongoDB 路由器充当应用程序和 MongoDB 分片集群之间的接口,负责处理集群上的所有路由和负载平衡。请参阅 mongos 实例。
mongosh

MongoDB Shell。mongoshmongodmongos 实例提供 shell 接口。

从 MongoDB v5.0 开始,mongosh 取代 mongo 成为首选 Shell。

多区域集群

跨多个地理区域的 Atlas 集群。多区域集群可将应用程序查询路由到最合适的地理区域,从而提高可用性和性能。

多区域集群必须包含可选举节点

多区域集群可能包含只读节点分析节点

namespace
命名空间是数据库名称和集合或索引名称的组合:<database-name>.<collection-or-index-name>。所有文档都属于一个命名空间。请参阅命名空间
命名空间见解

用于监控集合级查询延迟的 Atlas 工具。 您可以查看某些主机和操作类型的查询延迟指标和统计信息。 管理固定的命名空间,并选择最多五个命名空间以显示在相应的查询延迟Atlas Charts中。

自然顺序

创建订单 recordIds 并将其存储在 WiredTiger 索引中。在单个实例上运行集合扫描时,默认排序顺序为自然顺序。

在副本集中,自然顺序不能保证一致,并且在节点之间可能不同。

在分片集合中,自然顺序没有定义。但是,使用 $natural 仍会强制每个分片执行集合扫描。

详情请参阅 $natural按自然顺序返回

网络分区

一种网络故障,将分布式系统分为多个分区,导致一个分区中的节点无法与另一个分区中的节点进行通信。

有时是部分分区或不对称分区。部分分区的一个示例是将网络的节点分为三个节点集,其中第一个节点集的成员无法与第二个节点集的成员通信,反之亦然,但所有节点都可以与第三个节点集的成员通信。

在不对称分区中,只有当通信源自某些节点时,才可能进行通信。例如,分区一端的节点只有在发起通信信道时才能与另一端通信。

网络对等连接

两个互联网络连接并交换流量的进程。您可以直接将自己的 VPC 与为 MongoDB 集群创建的 Atlas VPC 对等互连。使用网络对等互连,您的应用程序服务器可以直接连接到 Atlas,同时与公共网络保持隔离。

node
单独的 mongod 进程。一个 副本集有多个节点。节点也称为结点
noop
无操作 (noop) 是一种 I/O 操作调度程序,它根据先进先出队列为传入进程分配 I/O 带宽。
NVMe
NVMe(非易失性内存主机控制器接口规范)是一种用于访问高速存储媒体的协议。
NVMe 存储

可用于 AWS 上托管的 M40+ 集群

对于需要低延迟和高吞吐量 IO 的 AWS 托管应用程序,您可以使用 NVMe 集群类。NVMe 集群类利用独特的数据协议,显著提高了数据访问速度。

NVMe 集群使用一个隐藏的从节点,该节点由一个具有高吞吐量和 IOPS 的预配卷组成,以方便备份。

对象标识符
参阅ObjectId
ObjectId
一个 12 字节的 BSON 类型,在一个集合内是唯一的。ObjectId 是使用时间戳、计算机 ID、进程 ID 和进程本地递增计数器生成的。MongoDB 使用 ObjectId 值作为 _id 字段的默认值。
操作日志
请参阅 oplog。
操作元数据
有关进程执行情况而非其内容的信息,如插入、更新和删除操作的次数和时间。
操作拒绝过滤器
被拒绝的查询结构。有关更多详细信息,请参阅使用操作拒绝过滤器阻止慢速查询。
ops/sec
请参阅 optime。
操作节点
Atlas 集群中的任何可选举节点只读节点
运算符
$ 开头的关键字,用于表示更新、复杂查询或数据转换。例如,$gt 是查询语言的“大于”操作符。有关可用的操作符,请参阅操作符。
oplog
一个固定大小集合,用于存储对 MongoDB 数据库的逻辑写入的有序历史记录。Oplog 是 MongoDB 中实现复制的基本机制。请参阅副本集 Oplog。
oplog 缓冲区集合

重新分片操作期间创建的临时集合,它可用于存储来自捐赠分片的 oplog 条目。

Oplog 缓冲区集合确保当从捐赠分片删除 oplog 条目时,接收分片仍然可以访问这些条目。重新分片完成后,Oplog 缓冲区集合会被删除。

oplog hole
由于 oplog 写入未按顺序,因此 oplog 中出现临时缝隙。副本集主节点将 oplog 条目作为批处理操作并行应用。因此,批处理中尚未写入的条目可能会在 oplog 中出现临时缝隙。
oplog 窗口
oplog 条目带有时间戳。oplog window 是 oplog 中最新和最旧时间戳之间的时间差。如果从节点与主节点失去连接,则只有在 oplog window 内恢复连接后,它才能使用复制再次进行同步。
ops/sec

对复制 oplog 中位置的引用。optime 值是一个包含以下内容的文档:

  • ts,操作的时间戳

  • t,最初在主节点上生成操作的term

有顺序的查询计划
一种查询计划,其返回结果的顺序与 sort() 顺序一致。请参阅查询计划
组织

Atlas 项目的逻辑群组。您可以利用组织来管理其中所包含项目的账单、用户和安全设置。

  • 计费在组织层面进行,同时保持对每个项目使用情况的可见性。

  • 您可以查看组织内的所有项目。

  • 您可以使用团队将组织用户批量分配给组织内的项目。

提示

组织 ID
24string用于标识Atlas 组织 的唯一 位十六进制 。返回所有组织端点返回执行API调用的经过身份验证的用户可以访问的所有组织的 ID。
孤立游标
应用程序代码中未正确关闭或迭代的游标。孤立游标可能导致 MongoDB 部署中出现性能问题。
孤立文档

在分片集群中,孤立文档是指位于某个分片上但同时以数据段形式存在于其他分片上的文档。这是由于异常关闭导致的迁移失败或迁移清理不完整造成的。

数据块迁移完成后,会自动清理孤立文档。您不再需要运行 cleanupOrphaned 来删除孤立文档。

消极成员
副本集的节点,由于其 members[n].priority0,因此其无法成为主节点。请参阅 优先级 0 副本集节点。
per-CPU cache
一种为特定 CPU 核心本地存储内存的缓存。每 CPU 缓存由新版本的 TCMalloc 使用,该版本在 MongoDB 8.0 中引入。
每线程缓存
一种在本地存储每个应用线程内存的高速缓存。每线程缓存由旧版 Tcmalloc 使用,该版本用于 MongoDB 7.0 及更早版本。
百分位数
在数据集中,百分位数是指数据百分比等于或低于指定值的值。有关详细信息,请参阅计算注意事项
性能顾问

Atlas工具,用于监控集群上执行的慢速查询,并建议使用索引来提高查询性能。Performance Advisor建议的每个索引都包含一个影响分数,表明该索引将带来的潜在性能改进。

PID
一种进程标识符。类 UNIX 系统将为每个正在运行的进程分配一个唯一整数 PID。您可以使用 PID 来检查正在运行的进程并向其发送信号。请参阅/proc文件系统。
管道
类 Unix 系统中的一种通信通道,允许独立进程发送和接收数据。在 UNIX Shell 中,管道操作允许用户将一个命令的输出定向到另一个命令的输入。
管道
聚合中的一系列操作。请参阅聚合管道
计划缓存查询结构

查询谓词、排序、投影排序规则的组合。计划缓存查询结构允许 MongoDB 识别等效查询并分析其性能。

对于查询谓词,仅使用谓词结构和字段名称。不使用查询谓词中的值。例如,查询谓词 { type: 'food' } 等同于 { type: 'drink' }

要识别具有相同计划缓存查询结构的慢速查询,每个计划缓存查询结构都有一个十六进制的 planCacheShapeHash 值。更多信息请参见 planCacheShapeHash 和 planCacheKey。

从MongoDB 8.0 开始,现有的 queryHash字段将复制到名为 planCacheShapeHash 的新字段中。 如果您使用的是早期MongoDB版本,则只能看到 queryHash字段。 未来的MongoDB版本将删除已弃用的 queryHash字段,您需要改用 planCacheShapeHash字段。

如 GeoJSON Point 规范中所述的单一坐标对:https://tools.ietf.org/html/rfc7946#section-3.1.2。要在 MongoDB 中使用点,请参阅 GeoJSON 对象
多态

LinearRing 坐标数组中的一个数组,如 GeoJSON Polygon 规范中所述:https://tools.ietf.org/html/rfc7946#section-3.1.6。对于有多个环的多边形,第一个环必须是外环,其他环必须是内环或孔。

MongoDB 不允许外环自相交。内环必须完全包含在外边界内,并且不能彼此相交或重叠。请参阅 GeoJSON 对象。

后图像文档
插入、替换或更新后的文档。请参阅提供文档前像和后像的变更流
powerOf2Sizes
每个集合的设置,为每个文档分配空间,最大限度地重复使用存储空间并减少碎片。powerOf2SizesTTL 集合的默认设置。如要更改集合设置,请参阅 collMod
前图像文档
被替换、更新或删除之前的文档。请参阅带文档前像和后像的变更流
预分片
在插入数据之前执行的一项操作,它可将可能的分片键值范围划分为若干数据块,从而实现轻松插入和高写入吞吐量。在某些情况下,预分片可通过手动划分集合而不是等待 MongoDB 负载均衡器操作,以便加快分片集群中文档的初始分发。请参阅在分片集群中创建范围
前缀压缩
通过在内存的每个页面中仅存储一次所有相同的索引键前缀,从而降低内存与磁盘的使用量。请参阅压缩以了解有关 WiredTiger 压缩行为的更多信息。
主节点
副本集中,主节点是接收所有写入操作的成员。请参阅主节点。
主键
记录的唯一不可变标识符。在 RDBMS 软件中,主键通常是存储在每行的 id 字段中的整数。在 MongoDB 中,_id 字段存储文档的主键,通常是 BSON ObjectId
主分片
分片集群中的每个数据库都有一个主分片。它是数据库中所有未分片集合的默认分片。请参阅主分片。
优先级
一个可配置的值,可帮助确定副本集中的哪些成员最有可能成为主节点。参见 members[n].priority
特权
指定资源和允许对该资源执行的操作的组合。请参阅特权。
项目

群组进行逻辑分组。一个项目中可以有多个集群,一个组织中可以有多个项目。

注意

项目是的同义词。

项目 ID

24string用于标识Atlas 项目 的唯一 位十六进制 。获取所有项目API端点返回执行 API 调用的经过身份验证的用户可以访问的所有项目的 ID。

注意

项目 ID 与群组 ID同义。

投影
提供给查询的文档,用于指定 MongoDB 在结果集中返回哪些字段。有关投影的更多信息,请参阅投影要从查询中返回的字段项目操作符
量化
将向量中各个维度的值压缩到较小范围以减少资源消耗并提高速度的方法。 Atlas Vector Search支持对量化向量进行索引和查询。
查询
一个读请求。MongoDB 使用 JSON 形式的查询语言,其中包括名称以 $ 字符开头的查询操作符。在 mongosh 中,您可以使用 db.collection.find()db.collection.findOne() 方法运行查询。请参阅查询文档。
查询框架
处理操作的查询优化器和查询执行引擎的组合。
查询运算符
查询中以 $ 开头的关键字。例如,$gt 是“大于”运算符。有关查询运算符的列表,请参阅查询运算符。
查询优化器
生成查询计划的过程。对于每个查询,优化器都会生成一个计划,该计划将查询与索引进行匹配,以尽可能高效地返回结果。优化器在每次查询运行时重复使用该查询计划。如果集合发生重大更改,优化器将创建新的查询计划。请参阅查询计划
查询计划
查询规划器选择的最有效的执行计划。更多详细信息,请参阅查询计划
查询谓词。

返回布尔值的表达式,该布尔值指示文档是否与指定的查询匹配。例如, { name: { $eq: "Alice" } } 会返回具有字段 "name" 且其值为字符串 "Alice" 的文档。

查询谓词可以包含子表达式和操作符,以实现更复杂的匹配。要查看可用的查询操作符,请参阅查询和投影操作符。

Query Profiler
用于诊断和监控集群性能问题的 Atlas 工具。 查询分析器可以显示长期运行的查询 及其性能统计信息。您可以过滤 查询分析器返回的数据,专注于特定的命名空间和操作类型。
查询结构
查询结构是对类似查询进行分组的一组规范。有关详细信息,请参阅查询结构
范围
一个数据块中连续的分片键值范围。数据范围包括下边界,不包括上边界。当某个分片包含的集合数据相对其他分片太多时,MongoDB 会迁移数据。请参阅使用数据块进行数据分区分片集群负载均衡器
RDBMS
关系数据库管理系统。基于关系模型的数据库管理系统,通常使用 SQL 作为查询语言。
读关注 (read concern)
指定读操作的隔离级别。例如,您可以使用读关注来仅读取已传播到副本集多数节点的数据。请参阅读关注
读锁
资源(例如集合或数据库)上的共享,在持有该锁时,允许并发读取但不允许写入。请参阅 MongoDB 使用哪种类型的锁定?
读取偏好
决定客户端如何引导读取操作的设置。读取偏好会影响所有副本集,包括分片副本集。默认情况下,MongoDB 将读取操作引导至主节点。但是,您也可以将读取操作引导至从节点,以实现最终一致的读取。请参阅读取偏好
只读节点
专用地理区域中的副本集,用于补充可选举节点区域。您可以使用只读节点将数据副本存储在最常被读取的位置,以提高性能。
实时性能面板

Atlas 监控服务,可显示当前网络流量、集群上的数据库操作以及有关主机的硬件统计信息。使用 RTPP,直观地评估查询执行时间,监控网络活动,并发现副本集辅助成员潜在的复制延迟。

召回
测量 ANN搜索返回的真正最近邻的比例。该指标反映了算法与新奥搜索结果的接近程度。符号 Recall@k 是指衡量Atlas Vector Search返回的前 k 个结果中存在多少真正的最近邻。
恢复
副本集节点状态,表明节点尚未准备好开始从节点或主节点的正常活动。恢复节点不可用于读取。
相对系统 CPU 利用率

相对于分配给云实例的基准 CPU 量的 CPU 利用率。您可以通过将绝对系统 CPU 利用率除以分配给云实例的基准 CPU 量来计算相对系统 CPU 利用率。

MongoDB将相对系统 CPU 利用率的上限限制为 100%。当云提供商限制云实例的 CPU 利用率,或将实例的 CPU 利用率突增至高于该实例可用的 CPU 基准量时,相对系统 CPU 值为 100%。

另请参阅绝对系统 CPU 利用率和可突发实例。

复制集
维护相同数据集的 MongoDB 服务器群组。 副本集提供冗余和高可用性,是所有生产部署的基础。
复制
该功能允许多个数据库服务器共享相同数据。复制可确保数据冗余并实现负载均衡。请参阅复制。
复制延迟
主节点 oplog 最后一个操作与特定从节点最后一个操作之间的时间段。您通常希望尽可能缩短复制延迟时间。请参阅复制延迟
常驻内存
当前存储在物理 RAM 中的应用程序内存的子集。常驻内存是虚拟内存的一个子集,它包括映射到物理 RAM 和存储的内存。
resource
数据库、集合、一组集合或集群。权限允许对指定资源进行操作。请参阅资源
角色
一组特权,允许操作指定资源。分配给用户的角色决定了用户对资源和操作的访问权限。请参阅安全性。
rollback
恢复写入操作以确保所有副本集节点的一致性的过程。请参阅副本集故障转移期间的回滚。
滚动重启
按顺序重启集群中所有节点的进程。为了保持集群可用性,Atlas 从从节点开始,每次重启一个节点。Atlas 始终保持一个主节点,直到滚动重启完成。
标量量化
标量量化涉及为每个维度的分段内所有索引向量选择最小值和最大值,并在它们之间生成相等大小的分箱。 每个维度到 bin 的映射都会产生新的量化值。 Atlas Vector Search支持 float32 向量的自动标量量化,以及从嵌入提供程序对标量量化向量的摄取和索引。
从节点
复制主数据库内容的副本集成员。从节点成员可以运行读取请求,但只有主节点成员可以运行写入操作。请参阅从节点。
二级索引
一种数据库索引,最大限度地减少查询引擎为运行查询而必须执行的工作量,从而提高查询性能。请参见索引。
从节点
参见从节点。也称为二级节点。
种子列表
驱动程序和客户端(如 mongosh)为副本集配置的初始发现而使用种子列表。种子列表可以作为 host:port 对列表提供(请参阅标准连接字符串格式)或通过 DNS 条目提供。有关更多信息,请参阅 SRV 连接格式
自管理(Self-managed)
由个人或组织而不是外部管理或第三方服务(例如 MongoDB Atlas )设立和维护的 MongoDB 实例。
语义搜索
搜索与查询具有相似含义的值。 即使没有词汇重叠,语义搜索也能捕捉单词或短语之间的自然关系。 语义搜索和向量搜索通常互换使用。 Atlas Vector Search支持对Atlas集群中存储的矢量数据进行语义搜索。
集名称
为副本集指定的任意名称。副本集的所有成员必须具有相同名称,该名称通过 replSetName 设置或 --replSet 选项指定。
分片
单个 mongod 实例或副本集,用于存储分片集群总数据集中某些部分。通常,在生产部署中,确保所有分片都是副本集的一部分。请参阅分片。
片键
MongoDB 用来在分片集群的节点间分发文档的字段。请参阅分片键
分片集群
包含分片 MongoDB 部署的一组节点。分片群集由配置服务器、分片和一个或多个 mongos 路由进程组成。请参阅分片集群组件
分片
一种按键范围对数据进行分区并将数据分布于两个或更多数据库实例的数据库架构。分片可以实现水平扩展。请参阅分片。
共享集群

包含M0 (免费套餐)层级集群的集群类别。共享集群通常用于开发和小规模生产工作负载。

shell 助手
mongosh 中的一种方法,可为数据库命令提供更简洁的语法。 Shell 助手改进了总体交互体验。请参阅mongosh方法。
相似度函数
衡量两个向量之间的相似度。 Atlas Vector Search支持 euclideancosinedotProduct 相似度函数。
单主复制
一种复制拓扑结构,其中只有一个数据库实例接受写入。单主复制可确保一致性,是 MongoDB 采用的复制拓扑结构。请参阅副本集主节点。
snappy
压缩/解压缩库,平衡高效计算要求与合理的压缩率。Snappy 是 MongoDB 使用 WiredTiger 的默认压缩库。有关更多信息,请参阅 SnappyWiredTiger 压缩文档
snapshot
快照mongod 实例中某一特定时间点的数据副本。您可以检索整个集群或副本集的快照元数据,或者集群中单个配置服务器的快照元数据。
softIRQ
CPU 利用率指标,反映云实例当前用于进程软件中断请求的 CPU 比例。在某些云提供商上,此指标可用于跟踪突发实例上的 CPU 利用率。
排序键
对字段进行排序时所比较的值。要了解 MongoDB 如何确定非数字字段的排序键,请参阅比较/排序顺序
拆分
分片集群数据块之间的划分。请参阅使用数据块进行数据分区。
SQL
结构化查询语言 (SQL) 用于与关系数据库进行交互。
固态硬盘
固态硬盘。一种高性能存储,它通过固态电子器件实现持久性,而不是通过机械硬盘所使用的旋转盘片和可移动读/写头。
stale read
过时读取是指在事务过程中读取到、已被其他事务修改但尚未提交到数据库的过时数据。
单节点

mongod 的一个实例,作为单个服务器运行,且不是副本集一部分运行。如要将独立实例转换为副本集,请参阅将独立自管理 mongod 转换为副本集。

注意

一个独立运行的实例,不是只有一个节点的副本集。

储藏集合

重新分片操作期间,在接收者分片上为每个捐赠者分片创建的临时集合。

储藏集合会临时保存因操作冲突而无法立即插入的文档。例如,如果某个文档的分片键已更新,而它现在属于其他分片,因而对该文档所应用操作的顺序可能会变得不明确。接收者会将这些文档存储在储藏集合中,直到它能按正确顺序应用操作为止。

降级

副本集的节点会取消自己的主节点身份,成为节点。

  • 如果副本集与主节点失去联系,则从节点会选举新的主节点。当旧的主节点获知选举结果时,它会降级并作为从节点重新加入副本集。

  • 如果用户运行 replSetStepDown 命令,主节点将降级,并强制副本集选举新的主节点。

存储引擎
数据库中负责管理内存和磁盘中数据存储和访问方式的部分。不同存储引擎的性能表现因工作负载而异。有关 MongoDB 中内置存储引擎的具体详细信息,请参阅适用于托管部署的存储引擎
存储顺序
请参阅自然顺序。
严格一致性
分布式系统的一个属性,要求所有节点都包含系统的最新变更。在数据库系统中,这意味着可以提供数据的任何系统都必须包含最新写入内容。
主题备用名称
主题备用名称 (SAN) 是 X.509 证书的扩展项,允许使用 IP 地址和域名等值的数组来指定单个安全证书可以保护的资源。
同步
一种副本集操作:节点从主节点复制数据。同步首先发生在 MongoDB 创建或恢复节点时,称为初始同步。接着同步持续进行,以使该节点随时了解副本集数据的变化。请参阅副本集数据同步。
syslog
在类 UNIX 系统上,为服务器和进程提交日志信息提供统一标准的一种日志记录进程。MongoDB 提供将输出发送到主机的系统日志系统的选项。参见 syslogFacility
tag

应用于副本集节点的标签,由客户端用来执行数据中心感知操作。有关对副本集使用标签的更多信息,请参阅读取偏好标签集列表。

注意

分片集群区域替换标签。

tag set
包含零个或多个标签的文档。
可追加游标
对于固定大小集合,可跟踪游标是指在客户端用完初始游标中的结果后仍保持打开状态的游标。当客户向固定大小集合集合中插入新文档时,可移动游标会继续检索文档。
团队
同一组织中的 Atlas 用户群组。您可以使用团队,为跨越多个项目的同一组 Atlas 用户授予访问权限。团队中的所有用户享用相同的项目访问权限。
任期
对于副本集的节点,这是一个单调递增的数字,对应于一次选举尝试。
时间序列集合
有效存储一段时间内的测量序列的集合。请参阅时间序列。
拓扑结构

MongoDB 实例的部署状态。包括:

事务
一系列读取或写入操作。有关详细信息,请参阅事务。
事务协调器
MongoDB 的一个组件,用于管理副本集分片集群中的事务。它可以协调跨节点多文档事务的执行和完成,并支持按原子操作来处理复杂操作。
制表符分隔值 (TSV)
一种基于文本的数据格式,由制表符分隔的值组成。这种格式通常用于关系数据库之间的数据交换,因为该格式非常适合处理表格数据。您可以使用 mongoimport 导入 TSV 文件。
TTL
生存时间 (TTL) 是在给定信息过期或系统将其删除之前保留在缓存或其他临时存储中的到期时间或期限。MongoDB 具有 TTL 集合功能。请参阅通过设置 TTL 使集合中的数据过期
无界数组
随着时间推移不断变大的数组。如果文档字段值是一个无界数组,该数组可能会对性能产生负面影响。通常,设计的模式需要避免无界数组。
唯一索引
在单个集合中为特定字段实施唯一性的索引。请参阅唯一索引
unix epoch
世界标准时间 1970 年 1 月 1 日 00:00:00。常用于表示时间,即从该时间点开始计算的秒数或毫秒数。
无序查询计划
一种查询计划,其返回结果的顺序与 sort() 顺序不一致。请参见查询计划。
更新插入

用于更新操作的选项。例如:db.collection.updateOne()db.collection.findAndModify()。如果 upsert 为true ,则更新操作执行以下任一操作:

  • 更新与查询匹配的文档。

  • 或者,如果没有匹配的文档,则插入一个新文档。新文档具有在更新操作中指定的字段值。

有关 upsert 的更多信息,请参阅若没有匹配文档则插入新文档 (Upsert)

向量数据库
系统,用于存储向量嵌入和相关元数据,并启用对存储的向量嵌入的最近邻搜索。 您可以使用Atlas作为向量数据库,并使用Atlas Vector Search对存储的向量嵌入执行向量搜索。 您可以使用向量数据库来实现RAG
向量索引
可有效处理最近邻搜索查询的数据结构。Atlas Vector Search支持创建类型为 vector 的索引,以便为运行$vectorSearch 查询的字段索引。
Vector Search
对存储在向量索引中的向量设立执行 k 最近邻搜索的方法。Atlas Vector Search支持针对 k 个最近邻的 ANN ENN搜索。
虚拟内存
应用程序的工作内存,通常驻留在磁盘和物理 RAM 中。
WGS84
MongoDB 处理 GeoJSON 对象的地理空间查询时,默认采用的参考系和大地基准面,用于在类似地球的球面上进行几何计算。请参阅“EPSG:4326: WGS 84”规范:http://spatialreference.org/ref/epsg/4326 /
窗口操作符
返回集合中一系列文档的值。参见窗口运算符
工作集
MongoDB 最常使用的数据。
写入安全机制
指定写入操作是否已成功。写关注允许应用程序检测插入错误或不可用的 mongod 实例。对于副本集 ,您可以配置写关注以确认复制到指定数量的节点。请参阅写关注。
写冲突 (write conflict)
两个并发操作(其中至少有一个是写入操作)尝试使用一个资源,这种情况违反了使用乐观并发控制的存储引擎的约束条件。MongoDB 会自动结束并重试其中一个冲突的写入操作。
写锁
对资源(例如集合或数据库)的独占。进程写入资源时,会使用独占写锁来防止其他进程写入或读取该资源。有关锁的更多信息,请参阅常见问题解答:并发。
zlib
较之 MongoDB 会使用 snappy,此数据压缩库可提供更高的压缩率,但会消耗更多的 CPU。您可以配置 WiredTiger 以将 zlib 作为其压缩库。有关详细信息,请参阅 http://www.zlib.netWiredTiger 压缩文档
区域
基于给定分片集合的分片键值范围的文档分组。分片集群中的每个分片都可以位于一个或多个区域中。在均衡集群中,MongoDB 仅将区域覆盖的读取和写入定向到该区域内的那些分片。有关更多信息,请参阅区域手册页面。
zstd
一种数据压缩库,与 zlib 相比可提供更高的压缩率和更低的 CPU 使用率。

后退

错误代码