Elasticsearch 可搜索快照

最新推荐文章于 2025-07-16 10:36:28 发布

原创最新推荐文章于 2025-07-16 10:36:28 发布 · 478 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#elasticsearch #大数据 #big data

Elastic Stack 专栏收录该内容

30 篇文章

订阅专栏

可搜索快照是一种经济高效的解决方案，用于存储和检索不常访问的历史数据。这种技术减少了对本地存储的需求，降低了运营成本。通过挂载快照，Elasticsearch可以在不需要副本的情况下管理索引，当节点故障时，可以从存储库恢复数据。适用于AWSS3、谷歌云存储等不同存储库。可搜索快照依赖于可靠的存储库，以防止数据丢失，确保数据可靠性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

可搜索快照可以让快照以非常经济高效的方式搜索不常访问的只读数据。Cold tier 和 frozen tier 使用可搜索的快照来降低存储和运营成本。

可搜索的快照不需要分片副本，理想情况下，可为数据存储节省一半所需的本地存储空间。可搜索快照依赖于已用于备份的相同快照机制，并且对快照存储库存储成本的影响最小。

可搜索快照非常适合管理大量历史数据存档。历史信息的搜索频率通常低于最近的数据，因此可能不需要副本来获得性能优势。对于更复杂或更耗时的搜索，可以结合异步搜索一起使用。

1 支持的存储库

2 挂载快照

POST /_snapshot/my_backup/snapshot_1/_mount?wait_for_completion=true 
{
  "index": "product",
  "renamed_index": "product_bak",
  "index_settings": {
    "index.number_of_replicas": 0
  }
}

3 工作原理

如果持有其中一个分片的节点出现故障，Elasticsearch 会自动将受影响的分片分配到另一个节点上，该节点会从存储库中恢复相关的分片数据。不需要副本，也不需要复杂的监控或编排来恢复丢失的分片。虽然可搜索快照索引默认没有副本，但可以通过调整 index.number_of_replicas. 可搜索快照分片的副本通过从快照存储库复制数据来恢复，就像可搜索快照分片的主分片一样。相反，常规索引的副本是通过从主索引复制数据来恢复的。

当从快照挂载索引时，Elasticsearch 会将其分片分配给集群内的数据节点。然后，数据节点会根据指定的挂载选项，自动将存储库中的相关分片数据检索到本地存储中。如果可能，搜索使用本地存储中的数据。如果数据在本地不可用，Elasticsearch 会从快照存储库下载它需要的数据。

4 可靠性

可搜索快照索引中数据依赖于存储在存储库中的底层快照拷贝。如果存储库故障或快照内容损坏，那么数据就会丢失。尽管 Elasticsearch 可能已将数据副本复制到本地存储中，但这些副本可能不完整，并且无法在存储库故障后用于恢复任何数据。您必须确保您的存储库是可靠的，并且可以防止数据在存储库中静止时损坏。