elasticsearch-倒排索引

倒排索引是Elasticsearch(ES)的核心数据结构,用于快速查找包含特定标签的用户。它将标签作为Term,与包含该标签的用户信息关联,从而避免遍历所有用户。然而,查询用户的所有标签时,倒排索引效率较低,这时doc_value发挥作用,它按用户聚合信息,支持更高效的聚合、排序和脚本操作。doc_value使得在ES中处理复杂查询和数据检索更为高效。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

倒排索引

倒排索引是ES核心数据结构之一。

试想这样一个场景。我给不同的用户打标签,最终我需要根据标签找到哪些用户包含这些标签。

如果使用关系型数据库存储用户标签信息,我需要遍历每一个用户,最终得到想要的结果。ES使用倒排索引的数据结构,只需要一次,就可以得到结果。

数据结构

在这里插入图片描述
Term就是我的标签名,后面跟着包含这个标签的用户信息。我只需要找到对应标签,所有包含该标签的用户信息都可以一次得到。

倒排索引的不足

如果我要找到某个用户的所有标签信息,倒排索引就显得吃力了。我需要遍历每个标签,看看是否包含这个用户信息,最终得到结果。因此,ES使用另外一种数据结构doc_value 解决这个问题。

doc_value

在这里插入图片描述
和倒排索引不同,doc_value会将每个用户的详细信息放在同一行。在ES中,聚合、排序、访问字段值的脚本,父子关系处理都基于doc_value。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值