RediSearch聚合查询深度解析：从基础到高级应用-CSDN博客

本文链接：https://blog.csdn.net/gitblog_00238/article/details/148488899

RediSearch聚合查询深度解析：从基础到高级应用

什么是RediSearch聚合查询

RediSearch作为Redis的全文搜索模块，提供了强大的聚合查询功能，允许用户对搜索结果进行复杂的数据处理和统计分析。聚合查询的核心价值在于能够对海量数据进行分组、计算和转换，从而提取出有价值的信息。

聚合查询基础架构

RediSearch的聚合查询基于管道(pipeline)模式构建，主要包含以下几个关键组件：

查询表达式(Query Expression)：与FT.SEARCH命令相同的查询语法，用于筛选基础数据集
加载字段(LOAD)：明确指定需要处理的字段
应用转换(APPLY)：对字段值进行转换或计算
分组(GROUPBY)：按照指定字段对数据进行分组
聚合计算(REDUCE)：对分组后的数据执行聚合函数

实战案例解析

案例1：简单字段转换

假设我们有一个自行车索引，包含价格(price)和状态(condition)字段。我们可以计算新自行车的折扣价格：

FT.AGGREGATE idx:bicycle "@condition:{new}" 
LOAD 2 "__key" "price" 
APPLY "@price - (@price * 0.1)" AS "discounted"

这个查询会：

筛选所有condition为"new"的自行车
加载key和price字段
对price字段应用9折计算
返回原始价格和折扣后的价格

案例2：分组统计

我们可以统计不同状态下价格低于1000美元的自行车数量：

FT.AGGREGATE idx:bicycle "*" 
LOAD 1 price 
APPLY "@price<1000" AS price_category 
GROUPBY 1 @condition 
REDUCE SUM 1 "@price_category" AS "num_affordable"

这个查询会：

加载所有自行车的price字段
创建price_category标记(1表示价格<1000，0表示≥1000)
按condition字段分组
计算每组中price_category=1的数量

案例3：全量统计

统计索引中所有自行车的总数：

FT.AGGREGATE idx:bicycle "*" 
APPLY "'bicycle'" AS type 
GROUPBY 1 @type 
REDUCE COUNT 0 AS num_total

这个查询会：

为所有文档添加type="bicycle"的标记
按type分组
计算文档总数

高级应用技巧

多级分组聚合

RediSearch支持复杂的多级聚合管道，例如：

FT.AGGREGATE idx:bicycle "*" 
LOAD 2 "price" "condition"
APPLY "floor(@price/500)*500" AS "price_range"
GROUPBY 2 "@condition" "@price_range"
REDUCE COUNT 0 AS "count"
REDUCE AVG 1 "@price" AS "avg_price"
SORTBY 2 "@condition" "@price_range"

这个查询会：

按condition和price_range(每500美元为一个区间)分组
计算每组的记录数和平均价格
按condition和price_range排序

列表聚合

除了数值计算，还可以聚合列表数据：

FT.AGGREGATE idx:bicycle "*" 
LOAD 1 "model"
GROUPBY 1 "@condition" 
REDUCE TOLIST 1 "@model" AS "models"

这会返回每个condition分组下的所有model列表。

性能优化建议

字段选择：只LOAD必要的字段，减少数据传输量
索引设计：为常用分组字段创建TAG或NUMERIC索引
管道顺序：先过滤后计算，减少不必要的处理
结果分页：使用LIMIT控制返回结果数量

常见问题解答

Q: 聚合查询支持哪些数学函数？ A: RediSearch支持常见的数学运算、比较运算和逻辑运算，可以在APPLY表达式中直接使用。

Q: 能否对文本字段进行聚合？ A: 可以对TAG类型的字段进行分组聚合，但TEXT类型字段需要先转换为TAG或使用其他处理方式。

Q: 聚合查询的结果是否可以被缓存？ A: 可以结合Redis的缓存机制，将常用聚合结果缓存起来提高性能。

通过本文的详细讲解，相信您已经掌握了RediSearch聚合查询的核心用法。聚合功能为数据分析提供了强大支持，合理运用可以大幅提升应用的数据处理能力。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考