如何通过 Spring Data Elasticsearch 实现复杂查询（如多条件聚合）？商品搜索场景下，如何设计索引映射？说明字段类型选择依据（text/keyword/nested等）？

搞不懂语言的程序员

于 2025-05-22 21:17:49 发布

阅读量366

点赞数 3

CC 4.0 BY-SA版权

分类专栏： elasticsearch 中间件文章标签： spring elasticsearch java

本文链接：https://blog.csdn.net/weixin_45762066/article/details/148148530

中间件同时被 2 个专栏收录

74 篇文章

订阅专栏

elasticsearch

16 篇文章

订阅专栏

通过商品搜索场景说明Spring Data Elasticsearch的复杂查询实现和索引设计要点：

一、复杂查询实现方案（多条件聚合示例）

// 1. 组合查询条件
public interface ProductRepository extends ElasticsearchRepository<Product, String> {
    
    @Query("{\"bool\": { 
        \"must\": [
            {\"match\": {\"name\": \"?0\"}},
            {\"range\": {\"price\": {\"gte\": ?1}}}
        ],
        \"filter\": [{
            \"term\": {\"category.id\": \"?2\"}
        }]
    }}")
    Page<Product> searchComplex(String keyword, BigDecimal minPrice, String categoryId, Pageable pageable);

    // 2. 聚合实现
    default SearchResponse<Aggregation> getProductAggregations() {
        CriteriaQuery query = new CriteriaQuery(new Criteria());
        
        // 添加价格直方图聚合
        query.addAggregation(AggregationBuilders.histogram("price_histogram")
            .field("price")
            .interval(1000)
            .minDocCount(0));
        
        // 添加分类统计聚合
        query.addAggregation(AggregationBuilders.terms("category_stats")
            .field("category.name.keyword"));
        
        return elasticsearchOperations.search(query, Product.class);
    }
}

二、索引映射设计原则（商品模型示例）

@Document(indexName = "products", createIndex = false)
@Setting(
    settingPath = "/elasticsearch/product-settings.json"
)
public class Product {
    @Id
    private String id;
    
    // 文本类型支持分词搜索
    @Field(type = FieldType.Text, analyzer = "ik_max_word")
    private String name;
    
    // 数值类型用于范围查询
    @Field(type = FieldType.Double)
    private Double price;
    
    // 嵌套类型处理对象关联
    @Field(type = FieldType.Nested)
    private Category category;
    
    // 对象数组使用nested类型
    @Field(type = FieldType.Nested)
    private List<ProductAttribute> attributes;
    
    // 精确匹配字段使用keyword
    @Field(type = FieldType.Keyword)
    private String sku;
}

// 分类实体
public static class Category {
    @Field(type = FieldType.Keyword)
    private String id;
    
    @Field(type = FieldType.Text, analyzer = "ik_smart")
    private String name;
}

// 商品属性（包含嵌套属性）
public static class ProductAttribute {
    @Field(type = FieldType.Keyword)
    private String name;
    
    @Field(type = FieldType.Keyword)
    private String value;
}

三、字段类型选择依据：

Text类型：
- 适用场景：商品名称、描述等需要全文检索的字段
- 搭配分析器：中文场景使用IK分词（ik_max_word/ik_smart）
- 支持功能：模糊查询、高亮显示、相关性评分
Keyword类型：
- 适用场景：SKU编码、状态标识等需要精确匹配的字段
- 特性：禁用分词，支持聚合、排序、term查询
- 典型用例：过滤条件（如品牌、分类）
Nested类型：
- 适用场景：商品属性、规格参数等对象数组
- 必要性：保持对象内部字段的独立关联性
- 查询特点：需要nested query处理嵌套文档

四、查询构建最佳实践

public SearchHits<Product> buildComplexQuery(SearchRequest request) {
    BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();
    
    // 品牌过滤（精确匹配）
    if (StringUtils.hasText(request.getBrand())) {
        boolQuery.filter(QueryBuilders.termQuery("brand.keyword", request.getBrand()));
    }
    
    // 价格范围（数值查询）
    boolQuery.must(QueryBuilders.rangeQuery("price")
        .gte(request.getMinPrice())
        .lte(request.getMaxPrice()));
    
    // 分类过滤（父子关联）
    if (request.getCategoryId() != null) {
        boolQuery.filter(QueryBuilders.termQuery("category.id", request.getCategoryId()));
    }
    
    // 属性过滤（嵌套查询）
    if (!request.getAttributes().isEmpty()) {
        NestedQueryBuilder nestedQuery = QueryBuilders.nestedQuery("attributes",
            QueryBuilders.boolQuery()
                .must(QueryBuilders.termQuery("attributes.name", "color"))
                .must(QueryBuilders.termsQuery("attributes.value", request.getColors())),
            ScoreMode.None);
        boolQuery.filter(nestedQuery);
    }
    
    NativeSearchQuery searchQuery = new NativeSearchQueryBuilder()
        .withQuery(boolQuery)
        .build();
        
    return elasticsearchOperations.search(searchQuery, Product.class);
}

五、索引配置建议（product-settings.json）

{
  "index": {
    "number_of_shards": 3,
    "number_of_replicas": 1,
    "analysis": {
      "analyzer": {
        "ik_smart": {
          "type": "custom",
          "tokenizer": "ik_smart"
        },
        "ik_max_word": {
          "type": "custom",
          "tokenizer": "ik_max_word"
        }
      }
    },
    "mapping": {
      "nested_fields": {
        "limit": 50
      }
    }
  }
}

关键设计考虑因素：