在PostgreSQL中查找具有多条关联记录的记录（来自jbranchaud/til项目）-CSDN博客

本文链接：https://blog.csdn.net/gitblog_00260/article/details/148392346

在PostgreSQL中查找具有多条关联记录的记录（来自jbranchaud/til项目）

til :memo: Today I Learned 项目地址: https://gitcode.com/gh_mirrors/ti/til

理解一对多关系

在关系型数据库中，一对多关系是最常见的表关联方式之一。这种关系描述了一个表中的记录可以对应另一个表中的多条记录。例如，在一个图书管理系统中：

authors表存储作者信息
books表存储书籍信息
每本书通过author_id外键关联到authors表的id字段

这种设计允许一个作者拥有多本著作，完美体现了一对多关系。

业务场景需求

在实际应用中，我们经常需要识别那些拥有多条关联记录的实体。比如：

找出出版过2本及以上书籍的作者
识别拥有多个订单的客户
查找被多个学生选修的课程

这类查询对于数据分析、业务决策和系统优化都很有价值。

SQL查询解决方案

要查找拥有多本著作的作者，我们可以使用以下SQL查询：

select authors.id, authors.name, count(books.id)
  from authors
  join books
    on authors.id = books.author_id
  group by authors.id
  having count(books.id) >= 2;

查询解析

让我们分解这个查询的工作原理：

基础连接：通过join操作将authors和books表关联起来
分组聚合：使用group by authors.id按作者ID分组
计数统计：count(books.id)计算每位作者的书籍数量
结果过滤：having子句筛选出书籍数量≥2的作者

HAVING与WHERE的区别

初学者常混淆HAVING和WHERE，关键区别在于：

WHERE在分组前过滤单个记录
HAVING在分组后过滤聚合结果

在本例中，我们需要基于count()结果过滤，因此必须使用HAVING。

性能优化建议

对于大型数据库，这类聚合查询可能较慢，可以考虑：

在author_id和authors.id上建立索引
限制返回字段，避免不必要的数据传输
对于超大数据集，考虑分批处理

扩展应用

这个模式可以应用于各种一对多关系场景：

-- 查找有多个订单的客户
select customers.id, customers.name, count(orders.id)
from customers
join orders on customers.id = orders.customer_id
group by customers.id
having count(orders.id) > 3;

-- 查找热门标签(被多篇文章使用)
select tags.id, tags.name, count(articles.id)
from tags
join article_tags on tags.id = article_tags.tag_id
join articles on article_tags.article_id = articles.id
group by tags.id
having count(articles.id) > 5;