高效数据获取:Hibernate获取策略全解析
1. 选择获取策略
在使用Hibernate时,我们可以看到它遵循了急切获取计划,能在分离状态下访问投标(bids)和图像(images)集合。然而,问题在于数据的加载方式,使用SQL连接(JOIN)会产生大量冗余数据。
例如,一个物品(Item)有三个投标和三个图像,通过JOIN操作得到的结果集大小取决于要检索的集合大小,这里是3×3 = 9行。若一个物品有50个投标和5个图像,结果集可能多达250行。当使用JPQL或CriteriaQuery编写自定义查询时,情况可能更糟。
数据库服务器创建这样的结果集需要大量处理时间和内存,且这些数据还需通过网络传输。Hibernate在将结果集编组为持久化实例和集合时会立即删除所有重复项,但无法在SQL层面去除重复,SQL的DISTINCT操作符在此也不起作用。
相比使用一个产生极大结果集的SQL查询,使用三个单独的查询同时检索一个实体实例和两个集合会更快。接下来,我们将重点介绍这种优化方法,以及如何找到并实现最佳获取策略。我们先从默认的延迟获取计划开始,尝试解决n + 1选择问题。
2. 批量预取数据
如果Hibernate按需获取每个实体关联和集合,可能需要许多额外的SQL SELECT语句来完成特定过程。例如,检查每个物品的卖家是否有用户名,使用延迟加载时,需要一个SELECT语句获取所有物品实例,再加上n个SELECT语句来初始化每个物品的卖家代理。
Hibernate提供了可以预取数据的算法,首先介绍的是批量获取算法,其工作原理如下:如果Hibernate必须初始化一个用户代理,它会使用同一个SEL