大模型驱动的Query改写探索：PRF技术与论文解析

最新推荐文章于 2025-06-28 21:01:39 发布

原创

最新推荐文章于 2025-06-28 21:01:39 发布 · 554 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#java

本文介绍了一篇典型的 PRF （
Pseudo-relevance feedback
）思路的论文，用于利用LLM来做query改写，提升召回率，召回效果。

论文地址：
Large Language Models are Strong Zero-Shot Retriever

一、PRF的流程

如下图所示，先用原始的query，进行一次召回。然后基于找回的10条文档，喂给模型，让模型生成5个答案。然后在用模型生成的答案做我新的query再做一次召回。最终得到最终的结果。

其中与模型交互的prompt如下

Give a question “{q}” and its possible answering passages (most of these
passages are wrong) enumerated as: \n 1.{cq
1} \n 2.{cq2} \n 3.{cq3} . . .
please write a correct answering passage.

二、论文中给出的结论

图a，是第一次检索召回的top文档数据，从图上可知，召回10条数据，效果最好。

图b，是验证了每次让模型生成的答案数量。论文给出的结论是，模型每次生成5个答案，效果趋向于稳定和最高。

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xziyuan

关注关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

LLM 大模型RAG 多轮回答问题准确率优化：问题改写

weixin_42357472的博客

12-05

670

有时候多轮进行上下文关联变弱，比如前面问北京的天气，后面问广州的呢，可能前面大模型回答内容过多一起上下文给到会导致后面多轮识别产生错误。解决方法：可以把用户问题单独取出来做处理，根据前面问题通过大模型prompt形式改写当前问题。

Query Rewrite —— 基于大模型的query扩展改写，PRF（论文）

Angus

02-21

1885

本文介绍了一篇典型的 PRF （Pseudo-relevance feedback）思路的论文，用于利用LLM来做query改写，提升召回率，召回效果。为大家介绍PRF的主要流程，PRF的提升效果。PRF的弊端。以及不同规模的LLM对改写的效果的影响。

参与评论您还未登录，请先登录后发表或查看评论

【大模型】Query 改写常见Prompt 模板

最新发布

weixin_41645791的博客

06-28

2732

本文介绍了企业级Query改写技术的核心应用场景和常见Prompt模板，包含5种典型测试用例（拼写纠错、上下文补全、术语替换、多义词消歧、专业查询）来验证改写效果。提供了4种中英对照的Prompt模板：简洁零样本重写、前缀式调用、提示增强、结合RAG的生成式改写，并附有Python代码示例。重点展示了如何通过多样化并行改写和语义相似度排序来提升检索性能，适用于RAG应用和大模型问答系统，帮助开发者实现高召回率和高精度的查询改写功能。

Query Rewrite —— 基于大模型的query扩展改写，综合考虑上下文信息（人大论文）

Angus

02-19

6071

在session上下文中，捕获用户的搜索意图，是一件较为复杂和困难的事情。一起看一下人大的这篇论文。论文中提出了一个简单而有效的提示框架，称为LLM4CS，以利用LLM作为搜索意图解释器来促进会话搜索。具体来说，我们首先提示LLM在多个视角下生成较短的查询重写和较长的假设响应，然后将这些生成的内容聚合成一个集成的表示，以稳健地表示用户的真实搜索意图。

Query Rewrite —— 基于大模型的query扩展改写（基于思维链），召回提升3%

Angus

02-19

6745

查询扩展是一种广泛应用于提高搜索系统召回率的技术。在本文中，我们提出了一种利用大型语言模型（llm）的生成能力的查询扩展方法。与传统的查询扩展方法，如伪相关反馈（PRF），它依赖于检索一组好的伪相关文档来扩展查询不同，我们依赖于LLM的生成和创造性能力，并利用模型中固有的知识。我们研究了各种不同的提示，包括零射击、少射击和思维链（CoT）。我们发现CoT提示对于查询扩展特别有用，因为这些提示指示模型逐步分解查询，并可以提供大量与原始查询相关的术语。

雷达技术深度解析：PRF选择与斑马图应用

总结来说，PRF的选择、距离模糊与方位模糊的解决、斑马图的解读、雷达孔径的优化以及雷达系统的整体设计与应用，构成了雷达技术中的核心知识点。通过对这些知识的深入理解和应用，可以提升雷达系统的性能，满足不同...

三通回归滤波器：3PRF技术解析与应用

资源摘要信息:"三通回归滤波器（3PRF）是一种数字信号处理技术，主要用于从含有噪声的信号中提取有用的频率成分。这种滤波器之所以称为“三通”，是因为它可以同时处理三个不同频率范围的信号，并将它们分离出来。而...

基于xgboost的多因子量化选股：固定PRF雷达技术解析

文章详细介绍了脉冲多普勒雷达的基本原理，包括各种多普勒雷达类型、术语定义、固定CW雷达和固定脉冲重复频率(PRF)雷达的频谱与波形。" 正文: 在雷达技术领域，固定中PRF（Pulse Repetition Frequency）雷达是一种...

EAP测试程序：PRF与SIM的综合应用

它支持多种认证机制，并能够与多种网络接入技术一起使用，使得认证过程更加灵活。EAP协议的一个重要特点是可以与后端的认证系统（如RADIUS）进行交互，处理复杂的认证流程。从提供的文件标题"test_eap_sim_common....

Query Rewrite —— 基于大模型的query扩展改写，如何减少LLM的幻觉问题，召回提升15%（北大论文）

Angus

02-20

3407

如何有效的丰富扩展query，是一个提升召回率的关键问题。在大模型时代到来后，大家都开始使用LLM来扩展query。尽管LLM具有显著的文本生成能力，但它也容易产生幻觉，仍然难以代表其训练语料库中包含的完整的长尾知识。在北大的论文中，介绍了通过检索和大模型的结果，提升召回率的方法。论文提出：为了缓解上述模型的幻觉问题，方案是由原始query检索到的文档D，将D提供给模型，作为辅助材料，再让模型生成新的query。先进行一次普通检索，召回数据有可能帮助llm做出更好的预测。

Query Rewrite —— 基于大模型的query扩展改写，PRF+ GRF协同发力减少LLM的幻觉问题（论文）

Angus

02-21

2635

大模型进行Query改写时如何提升性能

qq_43814415的博客

09-14

1511

大模型的指令遵循需要大参数量级的模型，但是推理成本高。更合适的方法是训练一个小模型。一般先进行SFT，再进行离线的DPO微调。：从提示的角度解决，方便。给一个系统提示词，再加上几个会话，都遵循输入一个用户Query，输出一个改写后的Query。在实际改写的时候，大模型会出现各种问题：不听指令、改写后的查询和数据库内容无关等。Query改写方法有子问题拆解、短语提取、回溯检索、虚拟文档等方法。

Query Rewrite —— 基于大模型的query扩展改写，召回提升3%-15%

Angus

02-18

3147

本文介绍了一种简单而有效的查询扩展方法。通过大语言模型（LLM）的小样本提示生成答案，然后和原始query进行拼接，作为新的query。实验结果表明query2doc 通过以下方式提高了 BM25 的性能3% 到 15%。

Query Rewrite —— 基于大模型的query扩展改写，HyDE 生成假设性答案（论文）

Angus

02-21

2569

通常用户的query是无法预测的。给定一个候选集，直接命中和query最相关的文档是一件困难的事情。这篇论文中，提出了HyDE，也就是根据query，利用LLM去生成假设性回答。然后将给出的假设性回答，去做文本的embedding，然后做向量检索召回。论文中证明，HyDE这种方式相比较BM25可以。

Query2doc——Query改写

REfusing的博客

03-26

2256

本文介绍了一种简单但有效的查询扩展方法，称为 query2doc，旨在提升稀疏(如BM25)和密集检索(如E5,bge-m3等 )系统的性能。该方法首先通过少量样本提示大型语言模型（LLMs）生成伪文档，然后使用生成的伪文档来扩展查询。LLMs 是训练于网络规模的文本语料库，并擅长于知识记忆。来自 LLMs 的伪文档通常包含高度相关的信息，有助于查询消歧并引导检索器。

淘宝主搜：大模型在长尾Query改写召回上的实践

Kaiyuan_sjtu的博客

01-08

2635

作者|李国趸整理|NewBeeNLPhttps://zhuanlan.zhihu.com/p/675421157后台留言『交流』，加入 NewBee讨论组大家好，今天分享一篇阿里淘宝主搜将大语言模型LLM和搜索query理解结合应用的工作。论文：Large Language Model based Long-tail Query Rewriting in Taobao Search公司：...

mysql 5.7 insert 慢_mysql的query rewrite，关键时刻拯救你的业务

weixin_39917437的博客

12-24

216

作为一个数据库运维人员，总会碰到数据库服务器IO和CPU使用率飙升，紧接着，一线运维反馈说业务响应时间变长，甚至超时，于是开始看日志，排查业务响应变长原因，最后发现是最近新上的应用中，有慢sql在查询，将慢sql拿出来一看这里只是举个例子，但现实中确实有写成这样的upper(pad)select * from t_sbtest1 where upper(pad)='00017586372-1242...

Query Rewrite —— 基于大模型的query扩展改写，通过GRM减少LLM的幻觉问题（论文）

Angus

02-20

1921

自从大模型火了以后，各行业各都发生了翻天覆地的变化。其中query Rewrite也开始使用大模型来做query 扩展。大模型所有的优点都可以得到很好的体现，同样大模型的所有缺点也无法避免。这里只说一个，关于大模型的幻觉问题。如果使用大模型来生成改写query，幻觉问题，会非常糟糕的变成噪音query数据，而影响了最终的查询的召回，甚至是南辕北辙。这篇论文提出，建设相关性评估模型，来过滤掉模型生成的负面的case。从而减少使用大模型做query Rewrite的时候的负面影响。的。