您的位置:首页 > 教育 > 锐评 > RAG优化

RAG优化

2025/9/9 17:48:23 来源:https://blog.csdn.net/weixin_40566713/article/details/139888450  浏览:    关键词:RAG优化

目前想到的优化方案:
1、使用大模型,提示工程对query进行改写;
2、使用大模型对检索的结果进行改写;
3、rerank排序;
4、prompt优化;
5、原始文本清洗优化。

RAG Fusion
互惠排名融合

RAG(检索增强生成)的优化策略主要包括数据清洗、分块处理、嵌入模型的使用、预检索优化、检索和后检索流程的优化,以及高级优化技术如查询环节优化、检索环节的优化、融合或混合搜索、多种切分方式并行查询、rerank、以及模型微调等。12

数据清洗:删除重复信息、处理缺失值、填充噪声等,以提高模型的准确性。
分块:将较大的文本分成较小的块或段落,降低模型复杂性,便于处理大型文档。
嵌入模型:将文本转换为数值向量,捕捉语义信息,提高RAG性能。
预检索优化:包括提高索引数据的质量和块优化,如数据粒度增强和更好的数据组织。
检索和后检索流程优化:通过有效的查询转换和提示工程技术,增强RAG工作流程的每个组成部分。
高级优化技术:
查询环节优化:包括使用LLM对查询进行改写、理解查询意图并生成多个查询并行检索。
检索环节的优化:采用总分层级索引、父子层级索引、融合或混合搜索、多种切分方式并行查询等方法,提高检索的准确性和稳健性。
rerank:使用cross encoder模型对召回的chunks进行逐个排序,增加MMR及命中率。
模型微调:在成本和数据允许的情况下,对嵌入模型、交叉编码器等进行微调,提升垂直领域检索效果。
这些策略的综合应用可以显著提升RAG的性能,使其在处理复杂查询和大量数据时更加有效和准确。

RAG极致优化:提升性能,实现飞跃!
无限长的上下文,也干不掉的RAG
语义搜索与混合查询:Blended RAG如何提升检索准确性
RAG与LLM本身知识存在冲突时,大模型如何抉择?

读懂RAG这一篇就够了,万字详述RAG的5步流程和12个优化策略

RAG性能优化终极指南

检索增强生成技术(RAG)深度优化指南:原理、挑战、措施、展望

提升RAG性能的关键技术:从数据清理到混合检索的全方位讨论

关于 RAG 的优化方案及评估

如何优化RAG系统的性能表现?10条实用策略

检索增强生成(RAG)概念及优化

RAG介绍及RAG的优化

再靠近亿点点,RAG 优化策略

检索增强生成(RAG)有什么好的优化方案?

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com