目前想到的优化方案:
1、使用大模型,提示工程对query进行改写;
2、使用大模型对检索的结果进行改写;
3、rerank排序;
4、prompt优化;
5、原始文本清洗优化。
RAG Fusion
互惠排名融合
RAG(检索增强生成)的优化策略主要包括数据清洗、分块处理、嵌入模型的使用、预检索优化、检索和后检索流程的优化,以及高级优化技术如查询环节优化、检索环节的优化、融合或混合搜索、多种切分方式并行查询、rerank、以及模型微调等。12
数据清洗:删除重复信息、处理缺失值、填充噪声等,以提高模型的准确性。
分块:将较大的文本分成较小的块或段落,降低模型复杂性,便于处理大型文档。
嵌入模型:将文本转换为数值向量,捕捉语义信息,提高RAG性能。
预检索优化:包括提高索引数据的质量和块优化,如数据粒度增强和更好的数据组织。
检索和后检索流程优化:通过有效的查询转换和提示工程技术,增强RAG工作流程的每个组成部分。
高级优化技术:
查询环节优化:包括使用LLM对查询进行改写、理解查询意图并生成多个查询并行检索。
检索环节的优化:采用总分层级索引、父子层级索引、融合或混合搜索、多种切分方式并行查询等方法,提高检索的准确性和稳健性。
rerank:使用cross encoder模型对召回的chunks进行逐个排序,增加MMR及命中率。
模型微调:在成本和数据允许的情况下,对嵌入模型、交叉编码器等进行微调,提升垂直领域检索效果。
这些策略的综合应用可以显著提升RAG的性能,使其在处理复杂查询和大量数据时更加有效和准确。
RAG极致优化:提升性能,实现飞跃!
无限长的上下文,也干不掉的RAG
语义搜索与混合查询:Blended RAG如何提升检索准确性
RAG与LLM本身知识存在冲突时,大模型如何抉择?
读懂RAG这一篇就够了,万字详述RAG的5步流程和12个优化策略
RAG性能优化终极指南
检索增强生成技术(RAG)深度优化指南:原理、挑战、措施、展望
提升RAG性能的关键技术:从数据清理到混合检索的全方位讨论
关于 RAG 的优化方案及评估
如何优化RAG系统的性能表现?10条实用策略
检索增强生成(RAG)概念及优化
RAG介绍及RAG的优化
再靠近亿点点,RAG 优化策略
检索增强生成(RAG)有什么好的优化方案?