RAG七十二式：2024年度RAG清单

这篇内容全面介绍了截至2024年的最新检索增强生成（RAG）系统的进展，展示了35个尖端的RAG框架和模型。这些发展对于增强各领域的人工智能应用至关重要，包括多模态学习、自我修正和个性化服务。值得关注的亮点包括CommunityKG-RAG等框架的引入，它将社区结构与知识图结合起来进行事实核查，以及LazyGraphRAG，通过推迟使用大型语言模型来优化资源利用。该指南还涉及这些系统所解决的挑战，如知识推理和上下文过滤，表明它们对检索增强文本生成的演变和有效性的贡献。这篇内容对于对人工智能领域的研究人员和从业者来说尤为宝贵，他们对RAG系统的最新趋势和创新感兴趣。- RAG备受瞩目，是AI应用的重要组成部分。 - 2024年度典型的RAG系统和论文有GraphReader、MM-RAG、CRAG、RAPTOR、T-RAG、RAT、RAFT、Adaptive-RAG、HippoRAG、RAE、G-RAG、Camel-GraphRAG、RankRAG、Medical-Graph-RAG、HybridRAG、W-RAG、RAGChecker、Meta-Knowledge-RAG等。 - 这些系统和论文涵盖了多个领域和应用，如图解专家、多模态学习、自我校正、分层归纳、私人顾问、思考者、开卷高手、因材施教、海马体、智能编辑、仓储员、社区摘要、编排大师、自言自语、开卷高手、智能编辑、百宝箱、侦探、串门神器、搬运工、八爪鱼、战略家、作家、元筛选器、全能选手、导航员、小秘书、轻装上阵、进化搜索、学者等。 - 这些系统和论文提供了各种创新的方法和技术，以提高RAG系统的性能和效果。 - MK Summary引入了以数据为中心的RAG工作流程，将传统的“检索-读取”系统转变为“准备-重写-检索-读取”框架。 - CommunityKG-RAG结合知识图谱中的社区结构，提高信息检索的准确性和相关性。 - TC-RAG通过引入图灵完备的系统来管理状态变量，实现更高效、准确的知识检索。 - RAGLAB是一个模块化、研究导向的开源库，用于公平对比和评估不同的RAG算法。 - MemoRAG构建在一个高效的超长记忆模型之上，实现对整个数据库的全局理解。 - OP-RAG通过引入顺序保留检索增强生成机制，提高RAG在长上下文问答应用中的性能。 - AgentRE通过整合大型语言模型的记忆、检索和反思能力，提升关系抽取的性能。 - iText2KG利用大型语言模型从原始文档中构建知识图谱，无需事先定义本体或进行大量的监督训练。 - GraphInsight基于图结构和向量表示相结合，提高LLMs对图形信息理解的能力。 - LA-RAG利用细粒度标记级语音数据存储和语音到语音检索机制，提高语音识别准确性。 - SFR-RAG是一个经过指令微调的小型语言模型，减少参数数量，提高生成质量。 - CoTKR通过交替生成推理路径和相应知识，克服单步知识改写的限制。 - iText2KG通过增量式知识图谱构建，无需事先定义本体或进行大量的监督训练。 - GraphInsight通过将关键图形信息置于LLMs记忆性能较强的位置，提高图形信息理解能力。 - LA-RAG利用细粒度标记级语音数据存储和语音到语音检索机制，提高语音识别准确性。 - SFR-RAG是一个经过指令微调的小型语言模型，减少参数数量，提高生成质量。 - CoTKR通过交替生成推理路径和相应知识，克服单步知识改写的限制。 - Open-RAG通过开源大语言模型提高RAG中的推理能力，处理复杂的推理任务。 - TableRAG通过查询扩展结合Schema和单元格检索，实现更高效的数据编码和精确检索。 - LightRAG通过引入图结构和向量表示相结合，提高LLMs对图形信息理解的能力。 - AstuteRAG通过适应性地从LLMs内部知识中提取信息，提高系统的鲁棒性和可信度。 - TurboRAG通过离线预计算和存储文档的KV缓存来优化RAG系统的推理范式。 - StructRAG通过混合信息结构化机制，提高LLM在知识密集型推理任务上的表现。 - VisRAG通过构建基于视觉-语言模型的RAG流程，增强生成效果，提高检索和生成阶段的性能。 - AGENTiGraph通过自然语言交互进行知识管理的平台，集成了知识提取、集成和实时可视化。 - RuleRAG通过引入符号规则作为上下文学习，提高RAG系统的性能和可靠性。 - Class-RAG通过动态更新检索库，实现即时风险缓解，提高内容审核分类器的性能。 - Self-RAG通过检索和自我反思来提升语言模型的质量和准确性。 - SimRAG通过自训练方法，提高LLM在特定领域的适应能力。 - ChunkRAG通过在块级别评估和过滤检索到的信息，提高RAG系统的事实准确性。 - FastGraphRAG通过应用PageRank算法进行图检索，提高知识图谱中信息的检索效率。 - AutoRAG通过自动识别合适的RAG模块和优化组合，提高RAG系统的效率和可扩展性。 - Plan×RAG将推理计划制定为有向无环图，实现高效的检索和生成。 - SubgraphRAG通过检索子图并利用LLM进行推理和答案预测，提高RAG系统的效率和准确性。 - RuRAG通过将离线数据蒸馏成可解释的一阶逻辑规则，提升LLM的推理能力。 - RAGViz提供了对检索文档和模型注意力的可视化，帮助用户理解RAG系统的交互过程。 - AgenticRAG将AI智能体纳入RAG流程，协调组件并执行额外行动，提升系统的智能性。 - HtmlRAG通过使用HTML而不是纯文本来建模检索到的知识，提高RAG系统的性能。 - HtmlRAG是使用HTML而不是纯文本作为检索知识格式的方法，可以更好地建模外部文档中的知识。 - M3DocRAG是一种多模态RAG框架，可以处理多个文档并保留视觉信息。 - KAG通过知识图谱和向量检索来增强大型语言模型的生成和推理性能。 - FILCO通过上下文过滤模型来提高生成器的上下文质量。 - LazyGraphRAG是一种图谱增强生成增强检索方法，可以降低索引和查询成本，并保持高效性和可扩展性。