RAG七十二式:2024年度RAG清单
阎荟
2024-12-12 00:00:00
510
这篇内容全面介绍了截至2024年的最新检索增强生成(RAG)系统的进展,展示了35个尖端的RAG框架和模型。这些发展对于增强各领域的人工智能应用至关重要,包括多模态学习、自我修正和个性化服务。值得关注的亮点包括CommunityKG-RAG等框架的引入,它将社区结构与知识图结合起来进行事实核查,以及LazyGraphRAG,通过推迟使用大型语言模型来优化资源利用。该指南还涉及这些系统所解决的挑战,如知识推理和上下文过滤,表明它们对检索增强文本生成的演变和有效性的贡献。
这篇内容全面介绍了截至2024年的最新检索增强生成(RAG)系统的进展,展示了35个尖端的RAG框架和模型。这些发展对于增强各领域的人工智能应用至关重要,包括多模态学习、自我修正和个性化服务。值得关注的亮点包括CommunityKG-RAG等框架的引入,它将社区结构与知识图结合起来进行事实核查,以及LazyGraphRAG,通过推迟使用大型语言模型来优化资源利用。该指南还涉及这些系统所解决的挑战,如知识推理和上下文过滤,表明它们对检索增强文本生成的演变和有效性的贡献。这篇内容对于对人工智能领域的研究人员和从业者来说尤为宝贵,他们对RAG系统的最新趋势和创新感兴趣。- RAG备受瞩目,是AI应用的重要组成部分。
- 2024年度典型的RAG系统和论文有GraphReader、MM-RAG、CRAG、RAPTOR、T-RAG、RAT、RAFT、Adaptive-RAG、HippoRAG、RAE、G-RAG、Camel-GraphRAG、RankRAG、Medical-Graph-RAG、HybridRAG、W-RAG、RAGChecker、Meta-Knowledge-RAG等。
- 这些系统和论文涵盖了多个领域和应用,如图解专家、多模态学习、自我校正、分层归纳、私人顾问、思考者、开卷高手、因材施教、海马体、智能编辑、仓储员、社区摘要、编排大师、自言自语、开卷高手、智能编辑、百宝箱、侦探、串门神器、搬运工、八爪鱼、战略家、作家、元筛选器、全能选手、导航员、小秘书、轻装上阵、进化搜索、学者等。
- 这些系统和论文提供了各种创新的方法和技术,以提高RAG系统的性能和效果。
- MK Summary引入了以数据为中心的RAG工作流程,将传统的“检索-读取”系统转变为“准备-重写-检索-读取”框架。
- CommunityKG-RAG结合知识图谱中的社区结构,提高信息检索的准确性和相关性。
- TC-RAG通过引入图灵完备的系统来管理状态变量,实现更高效、准确的知识检索。
- RAGLAB是一个模块化、研究导向的开源库,用于公平对比和评估不同的RAG算法。
- MemoRAG构建在一个高效的超长记忆模型之上,实现对整个数据库的全局理解。
- OP-RAG通过引入顺序保留检索增强生成机制,提高RAG在长上下文问答应用中的性能。
- AgentRE通过整合大型语言模型的记忆、检索和反思能力,提升关系抽取的性能。
- iText2KG利用大型语言模型从原始文档中构建知识图谱,无需事先定义本体或进行大量的监督训练。
- GraphInsight基于图结构和向量表示相结合,提高LLMs对图形信息理解的能力。
- LA-RAG利用细粒度标记级语音数据存储和语音到语音检索机制,提高语音识别准确性。
- SFR-RAG是一个经过指令微调的小型语言模型,减少参数数量,提高生成质量。
- CoTKR通过交替生成推理路径和相应知识,克服单步知识改写的限制。
- iText2KG通过增量式知识图谱构建,无需事先定义本体或进行大量的监督训练。
- GraphInsight通过将关键图形信息置于LLMs记忆性能较强的位置,提高图形信息理解能力。
- LA-RAG利用细粒度标记级语音数据存储和语音到语音检索机制,提高语音识别准确性。
- SFR-RAG是一个经过指令微调的小型语言模型,减少参数数量,提高生成质量。
- CoTKR通过交替生成推理路径和相应知识,克服单步知识改写的限制。
- Open-RAG通过开源大语言模型提高RAG中的推理能力,处理复杂的推理任务。
- TableRAG通过查询扩展结合Schema和单元格检索,实现更高效的数据编码和精确检索。
- LightRAG通过引入图结构和向量表示相结合,提高LLMs对图形信息理解的能力。
- AstuteRAG通过适应性地从LLMs内部知识中提取信息,提高系统的鲁棒性和可信度。
- TurboRAG通过离线预计算和存储文档的KV缓存来优化RAG系统的推理范式。
- StructRAG通过混合信息结构化机制,提高LLM在知识密集型推理任务上的表现。
- VisRAG通过构建基于视觉-语言模型的RAG流程,增强生成效果,提高检索和生成阶段的性能。
- AGENTiGraph通过自然语言交互进行知识管理的平台,集成了知识提取、集成和实时可视化。
- RuleRAG通过引入符号规则作为上下文学习,提高RAG系统的性能和可靠性。
- Class-RAG通过动态更新检索库,实现即时风险缓解,提高内容审核分类器的性能。
- Self-RAG通过检索和自我反思来提升语言模型的质量和准确性。
- SimRAG通过自训练方法,提高LLM在特定领域的适应能力。
- ChunkRAG通过在块级别评估和过滤检索到的信息,提高RAG系统的事实准确性。
- FastGraphRAG通过应用PageRank算法进行图检索,提高知识图谱中信息的检索效率。
- AutoRAG通过自动识别合适的RAG模块和优化组合,提高RAG系统的效率和可扩展性。
- Plan×RAG将推理计划制定为有向无环图,实现高效的检索和生成。
- SubgraphRAG通过检索子图并利用LLM进行推理和答案预测,提高RAG系统的效率和准确性。
- RuRAG通过将离线数据蒸馏成可解释的一阶逻辑规则,提升LLM的推理能力。
- RAGViz提供了对检索文档和模型注意力的可视化,帮助用户理解RAG系统的交互过程。
- AgenticRAG将AI智能体纳入RAG流程,协调组件并执行额外行动,提升系统的智能性。
- HtmlRAG通过使用HTML而不是纯文本来建模检索到的知识,提高RAG系统的性能。
- HtmlRAG是使用HTML而不是纯文本作为检索知识格式的方法,可以更好地建模外部文档中的知识。
- M3DocRAG是一种多模态RAG框架,可以处理多个文档并保留视觉信息。
- KAG通过知识图谱和向量检索来增强大型语言模型的生成和推理性能。
- FILCO通过上下文过滤模型来提高生成器的上下文质量。
- LazyGraphRAG是一种图谱增强生成增强检索方法,可以降低索引和查询成本,并保持高效性和可扩展性。

版权声明:
创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写
「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。