|
- 一文读懂:大模型RAG(检索增强生成)含高级方法
RAG 管道的关键部分是搜索索引,它存储了在上一步中获得的向量化内容。 最原始的实现是使用平面索引 — 查询向量和所有块向量之间的暴力计算距离。 为了实现1w+元素规模的高效检索,搜索索引 应该采用 向量索引,比如 faiss 、 nmslib 以及 annoy。
- RAG-检索增强生成从入门到实战,看这一篇就够了 - 知乎
RAG(Retrieval-Augmented Generation)技术通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言模型(LLMs),以增强模型处理知识密集型任务的能力。这种方法特别适用于那些高度依赖专业知识的任务,能够显著提升回答的精确度。 RAG的主要模块
- 如何高效提升大模型的RAG效果? - 知乎
现在 RAG 的解决方案有很多,可以参见 LLM-Powered-RAG-System: A collection of RAG systems powered by LLM。 今天分享一些 RAG 系统的方法论,内容来自 RAG 论文作者之一 Douwe Kiela 的视频演讲 RAG Agents in Prod: 10 Lessons We Learned — Douwe Kiela, creator of RAG。
- 检索增强RAG中有哪些好用的Chunk切分方法? - 知乎
在RAG(Retrieval Augmented Generation)准确率优化问题中,有通过炼丹的、有通过设计复杂流水线的、有通过预处理的、有通过后处理的。但,有一项工作的重要性容易被忽视,那就是 切!文!档! 我通过文档结构(AST)的方式,设计了一组切文档的规则,应用这些规则,使得参数相同的情况下,RAG的
- RAG 系统中怎样决定什么时候执行检索操作? - 知乎
RAG 系统中怎样决定什么时候执行检索操作? RAG 检索外部知识库把生成响应需要的知识和事实等嵌入在大模型的输入中,从而减轻幻觉问题。 但是 RAG 并不是任何时候都需要的,大部分情况下模型自己就… 显示全部 关注者 11 被浏览
- 02-大模型中的RAG流程及问题 - 知乎
RAG(检索增强生成)作为被广泛认可的解决方案,其潜力在于显著促进大模型在实际应用中的高效落地。 然而,即便RAG框架已奠定了坚实的基础,但在实践操作的层面,仍存在着诸多细节有待我们进一步雕琢与优化,以确保大模型的各项能力得以淋漓尽致地展现。
- GraphRAG:知识图谱+大模型
Graph RAG是一种基于知识图谱的 检索增强技术,通过构建图模型的知识表达,将实体和关系之间的联系用图的形式进行展示,然后利用大语言模型 LLM进行检索增强。 Graph RAG 将知识图谱等价于一个超大规模的词汇表,而实体和关系则对应于单词。
- 大模型有什么好的评估方法(无须groudtruth)?RAG又有什么好的评估方法? - 知乎
评估方法:从人工检查到LLM评审 如何全面衡量RAG系统? 评估RAG系统,主要有两种方法: 确定性测量:这些指标可以直接从系统日志里算出来,比如延迟、令牌使用情况,还有召回率(前提是你有数据)。这类指标计算起来相对简单直接。 LLM评判式评估:这种方法让另一个LLM充当“评委”,来评估
|
|
|