RAG · Vector Database · 2025

检索增强生成
向量数据库实战

从原理到生产,系统学习 RAG 架构设计、Embedding 工程、向量检索优化与 LLM 集成

13 系统章节
50+ 代码示例
2025 最新技术栈
生产级 系统设计
🔍

为什么学 RAG

LLM 知识有截止日期且容易幻觉,RAG 让模型实时访问知识库,大幅提升回答准确性与可信度。

🗄️

向量数据库核心

深入掌握 Qdrant、Chroma、Milvus 的索引原理(HNSW/IVF)与生产部署,做到知其所以然。

工程化实战

覆盖 LlamaIndex 0.10+、LangChain 0.3+、完整的 RAG 流水线搭建、评估与性能调优。

🏗️

生产级架构

多租户设计、安全过滤、混合检索、可观测性、成本控制——直接应用于企业级 AI 产品。

课程目录
13 章系统学习,从零到生产级 RAG,再到 CAG / Agentic RAG 等替代方向
01
RAG 是什么:原理与架构全景
检索增强生成定义、LLM 局限性、完整 RAG 流程、Naive/Advanced/Modular RAG 对比
02
文档处理与分块策略
PDF/Word/网页加载、固定/语义/递归分块、chunk_size 与 overlap 调优
03
Embedding 模型原理
向量嵌入原理、语义相似度、主流模型对比(OpenAI / BGE / M3E / Jina)、维度选择
04
向量数据库选型
Qdrant / Chroma / Pinecone / Weaviate / Milvus 横向对比、HNSW/IVF 索引原理、选型决策树
05
Qdrant 实战
安装部署、Collection 设计、向量写入与查询、过滤器、Python SDK 完整示例
06
检索策略优化
BM25 稀疏检索、稠密检索、混合检索、Reranker 重排序、MMR 多样性算法
07
LlamaIndex 构建 RAG
核心抽象(Index/Node/Query Engine)、VectorStoreIndex、增量更新策略
08
LangChain RAG 进阶
LCEL 链式组合、ConversationalRetrievalChain、记忆管理、流式输出
09
RAG 评估与调优
RAGAS 评估框架、忠实性 / 答案相关性 / 上下文精确率、常见失败模式诊断
10
生产级 RAG 系统设计
多租户架构、安全过滤、向量+图数据库混合存储、监控可观测性、成本控制
11
RAG 的困境与替代方向
朴素 RAG 的六大结构性痛点、四大替代方向地图(CAG/Agentic/Context Engineering/GraphRAG)、选型决策树
12
CAG 与长上下文
Cache-Augmented Generation 原理、Prompt Caching 工程实战、KV Cache 命中调试、CAG vs RAG 成本回本公式
13
Agentic RAG 与 Context Engineering
LangGraph 自反思检索、Coding Agent 直接读文件、GraphRAG 实体关系、ColPali 视觉检索的混合生产蓝图