RAG · Vector Database · 2025

检索增强生成
向量数据库实战

从原理到生产，系统学习 RAG 架构设计、Embedding 工程、向量检索优化与 LLM 集成

13 系统章节

50+ 代码示例

2025 最新技术栈

生产级系统设计

🔍

为什么学 RAG

LLM 知识有截止日期且容易幻觉，RAG 让模型实时访问知识库，大幅提升回答准确性与可信度。

🗄️

向量数据库核心

深入掌握 Qdrant、Chroma、Milvus 的索引原理（HNSW/IVF）与生产部署，做到知其所以然。

⚡

工程化实战

覆盖 LlamaIndex 0.10+、LangChain 0.3+、完整的 RAG 流水线搭建、评估与性能调优。

🏗️

生产级架构

多租户设计、安全过滤、混合检索、可观测性、成本控制——直接应用于企业级 AI 产品。

课程目录

13 章系统学习，从零到生产级 RAG，再到 CAG / Agentic RAG 等替代方向

RAG 是什么：原理与架构全景

检索增强生成定义、LLM 局限性、完整 RAG 流程、Naive/Advanced/Modular RAG 对比

文档处理与分块策略

PDF/Word/网页加载、固定/语义/递归分块、chunk_size 与 overlap 调优

Embedding 模型原理

向量嵌入原理、语义相似度、主流模型对比（OpenAI / BGE / M3E / Jina）、维度选择

向量数据库选型

Qdrant / Chroma / Pinecone / Weaviate / Milvus 横向对比、HNSW/IVF 索引原理、选型决策树

安装部署、Collection 设计、向量写入与查询、过滤器、Python SDK 完整示例

检索策略优化

BM25 稀疏检索、稠密检索、混合检索、Reranker 重排序、MMR 多样性算法

LlamaIndex 构建 RAG

核心抽象（Index/Node/Query Engine）、VectorStoreIndex、增量更新策略

LangChain RAG 进阶

LCEL 链式组合、ConversationalRetrievalChain、记忆管理、流式输出

RAG 评估与调优

RAGAS 评估框架、忠实性 / 答案相关性 / 上下文精确率、常见失败模式诊断

生产级 RAG 系统设计

多租户架构、安全过滤、向量+图数据库混合存储、监控可观测性、成本控制

RAG 的困境与替代方向

朴素 RAG 的六大结构性痛点、四大替代方向地图（CAG/Agentic/Context Engineering/GraphRAG）、选型决策树

CAG 与长上下文

Cache-Augmented Generation 原理、Prompt Caching 工程实战、KV Cache 命中调试、CAG vs RAG 成本回本公式

Agentic RAG 与 Context Engineering

LangGraph 自反思检索、Coding Agent 直接读文件、GraphRAG 实体关系、ColPali 视觉检索的混合生产蓝图