bRAG-langchain: 构建企业级 RAG 系统指南 | #指南
项目通过 5 个循序渐进的 Jupyter notebooks,指导开发者从零开始构建、优化和部署企业级 RAG 系统,涵盖从基础配置到高级技术(如多查询、语义路由、重排序等)的全过程实践
项目的核心价值:
1. 提供了一个从入门到高级的完整 RAG 实现教程
2. 使用
@LangChainAI 框架构建
3. 包含了多个进阶技术的实现示例
项目包含 5 个主要教程笔记本,按难度递进:
1. 基础设置概述 ([1]_rag_setup_overview.ipynb)
- 环境配置
- 数据加载和预处理
- 使用 OpenAI 生成嵌入
- 向量数据库(ChromaDB/Pinecone)设置
- 基础 RAG 管道搭建
2. 多查询技术 ([2]_rag_with_multi_query.ipynb)
- 实现多查询检索
- 使用多个嵌入模型
- 对比单查询和多查询性能
3. 路由和查询构建 ([3]_rag_routing_and_query_construction.ipynb)
- 逻辑路由实现
- 语义路由(用于数学/物理问题分类)
- 结构化搜索模式
- 向量存储集成
4. 索引和高级检索 ([4]_rag_indexing_and_advanced_retrieval.ipynb)
- 多表示索引
- 文档摘要存储
- ColBERT 集成
- RAPTOR 实现
5. 检索和重排序 ([5]_rag_retrieval_and_reranking.ipynb)
- RAG-Fusion 多查询生成
- 倒数排名融合(RRF)
-
@cohere重排序
- CRAG 和 Self-RAG 检索