Guide
构建RAG系统指南:架构、检索实现与质量门禁
一个围绕个人知识库RAG问答系统组织的三篇式阅读指南,串联系统边界、检索实现、质量评测、安全防护和发布门禁。
这份指南不是一篇单独长文,而是一个围绕“如何把公开知识问答从Demo推进到可发布系统”的阅读入口。它把三篇RAG文章组织成一条递进路径:先确定系统边界,再落到检索实现,最后用质量、安全和发布证据决定能不能打开公开入口。
它适合个人知识库、文档站和小型知识库的RAG系统设计。不覆盖多租户权限、内部机密文档、PII合规处理或企业审计报表。
如何阅读
如果你还没有系统边界,先读第一篇;如果你已经有Worker或后端服务,但召回质量不稳定,直接进入第二篇;如果你准备公开/chat入口,第三篇应该先于发布执行。
三篇文章
-
- 回答“公开入口、三存储分层和发布前索引同步分别落在哪个边界”。
- 重点包括Cloudflare Workers、Vectorize、D1 FTS5、KV、混合检索和增量索引闭环。
- 适合在选型、边界划分和索引发布流程还没有冻结时阅读。
-
- 回答“索引期怎么切、查询期怎么召回、当前页总结怎么分流、rerank失败怎么降级”。
- 重点包括分块策略、稳定chunk ID、Vectorize与D1 FTS5并行召回、RRF融合、规则意图识别和当前页总结。
- 适合在召回不稳定、引用来源漂移或精确信号经常漏召时阅读。
-
RAG质量评测与安全防护:从Rule-Based Evaluation到发布门禁
- 回答“答得对不对、该不该让请求继续往下游走、这一版能不能发布”。
- 重点包括检索/引用/回答三层评估、固定Evaluation Set、六层安全防护、Debug Report、Closeout Gate和Reverse Audit。
- 适合在准备上线公开问答入口或需要把RAG质量纳入发布门禁时阅读。
核心问题
读完三篇文章后,你应该能回答:
- 个人知识库、文档站或小型知识库的RAG系统边界应该如何划分?
- 分块、混合检索、意图识别和当前页总结应该如何组合?
- 打开公开
/chat入口前,需要哪些质量证据和安全门禁?
推荐实践顺序
- 先冻结公开内容边界和索引来源,只从发布后的
dist导出corpus。 - 为每篇文档生成稳定
documentId、documentHash和chunk ID。 - 同时保留向量召回和关键词召回,不把精确匹配完全交给embedding。
- 对当前页总结、站内问答和低相关性fallback分别设计规则。
- 用固定Evaluation Set覆盖检索、引用、回答、fallback和语言行为。
- 发布前执行
rag:export、rag:audit、dry-run ingest、apply、verify和answer-quality评估。
与AI工程化地图的关系
RAG公开知识入口解决的是“AI回答是否被站内证据约束”。它和AI-TDD、BMAD/Speckit、交付门禁属于同一张AI工程化地图:RAG负责知识边界,AI-TDD负责验收契约,门禁负责把结果变成可复核证据。
Next step
继续深入这个专题
这份指南属于 AI 工程化实践 专题。你可以回到专题页查看完整路径,也可以继续按推荐顺序阅读指南和文章。
Reading path
继续阅读这个专题
AI 工程化落地实践地图
从RAG知识入口、需求契约、AI-TDD Manifest、BMAD/Speckit 工作流、交付门禁到训练数据闭环的 AI 工程化实践导航。
构建RAG系统指南:架构、检索实现与质量门禁
一个围绕个人知识库RAG问答系统组织的三篇式阅读指南,串联系统边界、检索实现、质量评测、安全防护和发布门禁。
AI-TDD: 需求契约驱动与多维证据链验收框架
AI-TDD 先把人类意图固化为 Manifest 需求契约,再用可复核证据链和 Gate 裁决验收 AI 生成结果。
技术解读索引 | Curated Translations
原创技术解读与精选国外技术社区文章,探索AI工程化最佳实践