构建RAG系统指南：架构、检索实现与质量门禁

这份指南不是一篇单独长文，而是一个围绕“如何把公开知识问答从Demo推进到可发布系统”的阅读入口。它把三篇RAG文章组织成一条递进路径：先确定系统边界，再落到检索实现，最后用质量、安全和发布证据决定能不能打开公开入口。

它适合个人知识库、文档站和小型知识库的RAG系统设计。不覆盖多租户权限、内部机密文档、PII合规处理或企业审计报表。

如何阅读

如果你还没有系统边界，先读第一篇；如果你已经有Worker或后端服务，但召回质量不稳定，直接进入第二篇；如果你准备公开/chat入口，第三篇应该先于发布执行。

RAG系统架构设计：边缘计算、混合检索与增量索引闭环实战
- 回答“公开入口、三存储分层和发布前索引同步分别落在哪个边界”。
- 重点包括Cloudflare Workers、Vectorize、D1 FTS5、KV、混合检索和增量索引闭环。
- 适合在选型、边界划分和索引发布流程还没有冻结时阅读。
RAG检索实现深度解析：分块策略、混合检索与意图识别
- 回答“索引期怎么切、查询期怎么召回、当前页总结怎么分流、rerank失败怎么降级”。
- 重点包括分块策略、稳定chunk ID、Vectorize与D1 FTS5并行召回、RRF融合、规则意图识别和当前页总结。
- 适合在召回不稳定、引用来源漂移或精确信号经常漏召时阅读。
RAG质量评测与安全防护：从Rule-Based Evaluation到发布门禁
- 回答“答得对不对、该不该让请求继续往下游走、这一版能不能发布”。
- 重点包括检索/引用/回答三层评估、固定Evaluation Set、六层安全防护、Debug Report、Closeout Gate和Reverse Audit。
- 适合在准备上线公开问答入口或需要把RAG质量纳入发布门禁时阅读。

读完三篇文章后，你应该能回答：

RAG公开知识入口解决的是“AI回答是否被站内证据约束”。它和AI-TDD、BMAD/Speckit、交付门禁属于同一张AI工程化地图：RAG负责知识边界，AI-TDD负责验收契约，门禁负责把结果变成可复核证据。