Hualin Luan Cloud Native · Quant Trading · AI Engineering

Guide

构建RAG系统指南:架构、检索实现与质量门禁

一个围绕个人知识库RAG问答系统组织的三篇式阅读指南,串联系统边界、检索实现、质量评测、安全防护和发布门禁。

专题 · AI 工程化实践
RAG 边缘计算 Cloudflare 混合检索 质量评测 安全防护

Meta

Updated

2026/5/29

Order

2

这份指南不是一篇单独长文,而是一个围绕“如何把公开知识问答从Demo推进到可发布系统”的阅读入口。它把三篇RAG文章组织成一条递进路径:先确定系统边界,再落到检索实现,最后用质量、安全和发布证据决定能不能打开公开入口。

它适合个人知识库、文档站和小型知识库的RAG系统设计。不覆盖多租户权限、内部机密文档、PII合规处理或企业审计报表。

如何阅读

如果你还没有系统边界,先读第一篇;如果你已经有Worker或后端服务,但召回质量不稳定,直接进入第二篇;如果你准备公开/chat入口,第三篇应该先于发布执行。

三篇文章

  1. RAG系统架构设计:边缘计算、混合检索与增量索引闭环实战

    • 回答“公开入口、三存储分层和发布前索引同步分别落在哪个边界”。
    • 重点包括Cloudflare Workers、Vectorize、D1 FTS5、KV、混合检索和增量索引闭环。
    • 适合在选型、边界划分和索引发布流程还没有冻结时阅读。
  2. RAG检索实现深度解析:分块策略、混合检索与意图识别

    • 回答“索引期怎么切、查询期怎么召回、当前页总结怎么分流、rerank失败怎么降级”。
    • 重点包括分块策略、稳定chunk ID、Vectorize与D1 FTS5并行召回、RRF融合、规则意图识别和当前页总结。
    • 适合在召回不稳定、引用来源漂移或精确信号经常漏召时阅读。
  3. RAG质量评测与安全防护:从Rule-Based Evaluation到发布门禁

    • 回答“答得对不对、该不该让请求继续往下游走、这一版能不能发布”。
    • 重点包括检索/引用/回答三层评估、固定Evaluation Set、六层安全防护、Debug Report、Closeout Gate和Reverse Audit。
    • 适合在准备上线公开问答入口或需要把RAG质量纳入发布门禁时阅读。

核心问题

读完三篇文章后,你应该能回答:

  • 个人知识库、文档站或小型知识库的RAG系统边界应该如何划分?
  • 分块、混合检索、意图识别和当前页总结应该如何组合?
  • 打开公开/chat入口前,需要哪些质量证据和安全门禁?

推荐实践顺序

  1. 先冻结公开内容边界和索引来源,只从发布后的dist导出corpus。
  2. 为每篇文档生成稳定documentIddocumentHash和chunk ID。
  3. 同时保留向量召回和关键词召回,不把精确匹配完全交给embedding。
  4. 对当前页总结、站内问答和低相关性fallback分别设计规则。
  5. 用固定Evaluation Set覆盖检索、引用、回答、fallback和语言行为。
  6. 发布前执行rag:exportrag:audit、dry-run ingest、apply、verify和answer-quality评估。

与AI工程化地图的关系

RAG公开知识入口解决的是“AI回答是否被站内证据约束”。它和AI-TDD、BMAD/Speckit、交付门禁属于同一张AI工程化地图:RAG负责知识边界,AI-TDD负责验收契约,门禁负责把结果变成可复核证据。

Next step

继续深入这个专题

这份指南属于 AI 工程化实践 专题。你可以回到专题页查看完整路径,也可以继续按推荐顺序阅读指南和文章。

返回专题页

Reading path

继续阅读这个专题