跳到主要内容

Legal Assistant

这个方案解决的是“高证据要求的法律助手 RAG”,重点不是把回答说得更像人,而是把依据链做得更可追溯。

1. 适合什么场景

  • 法规、政策、案例知识库问答
  • 需要证据引用的专业助手
  • 对版本、出处和审计要求较高的行业场景

它本质上是 RAG 的高约束变体,不适合用“普通聊天 + 长 prompt”直接硬撑。

2. 核心模块组合

这条方案通常会组合:

  • 文档解析与分块
  • IngestionPipeline
  • VectorStore
  • RagService
  • metadata 治理
  • citations / trace / evidence output

和普通 RAG 相比,它更强调:

  • 元数据完整性
  • 版本治理
  • 证据优先

3. 为什么它是高约束场景

法律场景里,真正重要的通常不是“文案自然”,而是:

  • 这段话依据什么得出
  • 引用来自哪份文档、哪个版本
  • 结果是否允许人工复核与回放

所以检索质量和证据引用,往往比回答表述本身更重要。

4. 需要特别注意什么

  • 法律场景属于高风险场景
  • 输出最好显式带证据来源
  • 关键结果应有人工复核流程
  • 不要把“检索不到”伪装成“法律上没有”

5. 先补哪些主线页

  1. Core SDK / Search & RAG
  2. Core SDK / Citations and Trace
  3. RAG Ingestion Vector Store

6. 继续看实现细节

如果你要看:

  • 数据流程
  • 元数据设计建议
  • 证据链组织方式
  • 示例伪代码

继续看深页:

7. 关键对象

这条方案最值得继续看的对象通常是:

  • IngestionPipeline
  • VectorStore
  • RagService
  • citations / trace 相关结果对象

它们共同决定证据链是否能从文档入库一直保持到最终回答。

8. 这类方案为什么不能只靠 prompt

对于法律、法规、政策等高约束场景,单纯把提示词写得更严厉并不能替代:

  • 稳定的 document identity
  • 完整的 metadata 设计
  • 可回放的检索结果
  • 明确的人工复核流程

因此这页真正强调的是证据工程,而不是回答文风。

9. 实施时优先确认什么

  • 文档版本与生效时间是否进入 metadata
  • 引用输出是否能定位到原始条款、章节或页面
  • 检索不到依据时,系统是否会显式暴露不确定性