上下文工程

当 Prompt 已经写得足够清楚,但 AI 仍然缺背景、读错资料、忘记前后文或触碰数据边界时,问题就不再是“怎么问”,而是“让 AI 在什么信息环境里工作”。这就是上下文工程。

适合知识密集团队 适合私有化前评估 适合多角色协作

核心结论

上下文工程不是把资料全塞给模型,而是筛选、组织、排序、压缩和隔离信息,让 AI 在正确边界内完成任务。

适合谁

任务依赖内部知识库、客户资料、合同、历史案例、项目记录,且不同角色看到的信息不同的团队。

交付什么

上下文地图、知识分层、检索规则、权限策略、记忆策略、上下文压缩规范和敏感信息边界。

建设框架

上下文工程的五个组成部分

1

业务背景

让 AI 理解任务发生在哪个业务场景。

2

知识来源

定义哪些文档、记录和数据可以被引用。

3

权限边界

明确不同角色、部门和任务能访问什么。

4

记忆策略

决定哪些历史信息需要保留,哪些应该丢弃。

5

压缩规则

把长资料压成可用上下文,减少噪音。

为什么 Prompt 不够了

Prompt Engineering 假设任务所需信息已经在当前对话里,或者用户能一次性提供清楚。但企业任务往往不是这样:资料散落在文档、表格、CRM、飞书、Notion、项目记录和历史邮件里,且每份资料都有时效、权限和可信度差异。

如果没有上下文工程,AI 会出现三类问题:第一,缺少关键背景,只能给通用建议;第二,被无关材料干扰,回答看似丰富但偏离业务;第三,读取了不该读取的数据,带来合规和信任风险。

上下文分层:不要把所有资料混在一起

层级 内容 管理重点
任务上下文 本次任务目标、输入材料、约束和输出要求。 保证短期任务清晰,不夹带无关信息。
业务上下文 客户背景、项目阶段、行业规则、内部术语。 让 AI 理解“为什么要做”和“给谁看”。
知识上下文 制度、案例、合同、FAQ、研究文档、产品资料。 控制来源、更新周期、引用规则和可信度。
权限上下文 角色、部门、数据等级、访问范围和脱敏规则。 防止越权读取和敏感信息泄露。
记忆上下文 历史偏好、历史决策、任务进展和用户反馈。 决定保留、更新、遗忘和人工确认机制。

四步建设上下文工程

第 1 步:画出上下文地图

先列出一个任务需要哪些信息:业务背景、输入资料、历史记录、权限规则、输出受众。不要先急着接知识库,否则很容易把“资料多”误认为“上下文好”。

第 2 步:给资料分级

按公开资料、内部资料、客户资料、商业机密、合规敏感数据分级。每一级对应不同处理方式:可直接使用、需脱敏、只本地检索、必须人工审批。

第 3 步:设计检索与压缩规则

检索不是越多越好。要定义召回数量、排序逻辑、去重规则、过期资料处理、长文摘要方式和引用来源,避免模型被噪音淹没。

第 4 步:设置权限和审计口径

谁触发任务、任务调用了哪些资料、哪些内容被模型读取、最终输出给谁,都应该能被记录。上下文工程和安全治理天然绑在一起。

上下文工程自检清单

  • 这个任务需要哪些背景信息,哪些只是噪音?
  • 资料来源是否有可信度、时效性和负责人?
  • 不同角色是否应该看到不同上下文?
  • 是否存在客户数据、合同、报价、内部制度等敏感资料?
  • 长资料是否有压缩规则,而不是直接全部塞给模型?
  • AI 输出是否需要引用来源或保留证据链?
  • 上下文调用过程是否能被审计和复盘?

建议交付物

上下文地图

列出任务需要的背景、资料、权限、记忆和输出受众。

数据与资料分级表

标注哪些资料可用、需脱敏、需本地处理或需人工审批。

检索与压缩规范

定义召回、排序、引用、摘要和过期资料处理规则。

权限与审计口径

明确角色访问边界、调用日志和异常处理方式。