AI 法规与合规

本节定位

讲法规最容易让人觉得离技术很远。
但一旦系统真的进入：

企业环境
商业产品
高风险行业

你会很快发现：

合规不是最后才补的一层，而是会反过来影响系统结构。

这节课就是想把这个关系讲清楚。

学习目标

理解为什么 AI 合规问题会直接影响产品设计
理解风险分级、审计、可追溯性这些关键词为什么重要
学会把法规要求转译成系统要求
建立“法规问题不是法务单独处理，而是技术也必须参与设计”的视角

一、为什么法规问题离工程师并不远？

1.1 一个常见误解

很多技术同学会下意识觉得：

法规是法务的事
模型是工程的事

但实际项目里，这两者经常会直接相遇。

1.2 为什么会相遇？

因为很多法规要求本质上最后都会变成这些问题：

你有没有日志
你能不能追溯来源
你有没有权限控制
你能不能人工接管

也就是说：

法规要求最终经常会落成系统能力要求。

所以合规不是后置检查，而经常是架构输入。

二、最常见的合规关注点有哪些？

2.1 数据与隐私

系统是否处理了：

个人信息
敏感信息
企业内部数据

2.2 可追溯性

系统是否能解释：

这条答案从哪来
哪些数据被用过
哪一步做了什么

2.3 风险分级

不同系统风险等级不同。
并不是所有生成系统都要同样强的管控。

2.4 人工监督与申诉机制

在高风险场景里，系统通常不能完全自动闭环。

三、一个很实用的工程翻译思路

把法规要求翻成系统要求，通常可以这样看：

法规 / 合规问题	工程上会变成什么要求
数据保护	脱敏、权限控制、最小化留存
可解释 / 可追溯	日志、trace、来源引用
高风险决策限制	人工确认、双重审批、拒绝自动执行
审计能力	操作记录、版本记录、请求留痕

这张表非常重要，因为它让“合规”从抽象词变成了可工程化的问题。

四、为什么“可追溯性”几乎成了 AI 合规里的高频词？

因为很多 AI 系统的问题不是“输出错了”这么简单，而是：

你不知道它为什么错
你不知道它用了什么数据
你不知道是哪个模块出了问题

所以合规上经常会非常看重：

来源引用
任务 trace
决策日志

你可以把它理解成：

不只是系统要跑出来，还要能回头查出来。

五、风险分级为什么对 AI 系统特别重要？

并不是所有 AI 应用都应该按同一种强度管控。

例如：

一个海报生成器
一个医疗建议助手

它们的风险显然不在一个量级。

所以一个很核心的思想是：

治理和合规通常是分级的，不是“一刀切”的。

这会影响：

是否需要人工确认
是否允许自动决策
是否要求更强审计

六、一个最小“合规要求 -> 系统配置”示意

compliance_config = {
    "data_traceable": True,
    "human_override": True,
    "audit_log_enabled": True,
    "sensitive_action_requires_approval": True
}

print(compliance_config)

这个例子虽然简单，但在表达一个很重要的思路：

合规要求最后经常会变成系统开关、策略和流程。

七、在 AIGC / Agent 场景里，哪些地方最容易碰到合规问题？

7.1 检索和知识库

如果系统会查内部文档，那就一定会涉及：

权限边界
来源范围

7.2 工具调用

如果系统会：

发邮件
改数据库
调企业系统

那自动执行风险会很快出现。

7.3 生成内容

如果系统会生成：

面向用户的建议
营销文案
合同草稿

那内容责任和误导风险就会上来。

八、为什么“人类在环（human-in-the-loop）”会越来越重要？

因为很多场景里，法规和合规最关心的不是：

模型能不能输出

而是：

最终关键动作是不是仍然有人能管住

例如：

高风险审批
对外正式发布
涉及法律和财务的决定

这意味着：

很多系统设计上需要预留“人工接管点”。

这既是合规要求，也是工程要求。

九、一个很重要的工程习惯

如果你在做高风险 AI 应用，建议养成这种思路：

先问系统属于什么风险等级
再问需要哪些日志和追踪
再问哪些动作必须人工确认
最后再谈模型和工作流怎么实现

这会比“先把系统做完再补合规”稳得多。

十、小结

这一节最重要的不是背法规条文，而是理解：

AI 法规与合规真正会落到技术侧的地方，通常是数据边界、日志追踪、权限控制和人工确认机制。

只要你开始这样看问题，合规就不再是“离工程很远的词”，而会变成你设计系统时必须正面考虑的一层。

练习

选一个你熟悉的 AI 系统，试着列出它在“数据、日志、权限、人工确认”四方面的要求。
想一想：为什么“可追溯性”会成为很多 AI 合规讨论里的核心词？
用自己的话解释：为什么说风险分级会直接影响系统设计？
试着把“合规”翻译成三个你能落到系统里的具体技术要求。

学习目标​

一、为什么法规问题离工程师并不远？​

1.1 一个常见误解​

1.2 为什么会相遇？​

二、最常见的合规关注点有哪些？​

2.1 数据与隐私​

2.2 可追溯性​

2.3 风险分级​

2.4 人工监督与申诉机制​

三、一个很实用的工程翻译思路​

四、为什么“可追溯性”几乎成了 AI 合规里的高频词？​

五、风险分级为什么对 AI 系统特别重要？​

六、一个最小“合规要求 -> 系统配置”示意​

七、在 AIGC / Agent 场景里，哪些地方最容易碰到合规问题？​

7.1 检索和知识库​

7.2 工具调用​

7.3 生成内容​

八、为什么“人类在环（human-in-the-loop）”会越来越重要？​

九、一个很重要的工程习惯​

十、小结​

练习​