docs: 补充OpenAI实验基准数据、分层信任和渐进授权模式

This commit is contained in:
2026-05-28 14:43:14 +08:00
parent acbab07616
commit d2b71041d8

View File

@@ -624,3 +624,31 @@ AI Agent在约束内执行编码
```
每一步都是**同步、串行、可观测**的 — 这是最简单的控制平面,但足以保障质量。
## OpenAi 实验数据(行业基准)
| 指标 | 数据 | 在本项目的意义 |
|---|---|---|
| 任务通过率 | **80%** 独立完成 | 20% 需要你介入的通常是架构/设计决策 |
| 最长单次运行 | **25 小时** | 复杂任务可以持续工作,不需实时监督 |
| 工程师时间分配 | **80% 设计 Harness** | 你的时间花在 AGENTS.md 和任务规划上 |
| 代码规模 | 百万行级 | 验证了 Harness Engineering 的规模化能力 |
### 分层信任模式
| 任务类型 | 信任级别 | 本项目的执行方式 |
|---|---|---|
| **简单**(单字段修复、编译错误) | 完全信任 | Agent 自主执行 + 编译门禁 |
| **中等**(跨模块数据流、新增字段) | 自动审查 + 抽样人工 | 数据流验证 + 你审查 diff |
| **关键**(架构变更、删文件、改签名) | 强制人工 | ❌ Agent 不可触碰 — 必须由你决策 |
### 渐进授权模式
```
阶段 1从简单任务开始 → 修复单字段遗漏(如 #597
阶段 2积累经验 → 处理跨模块联动
阶段 3建立信任 → 授予更多自主权
阶段 4持续迭代 → 每次失败优化 AGENTS.md
```
> 你的信任是通过每次编译通过 + 每次审查通过积累的。
> 每在 AGENTS.md 中增加一条规则,就减少一次你发现同类问题的概率。