From d2b71041d83d558753cb6d9e64dccda00086acd5 Mon Sep 17 00:00:00 2001
From: zhaoyun <zhaoyun@gentronhealth.com>
Date: Thu, 28 May 2026 14:43:14 +0800
Subject: [PATCH] =?UTF-8?q?docs:=20=E8=A1=A5=E5=85=85OpenAI=E5=AE=9E?=
 =?UTF-8?q?=E9=AA=8C=E5=9F=BA=E5=87=86=E6=95=B0=E6=8D=AE=E3=80=81=E5=88=86?=
 =?UTF-8?q?=E5=B1=82=E4=BF=A1=E4=BB=BB=E5=92=8C=E6=B8=90=E8=BF=9B=E6=8E=88?=
 =?UTF-8?q?=E6=9D=83=E6=A8=A1=E5=BC=8F?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 AGENTS.md | 28 ++++++++++++++++++++++++++++
 1 file changed, 28 insertions(+)

diff --git a/AGENTS.md b/AGENTS.md
index 0753096ed..ebdec8702 100755
--- a/AGENTS.md
+++ b/AGENTS.md
@@ -624,3 +624,31 @@ AI Agent（我）在约束内执行编码
 ```
 
 每一步都是**同步、串行、可观测**的 — 这是最简单的控制平面，但足以保障质量。
+
+## OpenAi 实验数据（行业基准）
+
+| 指标 | 数据 | 在本项目的意义 |
+|---|---|---|
+| 任务通过率 | **80%** 独立完成 | 20% 需要你介入的通常是架构/设计决策 |
+| 最长单次运行 | **25 小时** | 复杂任务可以持续工作，不需实时监督 |
+| 工程师时间分配 | **80% 设计 Harness** | 你的时间花在 AGENTS.md 和任务规划上 |
+| 代码规模 | 百万行级 | 验证了 Harness Engineering 的规模化能力 |
+
+### 分层信任模式
+
+| 任务类型 | 信任级别 | 本项目的执行方式 |
+|---|---|---|
+| **简单**（单字段修复、编译错误） | 完全信任 | Agent 自主执行 + 编译门禁 |
+| **中等**（跨模块数据流、新增字段） | 自动审查 + 抽样人工 | 数据流验证 + 你审查 diff |
+| **关键**（架构变更、删文件、改签名） | 强制人工 | ❌ Agent 不可触碰 — 必须由你决策 |
+
+### 渐进授权模式
+```
+阶段 1：从简单任务开始 → 修复单字段遗漏（如 #597）
+阶段 2：积累经验 → 处理跨模块联动
+阶段 3：建立信任 → 授予更多自主权
+阶段 4：持续迭代 → 每次失败优化 AGENTS.md
+```
+
+> 你的信任是通过每次编译通过 + 每次审查通过积累的。
+> 每在 AGENTS.md 中增加一条规则，就减少一次你发现同类问题的概率。