文章证据工作法
如果只靠“这篇文章大概在讲 harness”来读材料,最后很容易把对象、机制、实践和作者自己的 framing 混成一层。这个页面提供一套更稳定的读法,让 关键文章、概念入口 和 生态与比较 用同一把尺子工作。
这套方法想解决什么
Section titled “这套方法想解决什么”它主要解决两个常见问题:
问题一同一篇文章里,原文明确说的话、作者自己搭的 framing、以及我们为了比较而做的解释,经常被混写问题二不同文章虽然都在谈AI Agents、Agent Harnesses、Harness Engineering,但真正承重的要素并不一样
因此,本文采用两步读法:
- 先看文章把注意力压在什么
要素 - 再看一句判断属于哪一种
句子
第一步:先看六个要素
Section titled “第一步:先看六个要素”先不要急着问“作者站哪边”,先问这篇文章到底把什么当作主轴。
| 要素 | 它在看什么 | 常见问题 |
|---|---|---|
回路 / 编排 | 任务怎样被拆开、推进、续跑,代理回路怎样组织 | 谁决定下一步,失败怎样回流 |
工具 / ACI | 工具定义、边界、参数、返回结构怎样塑造代理行为 | 为什么工具同样可用,但代理表现差很多 |
状态 / 上下文 | 进度、记忆、持久化、压缩、跨上下文续跑怎样成立 | 为什么代理一换窗口就像“换班失忆” |
宿主 / 协议 | 运行时、客户端、线程会话原语、宿主边界怎样暴露出来 | 多个客户端怎样共享同一个 agent runtime |
验证 / 反馈 | 测试、浏览器验证、日志、评审、错误回流怎样形成闭环 | 怎样防止代理过早宣布完成 |
治理 / 控制 | 人类控制面、规则、架构约束、合并纪律怎样被工程化 | 怎样在高吞吐下保持可读、可控、可恢复 |
为了做跨文章比较,仓库里会用一组 研究解释 权重来表达文章重心:
极高文章主论证基本围绕这个要素展开高承重支柱之一,但不是唯一主轴中明确涉及,但更多在服务主轴低只作为背景、边界或轻度触及
这不是官方分级,而是为了把不同来源放进同一张比较坐标里。
第二步:再区分三种句子
Section titled “第二步:再区分三种句子”看完“这篇文章更重什么”,再判断“这句话到底属于哪一层”。
| 句子类型 | 它是什么 | 该怎么用 |
|---|---|---|
可直接回原文确认 | 文章里明确写出来、可以回源核对的内容 | 可当作一手支撑材料 |
原文 framing | 作者如何设题、如何限制边界、希望你从哪里看问题 | 帮助理解文章重心,但不自动等于跨项目定义 |
本文解释 | 为了比较而做出的仓库解释 | 可以帮助建立坐标,但必须明确它不是原文自我定义 |
例如:
可直接回原文确认“Anthropic 区分workflows和agents”原文 framing“这篇文章把问题定义成 agentic systems 的构建方法”本文解释“因此它更适合放进Agent Harnesses的背景材料,不承担Harness Engineering实践页的主文角色”
如果这三层不分开,后面做比较时就会把“原文说了什么”和“仓库怎样解释它”写成一种声音。
在不同页面里,这套方法怎么用
Section titled “在不同页面里,这套方法怎么用”这里最适合同时使用两步:
- 先用六个要素判断每篇文章的重心
- 再用三种句子拆开原文、framing 和仓库解释
因此,关键文章页最适合承担“逐篇精读”和“时间线演进”。
这里不需要逐篇拆文章,但需要受这些文章约束:
- 概念定义尽量来自
可直接回原文确认 - 概念边界尽量参考多个来源的
原文 framing - 真正的工作定义与分类,明确写成
本文解释
因此,概念页更适合承担“定义、边界、层次”。
比较页最需要防止“把不同层的东西放在一起比”:
- 先回到关键文章确认哪些要素对当前比较最关键
- 再明确表格里哪些格子在写
官方表述,哪些格子在写研究解释 - 如果一个项目只是方法系统或交付套件,不要因为它也有 agent 就自动塞进
AI Agents - 太底层的 framework / runtime / orchestration 材料,除非直接影响当前比较对象,否则不必拉进本站主比较轴
因此,比较页更适合承担“同一把尺子的横向判断”。
一种更稳的阅读顺序
Section titled “一种更稳的阅读顺序”当你遇到一篇新材料,可以按下面顺序走:
- 先问:这篇文章主要压在哪几个
要素 - 再问:文中的关键判断属于哪种
句子 - 再问:它主要在说
AI Agents、Agent Harnesses,还是Harness Engineering - 最后问:这篇文章最适合被拿来支撑
定义、比较,还是实践总结
这样读,更容易把“材料本身”和“仓库解释”保持分层。
这套方法能帮助比较,但不保证所有文章都能被干净切开:
- 有些文章本来就在跨层讨论,比如同时谈运行回路和治理方法
- 有些词会漂移,比如
host、harness、workflow - 有些权重会随着生态演化而变化,不应该被当成永久定性
因此,这套方法更像稳定工作法,而不是最终标准答案。