人+LLM 协同认知方法论 v2.4 完整手册
→ 返回适用性指南
0. 这不是什么
- 不是 SOUL.md——SOUL 定义"你是谁",不定"怎么做事"
- 不是 MEMORY.md——记忆记录"做了什么",不提炼"怎么做才有效"
- 不是 prompt 模板——不规定格式,只描述经验证有效的模式
这是一个操作模式手册。 你可以抄结构、抄机制、抄节奏,但具体内容在每个子项目中重新生长。
一、核心机制:三体认知架构
两个子项目收敛到同一个有效架构:人 + LLM + 外部Agent 不是"一个人用两个AI",而是三个不同认知体之间的协同:
人类协作者 LLM(DeepSeek等) 外部Agent(Kimi/Hunyuan等)
│ │ │
├─── 方向判断 ──────────┤ │
│ · 直觉过滤 │ │
│ · 框架守护 │ │
│ · 价值观锚定 │ │
│ ├─── 广度扫描 ─────────────┤
│ │ · 分类学覆盖 │
│ │ · 模式识别 │
│ │ · 结构生成 │
│ │ ├─── 独立推演
│ │ │ · 盲区探测
│ │ │ · 对抗性检验
│ │ │ · 新方向注入
│ │ │
├─── 最终裁决 ──────────┼──────────────────────────┤关键原则:
- 三个认知体的训练数据、架构偏好、优化目标各不相同 → 它们的"棱镜折射"不同 → 三源交叉的目的不是找"一致性",而是利用不一致性暴露盲区
- 人类在此架构中的角色是框架守护者,不是领域专家——不需要判断跨域内容的真伪,只需要判断是否通过了框架的门槛检验
- 核心约束:三个LLM的差异远小于一个LLM和一个人的差异。外部Agent反馈的"一致性"不等于"正确"——可能只是三个LLM共享同一训练数据分布的偏差
1.1 三源冲突消解协议
当三源交叉产生不一致时,不再简单标记"不一致=盲区候选",而是按以下树状协议处理:
三源交叉结果
│
├── 全一致 → ⚠️ 触发"共享偏差警报"
│ → 强制找外部验证(人类直觉质疑、独立文献比对)
│ → 记录:"三源一致,但我们可能共享同一片认知大陆"
│
├── 2:1 不一致 → 多数方必须解释"少数方遗漏了什么"
│ → 少数方必须解释"我看到了什么多数方没看到的"
│ → 记录双方推理链
│
└── 全不一致 → 三源各自独立解释自己的推理链
→ 重点不是投票选赢家,而是理解"为什么棱镜折射不同"
→ 可能发现:问题定义本身需要重写核心洞察(来自project-co-cognition-map实战):当三个LLM一致但全错时,问题不在LLM——在问题定义本身把三个LLM都引到了同一片认知大陆。此时应怀疑的不是答案,而是问题。
二、五步探索框架(原四步,新增步0)
从两个子项目中提取的通用探索节奏。v2.0 新增步0(选题定位),并引入轻量级回滚协议。
| 步 | 做什么 | 核心问题 | 人类角色 | 预估认知负荷 |
|---|---|---|---|---|
| 0 | 选题定位 | "我们正在探索的领域里,真正值得问的问题是什么?" | 用三个外部Agent独立提"这个领域最该被探索的三个未知"→ 交叉对比后选方向 | 中 |
| 1 | 问题定位 | "我们到底要做什么?" | 提出4种可能理解(A/B/C/D)→ 选择主干 → 排除错误方向 | 高 |
| 2 | 框架构建 | "用什么标准判断好坏?" | 从零建构分类/评分体系。关键是非机械——不能从上一个项目照搬框架格式 | 高 |
| 3 | 填充推演 | "框架里装什么?" | 执行分层扫描(R1候选→R2快扫→R3深标)。此阶段人类角色是指定节奏和直觉过滤 | 高 |
| 4 | 收束发布 | "怎么让别人看懂?" | 分层输出(概览→详情→方法报告),版本化发布 | 中 |
2.1 步0:选题定位(新增)
在"问题定位"之前,先问一个元问题:我们正在探索的领域里,真正值得问的问题是什么?
做法:
- 三个外部Agent各自独立回答:"在这个领域里,最该被探索的三个未知是什么?"——只给领域描述,不给已有项目背景
- 交叉对比三份回答:找出重叠主题、独到视角、被忽略的方向
- 人类基于对比结果选择探索方向
何时可以跳过步0:当问题已经非常明确("我们就是要做X"),且多个独立视角都确认X是当前最有价值的方向时。
2.2 轻量级回滚协议
原v1.0的"每一步必须彻底完成再进入下一步"在实践中过于僵化——有时填充阶段才发现框架设计不合理,收束阶段才发现定位偏差。
v2.0 规则:
- 每一步仍需"彻底完成"再进入下一步——这是默认节奏
- 但允许最多回退一步,前提是必须回答三个问题:
- "什么新证据(不是新感觉)让我认为需要回退?"
- "回退后我要检视什么具体问题?"
- "如果回退后仍然没有解决,我的止损线是什么?"
- 回退后不从头开始——带着问题复检,只修正受影响的模块
- 每次回退记录于变更日志,标注回退原因和新证据
不允许:连续回退(A→B→A→B)。如果发生,说明问题不在执行层而在框架本身——暂停,重新做步1。
2.3 认知负荷管理
本方法论对人的认知要求很高(抽象思维、直觉过滤、元认知自检),v2.0 引入负荷管理:
| 负荷等级 | 典型阶段 | 行为规则 |
|---|---|---|
| 🔴 高 | 问题定位、框架构建、填充推演 | 前序安排一段低负荷过渡期;不要连续两个高负荷阶段;单次高负荷不超过45分钟 |
| 🟡 中 | 选题定位、收束发布、自检填写 | 可以连续执行;出现疲劳信号时降级为低负荷活动 |
| 🟢 低 | 阅读外部Agent反馈、整理文档、版本更新 | 可作为高负荷之间的缓冲区 |
疲劳信号(任一出现即暂停高负荷工作):
- 判断开始趋同("都差不多")
- 对框架产生厌烦
- 跳过自检项("这个我知道没问题")
- 直觉过滤的区分度下降
2.4 项目类型判定与盲区自检模式选择
在进入步 1 之前,先判定项目类型并选择对应的盲区自检模式。不同类型项目的盲区性质完全不同——不能共用一套自检模板。
类型 A:理论框架型项目
- 特征:主要产出是概念框架、分类学、判断矩阵、评分体系。不直接依赖不可控的外部数据。
- 主要风险:证据等级 mismatch——以 L5(反复验证的事实)的语气讲 L1(纯理论推演)的故事。而且因为逻辑自洽会掩盖证据不足,这种风险比经验型项目更难被察觉。
- 盲区自检模式:证据等级标注
- 为每个关键论断标注证据来源等级:
- L1:理论推演(无独立经验验证)
- L2:类比外推(从其他领域经验迁移)
- L3:相关性证据(观察到相关但无因果证明)
- L4:实验证据(≥1 个独立实验/研究)
- L5:独立复制(≥2 个独立实验室确认)
- 检查:全文的最高证据等级不超过实际拥有的最高等级——如果一个项目没有任何 L4 证据,全文就不应该有 L4 级别的断言
- 检查:是否有 L1-L2 级证据以 L4-L5 级确定性呈现的论断?这是理论型项目最常见的失败模式
- 检查:每个核心假设是否有可写下来的推翻条件(即使推翻概率极低)——"如果 X 成立,这个假设就错了"
- 为每个关键论断标注证据来源等级:
类型 B:经验推演型项目
- 特征:主要产出是情景分析、趋势预判、竞争推演。依赖不可控的外部数据和市场预判。
- 主要风险:核心假设被现实快速修正——盲区在被发现之前已经造成了后果。反馈来自外部世界,不是你主动找出来的。
- 盲区自检模式:推翻条件预写 + 信号监控
- 为每个核心主张写下:"如果 X 发生了,这个主张就错了"
- 为每个推翻条件设定可观测信号——"我怎么知道 X 是否正在发生?"
- 每 N 个月重检推翻信号(N 取决于项目的更新频率和外部世界的变化速度)
- 检查:是否有任何关键主张没有推翻条件?如果某个主张无论如何都可以解释为"对的",那它不是判断——是叙事。
类型判定规则:
| 项目主要问题 | 类型 | 首选盲区自检 | 补充自检 |
|---|---|---|---|
| "是什么/为什么"(框架/分类/机制) | A | 证据等级标注 | 推翻条件预写 |
| "会怎样/谁赢"(预测/推演/排序) | B | 推翻条件预写 + 信号监控 | 证据等级标注 |
| 两者兼具 | 主类型判定 | 主类型自检模式 | 另一类模式作为补充 |
关键警戒:类型 A 的盲区自检比类型 B 更容易被忽略,因为"逻辑自洽"会制造"一切正确"的假象。如果你是类型 A,你必须比类型 B 更警惕——因为你的反馈循环更长(逻辑自洽可能是回声),而现实不会自动纠正你。
2.5 收敛判断:探索行为的自然停止点
核心主张:好的方法论探索有自然收敛机制——不是被外部 deadline 逼停的,而是被"探索地形"本身引导到终点的。识别这个收敛点是一种元认知技能——需要与"认知偷懒"(F4)区分开来。
探索的自然生命周期
发散阶段 → 深化阶段 → 收敛阶段 → 闭包阶段
新概念涌现 填充验证 修正取代开创 边际收益 < 阈值当前 METHODOLOGY 有引导发散→深化的机制(步 0-3),也有闭包的输出格式(步 4),但缺少从深化到收束的过渡判断——"我怎么知道深化已经结束了,该收束了?"
收敛信号清单
满足 ≥3 条即触发收敛检查:
| # | 信号 | 说明 |
|---|---|---|
| S1 | 反馈降级 | 外部 Agent 的反馈从"发现新东西"变成"措辞建议"和"格式修正" |
| S2 | 自检趋同 | 连续两轮自检清单的结果高度相似——没有新的"怀疑过什么" |
| S3 | 穷举感 | 对"接下来还能问什么"的回答不是"X"而是"好像没有了,除非换框架" |
| S4 | 框架闭合 | 框架内的所有格位已被填充——不是填充的"完了",而是没有空的格位了 |
| S5 | 交叉饱和 | 各维度间的交叉推演不再产生新判断——现有判断被重新排列而非新产生 |
收敛 vs 偷懒的区分
这是本方法论最精细的元认知判断之一。F4(认知偷懒)的检测信号是"我应该继续但没有"——回避和模糊。收敛的信号是"我可以继续但边际收益低于阈值"——清晰和满足。
| 维度 | 自然收敛 | 认知偷懒 (F4) |
|---|---|---|
| 触发 | 探索地形耗尽 | 认知负荷超载 |
| 情绪标记 | "够了"——满足感 | "算了"——疲惫感 |
| 对"还能做什么"的回答 | 能清晰说出"没有了,因为 X/Y/Z 都已覆盖" | 说不清"因为……" |
| 重启后状态 | 即使休息几天再回来,也是同样的"没有了" | 休息后可能恢复探索动力 |
| 产出审查 | 回头看产出,覆盖率完整 | 回头看产出,有明确的"未触碰区域" |
经验参考(来自 P1 收敛过程):外部 Agent 三轮审阅后,新反馈边际价值急剧下降——hunyuan 终审反馈几乎全是格式和措辞问题;交叉推演完成后,九个判断建立,没有新的判断空间。这不是碰巧停下来的——是被探索对象的内在结构引导到这个终点的。
闭包协议
当触发收敛检查(≥3 个 S 信号)且排除偷懒后:
- 执行一次最终盲区自检——不是找出更多 bug,而是问:"如果这个项目到此为止,最大的未解问题是什么?"——写下来,作为产出的一部分
- 记录收敛原因——"我们停在这里不是因为 deadline,而是因为 S1/S3/S5"
- 将未解问题交给版本迭代队列——收敛不是"结束",是"这一版可以交付了"。下一版可以带着新前提、新数据、或新框架重新打开
三、搜索策略:广度→深度→陌生
适用于"不知道不知道什么"的探索型项目。三种搜索同时并行,而非先后:
| 策略 | 做什么 | 优势 | 盲区 |
|---|---|---|---|
| 源A:分类学扫描 | LLM按学科分类体系系统地扫一遍可能的方向 | 广度覆盖,不遗漏大类 | 受LLM训练数据分布影响;偏好"可清晰描述"的域 |
| 源B:基因辐射 | 从已有项目/方法论的核心基因出发,辐射邻近方向 | 深度连接已有基础,方向可控 | 被已有项目严重锚定;只能在"附近的可能"里找 |
| 源C:独立自由扫描 | 外部Agent不被告知已有项目背景,自主扫描 | 不受锚定;可能发现盲区 | 可能偏离项目方向;需要反锚定配额强制陌生领土 |
关键规则:
- 源A和源B不应由同一个LLM在同一次session中完成——锚定效应会污染广度扫描
- 源C的简报中不透露源A/源B的结果,只给框架方法论——否则"自由"就成了"补充"
- 源C必须设置反锚定配额:至少2个候选域必须来自源A/源B未覆盖的学科/方法论
四、A/B对抗性简报机制
从project-co-cognition-map源B和源C中验证为"产生真实收益"的机制:
做法:
- 生成两版简报发给外部Agent
- A版:标准的"请帮我做X"的任务描述
- B版:A版的镜像,但把任务转化为4条尖锐质疑——"如果我质疑你们的每个候选域,你们能回答什么?"
效果(已验证):
- 外部Agent面对B版时,自我怀疑深度显著增加(源C中Hunyuan主动承认2个候选域可能应该替换,Kimi放弃了5个候选域并逐条说明被哪条质疑击毙)
- A版产出的域在B版质疑下约30-40%被修正或降级——说明单独用A版会导致过度乐观
- 这不是"表演性的对抗"——外部Agent在没有真正挑战的情况下不会产生同等程度的自我反思
适用条件:
- 外部Agent有足够的推理能力(当前kimi和hunyuan均满足)
- 任务本身存在多个同样合理的方向(无唯一正确答案)
- 不适用于"查事实"类任务——只适用于"提出可能性"类任务
五、人类决策节奏
两个子项目中反复验证的模式:
| 原则 | 说明 |
|---|---|
| 集中审查,不分片判断 | 不要在每一小步后都停下来让人类做判断——认知碎片化。把同类判断收集到一起,一次性高效完成 |
| 直觉过滤先于精细评分 | 对于大量候选(50+),先做一轮快速的"感觉对不对"过滤,标记排除,再做精细评分。逐域精细评分会导致决策疲劳 |
| 框架操作优先于领域判断 | 人类不判断"这个域的内容是否准确"(需要领域专家),而是判断"这个域的框架得分是否合理"(需要元认知) |
| 统一自检,不逐域自检 | 认知纪律自检清单在整个阶段结束时统一填写——不是每做完一个域就填一次。分片自检会产生"我已经做了自检"的错觉 |
| 记录排除原因 | 每个被排除的候选域记录一句话原因。不是为辩护——是为后续重新审视时知道当时是怎么想的 |
5.1 人类角色混合模式(新增)
v1.0 将人类定位为"框架守护者"而非"领域专家"。但实践中,人类有时就是领域专家——此时角色不应被强制分割。
混合模式规则:
- 人类可同时担任"领域专家+框架守护者"
- 但必须标记"此刻我在哪个角色说话":
[领域专家]:输出的判断基于领域知识——"这个域的内容不对,因为……"[框架守护者]:输出的判断基于方法论——"这个域的框架得分不合理,因为……"
- 领域专家输出的内容,必须再由框架守护者角色做一次审查
- 两种角色的判断记录在同一文件中,用标签区分——方便后续追溯"哪个角色的判断被推翻"
为什么需要这个:当人类确实是领域专家时,强行压制领域知识是反效率的。但领域专家的自信和框架守护者的怀疑是两种不同的认知模式——分开标注可以防止"领域自信污染元认知审慎"。
六、失败模式分类学(新增)
v1.0 的质量防线和自检清单都是"出了问题怎么办",但没有系统地分类"通常出什么问题"。v2.0 建立失败模式分类,让每一个自检都绑定到具体防御目标。
核心失败模式
F1|框架偏移
症状:框架建完后,填充过程中不自觉漂移到了另一个问题
检测信号:回头看步1的问题定义,发现当前产出的答案已经不是针对原问题
防御:每个阶段开始时重读步1的问题定位(30秒)
F2|盲区遗漏
症状:三源都在同一块认知大陆上,有一整块大陆谁都没看到
检测信号:三源高度一致且没有真正"惊讶"的发现
防御:当三源全一致时触发共享偏差警报(见 §1.1)
F3|过度结构化
症状:把没有清晰结构的东西硬整出结构,制造虚假清晰
检测信号:框架的分类在直觉上感到牵强;"这个分类到底有用吗?"
防御:每个框架节点问"如果不这样分,还有什么分法?"——如果找不到替代,结构可能是在强加而非发现
F4|认知偷懒
症状:用了框架的"形"但没有用框架的"神"——走完流程但没真的思考
检测信号:自检清单全部打勾但回想不起具体"怀疑过什么"
防御:自检清单改为"列出具体怀疑过的项"而非"打勾"
F5|反馈循环
症状:LLM输出被人类接受→喂回LLM→自我强化→偏差固化
检测信号:多轮后产出方向越来越窄;外部Agent反馈开始趋同
防御:每3轮强制插入一次"零背景扫描"(外部Agent不被告知当前方向)
F6|锚定陷阱
症状:第一个被提出的方向严重锚定了后续所有探索方向
检测信号:源A/B/C都围绕同一个核心主题变奏
防御:源C的简报刻意不提已有发现;反锚定配额必须严格执行
F7|外部引用未验证
症状:URL、域名、API端点、外部数据引用被假设为"应该是这样",在多个文件中反复使用但从未实际访问证实
检测信号:同一个URL出现在 ≥3 个产出文件中但无一次实际浏览器访问记录
后果:发送出去的邮件/文档中的链接是死链——2026-05-21 实例:co-cognition-lab.pages.dev 应为 co-cognition.org,5 个 outreach 文件、已发送冷邮件和 MokaHR 附件全部失效
防御:任何外部引用(URL、API key、邮箱、数据格式)在首次使用时做一次实际访问/验证,记录在对应项目的 TOOLS.md 或 NOTES 中
F8|跨Session信息隔离 ⚡ 基础设施失败
性质:与 F1-F7 不同——F1-F7 是认知失败("人怎么想错了"),F8 是基础设施失败("系统怎么设计错了")
症状:同一错误信息(如URL、数据源、假设)在多个独立 session 中重复出现,因为各 session 不共享验证状态
实例:co-cognition-lab.pages.dev(错误域名)在 5+ 个文件的多个独立 session 中出现,每个 agent 都假设域名是对的,没有一个实际访问验证
根因:session 之间没有共享的"已验证事实注册表"
防御:交叉审查协议(见 §八.3)+ 共享事实注册表(见 §九.2)失败模式-自检绑定
每个自检问题都必须对应至少一个失败模式。v2.0 的自检清单直接标注目标失败模式(见 §7.2)。
七、质量防线
不是"在质量出问题后补救",而是"在结构层面预防质量问题":
| 防线 | 机制 | 何时用 | 防御的失败模式 |
|---|---|---|---|
| 三源交叉 | 不同来源的候选域互相检验覆盖范围——不是找一致,是找盲区 | 探索型项目的第一步填充 | F2 |
| 反锚定配额 | 强制一定比例的候选域来自未覆盖领域 | 源C独立扫描 | F2, F6 |
| 陌生度探测 | 当人类对候选域完全不熟悉时,触发额外谨慎标记 | 深度标注阶段 | F2 |
| 方向性筛查 | 检查帮助方向的合理性——实证→理论路径默认不成立 | 筛选阶段 | F1 |
| 认知纪律自检 | 6条强制问题——在阶段结束时填写,不是逐域填写 | 每个阶段结束时 | F1-F6 |
| 多Agent交叉审查 | L1/L2/L3三级交叉审查前置,拦截日常运营偏误 | 所有子项目产出交付人类审查前 | F7, F8 |
7.1 LLM认知偏差映射(新增)
v1.0 承认LLM有偏差但没列出具体偏差。v2.0 列出对本方法论最危险的5个LLM偏差:
B1|完整性幻觉
"我列了10个方向" ≠ "这是所有方向"
对本方法论的威胁:分类学扫描的"全面"是LLM训练数据分布的全面,不是人类知识的全面
B2|流畅性欺骗
"我回答得很有条理" ≠ "我答案正确"
对本方法论的威胁:清晰的框架结构容易让人类觉得"这肯定对"
B3|共识偏好
"我认同你" ≠ "我是对的"
对本方法论的威胁:LLM倾向于认同人类提出的方向,即使它有问题(逢迎偏误)
B4|锚定服从
"你说了A方向" ≠ "A方向是好的"
对本方法论的威胁:一旦人类提出方向,LLM难以真正"反对"——它在你的锚周围建东西
B5|反事实弱化
"我列出了反对意见" ≠ "我真认为它们有力"
对本方法论的威胁:LLM可以列出反对意见,但通常只是"形式上列出"而非"真正相信"7.2 加权认知纪律自检清单
v2.0 对6条自检问题分层加权,并绑定失败模式和LLM偏差:
致命级(必须通过,任一未通过即暂停当前阶段):
[ ] Q6: LLM是否将我的判断"包装"为其产出的一部分?
防御目标:F5(反馈循环) │ 关联偏差:B3(共识偏好)、B4(锚定服从)
通过标准:能指出至少一处"这个方向是我先提出,LLM随后同意的"
[ ] Q2: 在不熟悉领域过度信任LLM?
防御目标:F2(盲区遗漏)、F6(锚定陷阱) │ 关联偏差:B1(完整性幻觉)、B2(流畅性欺骗)
通过标准:对至少一个陌生域能说出"我为什么觉得这里可能有水份"
[ ] Q7: 理论工具和分析对象是否共享同一认知架构的同源偏差? ⚡ v2.4 新增
防御目标:F5(反馈循环的递归版本) │ 关联偏差:B3(共识偏好)
通过标准:能明确指出"我引用的理论工具本身是否也是人+AI协作产物?
如果是,它和我正在分析的对象是否共享同一认知架构?"
来源:GLM5.2 独立审计发现——当引用的理论工具本身是人+AI协作产物、
研究对象也是人+AI协作时,两者可能共享同源偏差严重级(建议通过,未通过需记录理由):
[ ] Q1: 因"听起来合理"跳过批判性判断?
防御目标:F4(认知偷懒) │ 关联偏差:B2(流畅性欺骗)
通过标准:能列出至少一个"听起来合理但我主动质疑过"的判断
[ ] Q3: 因"流畅性"和"结构感"误判正确性?
防御目标:F3(过度结构化) │ 关联偏差:B2(流畅性欺骗)
通过标准:能指出至少一个"结构漂亮但内容可能虚"的模块警示级(记录即可,为后续回顾积累数据):
[ ] Q4: 保持了"不信任"的能力?
防御目标:F4(认知偷懒) │ 关联偏差:B3(共识偏好)
记录标准:本轮我怀疑过什么?——如果什么都想不起来,就是最危险的信号
[ ] Q5: 批判性审查比上一轮更松懈?
防御目标:F4(认知偷懒) │ 关联偏差:全部偏差
记录标准:对比上一轮自检时的心态——更警觉/差不多/更松懈八、外部Agent使用模式
8.1 使用模式
| 用法 | 何时 | 效果 |
|---|---|---|
| 独立平行推演 | 同一简报发给两个agent,互不知情 | 收敛=强信号,发散=盲区候选 |
| 对抗性质询 | B版简报替换任务描述为尖锐质疑 | 深度自我怀疑,产出修正率高 |
| 框架审核 | 框架完成后发给agent群做系统性审核 | 发现框架盲区(v0.4吸收了27条建议) |
| 去锚定自由扫描 | 不告知已有项目背景 | 发现源A/B未覆盖的陌生领土 |
| 三源零背景扫描 | 每3轮强制插入一次,不告知当前方向 | 打破反馈循环(F5),检测锚定漂移(F6) |
关键约束:
- 所有外部Agent都是LLM——它们共享"语言模型的认知棱镜"限制。三个LLM的差异远小于一个LLM和一个人的差异
- 外部Agent反馈的"一致性"不意味着"正确"——可能只是三个LLM共享同一个训练数据分布的偏差
- 外部Agent的反馈必须经过人类框架审查——不是"采纳",而是"检视后决定采纳/修正/排除"
8.2 Agent-任务匹配矩阵(新增)
v1.0 的外部Agent选择标准过于粗糙("Kimi和Hunyuan都满足")。v2.0 建立任务匹配矩阵:
| 任务类型 | 首选Agent特性 | 次选特性 | 说明 |
|---|---|---|---|
| 广度扫描(源A) | 训练数据覆盖广、长上下文 | 推理深度 | 覆盖比深重要 |
| 对抗性检验(B版简报) | 高怀疑倾向、批判性推理 | 稳定性 | 宁可疑心重,不要老好人 |
| 独立自由扫描(源C) | 输出方差大、倾向不常见答案 | 覆盖率 | 惊喜比全面重要 |
| 框架审核 | 结构感强、能识别逻辑断层 | 速度 | 逻辑比博学重要 |
| 选题探索(步0) | 好奇心驱动、能提原创新问题 | 系统框架感 | 提问比回答重要 |
选择规则:
- 同一任务可以用多个Agent,但必须区分角色(一个广度扫描,一个对抗检验)
- 不要用同一个Agent连续执行两个需要独立视角的任务——锚定会污染
- 记录每次使用的Agent和角色,用于后续追溯和Agent表现评估
8.3 多Agent交叉审查协议(新增)
核心问题:5/22 全天 9 子项目并行运行,实证发现——人的审查粒度随并行密度连续退化(1-2项目细节级 → 3项目中等 → 4-5项目粗粒度 → 5+项目仅最严重错误可被捕获),而 LLM 的三个固有偏误(过度自信、迎合、模板套用)在人的审查深度不足时不会被自动纠正。当前架构中,人是所有子项目产出的唯一跨项目审查节点——这是单点瓶颈。
解决方案:所有子项目产出在交付人类审查前,必须先经过至少一个其他 agent 的交叉审查。交叉审查分为三级:
| 级别 | 定义 | 适用场景 | 执行者 | 成本 |
|---|---|---|---|---|
| L1 同模型交叉 | 同一底层模型的 2 个 agent 互审 | 日常低风险产出 | 同模型不同 session | 低 |
| L2 异构模型交叉 | 不同底层模型的 2 个 agent 互审 | 中高风险产出 | 如 DS v4 + Kimi k2.6 | 中 |
| L3 全异构三方对撞 | 3 个不同模型独立产出后交叉比较 | 关键交付物(冷邮件、公开发表、框架提案、外部链接) | 3 个不同模型 agent | 高 |
核心规则:
- 交叉审查的结果(包括一致和分歧)必须随交付物一起提交给人的审查节点
- 人的审查从"检查产出质量"转变为"裁决 agent 间的分歧"——审查负荷从 O(n) 降为 O(争议数)
- L1 是最低防线——拦截 URL 不验证、语法错误、明显逻辑矛盾等基础问题
- L2/L3 是实质性盲区探测——不同模型对同一问题的分析路径有结构性差异,这些差异暴露单一模型的隐含假设
- L3 对关键交付物强制执行——不是"建议",是"必须"
对失败模式的覆盖(多Agent vs 单Agent 检测能力):
| 失败模式 | 单 Agent 自检 | L1 同模型 | L2 异构 | L3 三方 |
|---|---|---|---|---|
| F1 框架偏移 | 部分 | ⚠️ 可能共盲 | ✅ | ✅ |
| F2 盲区遗漏 | ❌ | ⚠️ | ✅ | ✅ |
| F3 过度结构化 | ❌ | ⚠️ | ✅ | ✅ |
| F4 认知偷懒 | ❌ | ⚠️ | ✅ | ✅ |
| F5 反馈循环 | ❌ | ❌ | ⚠️ | ✅ |
| F6 锚定陷阱 | 部分 | ⚠️ | ✅ | ✅ |
| F7 外部引用未验证 | ❌ | ⚠️ | ✅ | ✅ |
| F8 跨Session隔离 | ❌ | ✅ 直接解 | ✅ | ✅ |
F8 的特殊性:F8 是唯一一个 L1 即可直接解决的失败模式——因为 F8 的本质是"没有 agent 验证过这个引用",而 L1 交叉审查的第一步就是"检查对方产出的外部引用是否可达"。
九、版本化与文件管理
| 规则 | 说明 |
|---|---|
| 每步产出一个MD文件 | 不是一个大文件持续追加——分开的文件让历史清晰 |
| 版本号在文件名中 | step3_R1_candidates.md → step3_R1_final_50.md |
| 框架文件追踪当前状态 | FRAMEWORK.md 或类似文件行踪每个阶段的完成状态和产出文件 |
| 外部Agent反馈存档 | 原始回复保存为独立文件(标注来源和日期),合成文件为派生文件 |
| 变更记录在文件末尾 | 日期/版本/变更内容的简明记录 |
| 回退标记 | 回退操作在变更记录中标注 [ROLLBACK] 原因:xxx |
9.1 项目规模缩放(新增)
当前方法论针对2-3人周的子项目优化。当子项目数量增长时:
| 规模 | 预判瓶颈 | 应对 |
|---|---|---|
| 5-10个子项目 | 文件名开始混乱,跨项目关系难以追踪 | 建立项目索引文件 INDEX.md,每个子项目一句话定位 |
| 10-20个子项目 | 框架文件之间的交叉引用靠记忆不可靠 | 引入目录层次 category/project/ 替代平铺文件名 |
| 20-50个子项目 | 方法论本身的执行质量因规模下降 | 引入自动化交叉引用检查;定期方法论执行回顾(MERA,见 §10) |
9.2 共享事实注册表(新增)
当子项目数量 ≥5 时,跨 session 信息隔离(F8)成为系统性风险。在项目根目录维护 SHARED_FACTS.md,记录所有跨项目使用的关键外部引用及其验证状态:
| 事实 | 验证状态 | 验证人/时间 | 有效截止 |
|---|---|---|---|
网站域名 = co-cognition.org | ✅ 已验证 | LobsterAI / 2026-05-22 | 长期 |
| DeepSeek v4-pro context window = 200K | ✅ 已验证 | LobsterAI / 2026-05-21 | 随模型升级更新 |
维护规则:
- 每个子项目 agent 启动时应读取此文件——在任务 prompt 或 session 初始化中包含
- 新增外部引用前必须在此文件中注册并验证
- 验证状态三态:✅ 已验证 / ⚠️ 待验证 / ❌ 已证伪
- 已证伪的引用保留在表中(标注
❌ 勿用)——防止后续 agent 重新发现并再次使用 - 维护成本约 5 分钟/周——写一条验证 vs 修复一条错误繁殖链的成本不对称
十、方法论自身进化(新增)
v1.0 说明了如何用方法论做项目,但没有说明"如何让方法论本身变得更好"。v2.0 引入元学习闭环。
10.1 方法论执行回顾(MERA)
MERA(Methodology Execution Retrospective & Adaptation)——在每个子项目结束时执行:
MERA 六问:
1. 方法论帮了我什么?
→ 具体哪个机制产生了价值?(例:A/B对抗让源C的产出质量提升了30%)
2. 方法论没帮到什么?
→ 哪个阶段方法论"在场但没起作用"?(例:质量自检走了流程但没发现真问题)
3. 应该改什么?
→ 已有的失败模式是否需要新增?是否需要调整优先级?是否需要补充新的防御?
4. 发现了什么新东西?
→ 有没有"撞见"的惊喜——方法论没有预设但实践中发现有效的机制?
5. 我们停对了吗?
→ 收敛信号出现了哪些(S1-S5)?是自然收敛还是外部 deadline?
→ 如果是自然收敛——停下来的"未解问题"是什么?写下来作为下一版的入口
→ 如果是外部 deadline 逼停——有没有被斩断的探索线?需要在下个周期重新打开
6. 我们能画出信念更新路径吗?
→ 先验是什么?触发修正的证据是什么?后验是什么?
→ 如果画不出来——是没学到,还是没记录,还是这个项目本身就没有需要修正的信念?
→ 这条路径不是展示工具,是内容质量约束——写不出一条清晰的先验→证据→后验链,说明故事的信念变化缺乏可追溯性10.2 进化规则
- MERA 记录独立存档在方法论版本库中(
MERA/MERA_项目名_日期.md) - 每完成 3 个子项目,基于 MERA 积累更新方法论小版本(v2.0 → v2.1)
- 每完成一个"领域类簇"(5+ 个子项目),基于跨项目 MERA 做方法论主版本更新(v2.x → v3.0)
- 方法论版本更新必须引用哪些 MERA 触发了哪些变更——保持可追溯
十一、适用这类方法论的子项目特征
不是所有项目都需要这套机制。以下特征如果满足≥3个,这套方法论可能适用:
- 对象是元层面的("探索本身如何探索")而非操作层面的
- 没有明确的目标预设——"我们不知道会找到什么"
- 需要大量外部视角来暴露盲区
- 人类协作者是单领域专家,无法独立判断跨域内容
- 产出需要供他人继续探索,而非问题终结
变更记录
| 版本 | 日期 | 变更 |
|---|---|---|
| v1.0 | 2026-05-19 | 初版。9个模块:三体架构/四步框架/搜索策略/A-B对抗/决策节奏/质量防线/外部Agent/版本管理/适用范围 |
| v2.0 | 2026-05-20 | 重大更新。基于 DeepSeek V4 深度分析(10条优化建议)全面重构:新增步0选题定位(§2.1)、轻量级回滚协议(§2.2)、认知负荷管理(§2.3)、三源冲突消解协议(§1.1)、人类混合模式(§5.1)、失败模式分类学(§6)、LLM认知偏差映射(§7.1)、加权自检清单(§7.2)、Agent-任务匹配矩阵(§8.2)、项目规模缩放(§9.1)、MERA方法论进化闭环(§10) |
| v2.1 | 2026-05-22 | 增量更新。基于 P1 盲区审计反馈(P4→P1 理论反馈链)新增三项:项目类型判定与盲区自检模式选择(§2.4)、收敛判断机制(§2.5)、MERA 第五问。不改变 v2.0 核心架构 |
| v2.2 | 2026-05-23 | 增量更新。基于 5/22 多项目并行退化实证新增三项:多Agent交叉审查协议(§八.3)、F8跨Session信息隔离(§六)、共享事实注册表(§九.2) |
| v2.3 | 2026-06-09 | 增量更新。基于 P6 自我指涉项目 MERA(方法论写方法论)新增 MERA 第六问——信念更新路径可追溯性。核心洞察:信念更新路径不只是展示格式,更是内容质量约束——写不出先验→证据→后验链,说明故事的信念变化缺乏可追溯性。源自 P6 步 3 叠加贝叶斯更新路径时的发现:为了写出清晰的链路,必须回到源材料逐条追踪每次信念变化的触发事件——模糊的"经过多轮迭代改进了"填不满这个格式。不改变 v2.2 核心架构 |
| v2.4 | 2026-06-26 | 增量更新。基于 GLM5.2 独立审计(外部 Agent 在不知道 Lab 内部讨论的情况下对 v2.3 做的独立评价)新增致命级自检 Q7:理论-对象同源性检查。核心洞察:当引用的理论工具本身是人+AI协作产物、研究对象也是人+AI协作时,两者可能共享同一认知架构的同源偏差——自检需检测 F5(反馈循环)的递归版本。附带验证:GLM5.2 用方法论诊断了自身偏误(将 JEPA 与 Lab 的连接做得太顺滑),证明方法论的自检机制在外部 Agent 独立使用时有效。不改变 v2.3 核心架构 |
→ 返回适用性指南