Skip to content

人+LLM 协同认知方法论 v2.4 完整手册

返回适用性指南


0. 这不是什么

  • 不是 SOUL.md——SOUL 定义"你是谁",不定"怎么做事"
  • 不是 MEMORY.md——记忆记录"做了什么",不提炼"怎么做才有效"
  • 不是 prompt 模板——不规定格式,只描述经验证有效的模式

这是一个操作模式手册。 你可以抄结构、抄机制、抄节奏,但具体内容在每个子项目中重新生长。


一、核心机制:三体认知架构

两个子项目收敛到同一个有效架构:人 + LLM + 外部Agent 不是"一个人用两个AI",而是三个不同认知体之间的协同:

人类协作者            LLM(DeepSeek等)          外部Agent(Kimi/Hunyuan等)
    │                       │                          │
    ├─── 方向判断 ──────────┤                          │
    │   · 直觉过滤          │                          │
    │   · 框架守护          │                          │
    │   · 价值观锚定        │                          │
    │                       ├─── 广度扫描 ─────────────┤
    │                       │   · 分类学覆盖           │
    │                       │   · 模式识别             │
    │                       │   · 结构生成             │
    │                       │                          ├─── 独立推演
    │                       │                          │   · 盲区探测
    │                       │                          │   · 对抗性检验
    │                       │                          │   · 新方向注入
    │                       │                          │
    ├─── 最终裁决 ──────────┼──────────────────────────┤

关键原则

  • 三个认知体的训练数据、架构偏好、优化目标各不相同 → 它们的"棱镜折射"不同 → 三源交叉的目的不是找"一致性",而是利用不一致性暴露盲区
  • 人类在此架构中的角色是框架守护者,不是领域专家——不需要判断跨域内容的真伪,只需要判断是否通过了框架的门槛检验
  • 核心约束:三个LLM的差异远小于一个LLM和一个人的差异。外部Agent反馈的"一致性"不等于"正确"——可能只是三个LLM共享同一训练数据分布的偏差

1.1 三源冲突消解协议

当三源交叉产生不一致时,不再简单标记"不一致=盲区候选",而是按以下树状协议处理:

三源交叉结果

    ├── 全一致 → ⚠️ 触发"共享偏差警报"
    │            → 强制找外部验证(人类直觉质疑、独立文献比对)
    │            → 记录:"三源一致,但我们可能共享同一片认知大陆"

    ├── 2:1 不一致 → 多数方必须解释"少数方遗漏了什么"
    │               → 少数方必须解释"我看到了什么多数方没看到的"
    │               → 记录双方推理链

    └── 全不一致 → 三源各自独立解释自己的推理链
                  → 重点不是投票选赢家,而是理解"为什么棱镜折射不同"
                  → 可能发现:问题定义本身需要重写

核心洞察(来自project-co-cognition-map实战):当三个LLM一致但全错时,问题不在LLM——在问题定义本身把三个LLM都引到了同一片认知大陆。此时应怀疑的不是答案,而是问题。


二、五步探索框架(原四步,新增步0)

从两个子项目中提取的通用探索节奏。v2.0 新增步0(选题定位),并引入轻量级回滚协议。

做什么核心问题人类角色预估认知负荷
0选题定位"我们正在探索的领域里,真正值得问的问题是什么?"用三个外部Agent独立提"这个领域最该被探索的三个未知"→ 交叉对比后选方向
1问题定位"我们到底要做什么?"提出4种可能理解(A/B/C/D)→ 选择主干 → 排除错误方向
2框架构建"用什么标准判断好坏?"从零建构分类/评分体系。关键是非机械——不能从上一个项目照搬框架格式
3填充推演"框架里装什么?"执行分层扫描(R1候选→R2快扫→R3深标)。此阶段人类角色是指定节奏和直觉过滤
4收束发布"怎么让别人看懂?"分层输出(概览→详情→方法报告),版本化发布

2.1 步0:选题定位(新增)

在"问题定位"之前,先问一个元问题:我们正在探索的领域里,真正值得问的问题是什么?

做法

  1. 三个外部Agent各自独立回答:"在这个领域里,最该被探索的三个未知是什么?"——只给领域描述,不给已有项目背景
  2. 交叉对比三份回答:找出重叠主题、独到视角、被忽略的方向
  3. 人类基于对比结果选择探索方向

何时可以跳过步0:当问题已经非常明确("我们就是要做X"),且多个独立视角都确认X是当前最有价值的方向时。

2.2 轻量级回滚协议

原v1.0的"每一步必须彻底完成再进入下一步"在实践中过于僵化——有时填充阶段才发现框架设计不合理,收束阶段才发现定位偏差。

v2.0 规则

  • 每一步仍需"彻底完成"再进入下一步——这是默认节奏
  • 但允许最多回退一步,前提是必须回答三个问题:
    1. "什么新证据(不是新感觉)让我认为需要回退?"
    2. "回退后我要检视什么具体问题?"
    3. "如果回退后仍然没有解决,我的止损线是什么?"
  • 回退后不从头开始——带着问题复检,只修正受影响的模块
  • 每次回退记录于变更日志,标注回退原因和新证据

不允许:连续回退(A→B→A→B)。如果发生,说明问题不在执行层而在框架本身——暂停,重新做步1。

2.3 认知负荷管理

本方法论对人的认知要求很高(抽象思维、直觉过滤、元认知自检),v2.0 引入负荷管理:

负荷等级典型阶段行为规则
🔴 高问题定位、框架构建、填充推演前序安排一段低负荷过渡期;不要连续两个高负荷阶段;单次高负荷不超过45分钟
🟡 中选题定位、收束发布、自检填写可以连续执行;出现疲劳信号时降级为低负荷活动
🟢 低阅读外部Agent反馈、整理文档、版本更新可作为高负荷之间的缓冲区

疲劳信号(任一出现即暂停高负荷工作):

  • 判断开始趋同("都差不多")
  • 对框架产生厌烦
  • 跳过自检项("这个我知道没问题")
  • 直觉过滤的区分度下降

2.4 项目类型判定与盲区自检模式选择

在进入步 1 之前,先判定项目类型并选择对应的盲区自检模式。不同类型项目的盲区性质完全不同——不能共用一套自检模板。

类型 A:理论框架型项目

  • 特征:主要产出是概念框架、分类学、判断矩阵、评分体系。不直接依赖不可控的外部数据。
  • 主要风险:证据等级 mismatch——以 L5(反复验证的事实)的语气讲 L1(纯理论推演)的故事。而且因为逻辑自洽会掩盖证据不足,这种风险比经验型项目更难被察觉。
  • 盲区自检模式:证据等级标注
    1. 为每个关键论断标注证据来源等级:
      • L1:理论推演(无独立经验验证)
      • L2:类比外推(从其他领域经验迁移)
      • L3:相关性证据(观察到相关但无因果证明)
      • L4:实验证据(≥1 个独立实验/研究)
      • L5:独立复制(≥2 个独立实验室确认)
    2. 检查:全文的最高证据等级不超过实际拥有的最高等级——如果一个项目没有任何 L4 证据,全文就不应该有 L4 级别的断言
    3. 检查:是否有 L1-L2 级证据以 L4-L5 级确定性呈现的论断?这是理论型项目最常见的失败模式
    4. 检查:每个核心假设是否有可写下来的推翻条件(即使推翻概率极低)——"如果 X 成立,这个假设就错了"

类型 B:经验推演型项目

  • 特征:主要产出是情景分析、趋势预判、竞争推演。依赖不可控的外部数据和市场预判。
  • 主要风险:核心假设被现实快速修正——盲区在被发现之前已经造成了后果。反馈来自外部世界,不是你主动找出来的。
  • 盲区自检模式:推翻条件预写 + 信号监控
    1. 为每个核心主张写下:"如果 X 发生了,这个主张就错了"
    2. 为每个推翻条件设定可观测信号——"我怎么知道 X 是否正在发生?"
    3. 每 N 个月重检推翻信号(N 取决于项目的更新频率和外部世界的变化速度)
    4. 检查:是否有任何关键主张没有推翻条件?如果某个主张无论如何都可以解释为"对的",那它不是判断——是叙事。

类型判定规则

项目主要问题类型首选盲区自检补充自检
"是什么/为什么"(框架/分类/机制)A证据等级标注推翻条件预写
"会怎样/谁赢"(预测/推演/排序)B推翻条件预写 + 信号监控证据等级标注
两者兼具主类型判定主类型自检模式另一类模式作为补充

关键警戒:类型 A 的盲区自检比类型 B 更容易被忽略,因为"逻辑自洽"会制造"一切正确"的假象。如果你是类型 A,你必须比类型 B 更警惕——因为你的反馈循环更长(逻辑自洽可能是回声),而现实不会自动纠正你。

2.5 收敛判断:探索行为的自然停止点

核心主张:好的方法论探索有自然收敛机制——不是被外部 deadline 逼停的,而是被"探索地形"本身引导到终点的。识别这个收敛点是一种元认知技能——需要与"认知偷懒"(F4)区分开来。

探索的自然生命周期

发散阶段 → 深化阶段 → 收敛阶段 → 闭包阶段
新概念涌现   填充验证     修正取代开创   边际收益 < 阈值

当前 METHODOLOGY 有引导发散→深化的机制(步 0-3),也有闭包的输出格式(步 4),但缺少从深化到收束的过渡判断——"我怎么知道深化已经结束了,该收束了?"

收敛信号清单

满足 ≥3 条即触发收敛检查:

#信号说明
S1反馈降级外部 Agent 的反馈从"发现新东西"变成"措辞建议"和"格式修正"
S2自检趋同连续两轮自检清单的结果高度相似——没有新的"怀疑过什么"
S3穷举感对"接下来还能问什么"的回答不是"X"而是"好像没有了,除非换框架"
S4框架闭合框架内的所有格位已被填充——不是填充的"完了",而是没有空的格位了
S5交叉饱和各维度间的交叉推演不再产生新判断——现有判断被重新排列而非新产生

收敛 vs 偷懒的区分

这是本方法论最精细的元认知判断之一。F4(认知偷懒)的检测信号是"我应该继续但没有"——回避和模糊。收敛的信号是"我可以继续但边际收益低于阈值"——清晰和满足。

维度自然收敛认知偷懒 (F4)
触发探索地形耗尽认知负荷超载
情绪标记"够了"——满足感"算了"——疲惫感
对"还能做什么"的回答能清晰说出"没有了,因为 X/Y/Z 都已覆盖"说不清"因为……"
重启后状态即使休息几天再回来,也是同样的"没有了"休息后可能恢复探索动力
产出审查回头看产出,覆盖率完整回头看产出,有明确的"未触碰区域"

经验参考(来自 P1 收敛过程):外部 Agent 三轮审阅后,新反馈边际价值急剧下降——hunyuan 终审反馈几乎全是格式和措辞问题;交叉推演完成后,九个判断建立,没有新的判断空间。这不是碰巧停下来的——是被探索对象的内在结构引导到这个终点的。

闭包协议

当触发收敛检查(≥3 个 S 信号)且排除偷懒后:

  1. 执行一次最终盲区自检——不是找出更多 bug,而是问:"如果这个项目到此为止,最大的未解问题是什么?"——写下来,作为产出的一部分
  2. 记录收敛原因——"我们停在这里不是因为 deadline,而是因为 S1/S3/S5"
  3. 将未解问题交给版本迭代队列——收敛不是"结束",是"这一版可以交付了"。下一版可以带着新前提、新数据、或新框架重新打开

三、搜索策略:广度→深度→陌生

适用于"不知道不知道什么"的探索型项目。三种搜索同时并行,而非先后:

策略做什么优势盲区
源A:分类学扫描LLM按学科分类体系系统地扫一遍可能的方向广度覆盖,不遗漏大类受LLM训练数据分布影响;偏好"可清晰描述"的域
源B:基因辐射从已有项目/方法论的核心基因出发,辐射邻近方向深度连接已有基础,方向可控被已有项目严重锚定;只能在"附近的可能"里找
源C:独立自由扫描外部Agent不被告知已有项目背景,自主扫描不受锚定;可能发现盲区可能偏离项目方向;需要反锚定配额强制陌生领土

关键规则

  • 源A和源B不应由同一个LLM在同一次session中完成——锚定效应会污染广度扫描
  • 源C的简报中不透露源A/源B的结果,只给框架方法论——否则"自由"就成了"补充"
  • 源C必须设置反锚定配额:至少2个候选域必须来自源A/源B未覆盖的学科/方法论

四、A/B对抗性简报机制

从project-co-cognition-map源B和源C中验证为"产生真实收益"的机制:

做法

  • 生成两版简报发给外部Agent
  • A版:标准的"请帮我做X"的任务描述
  • B版:A版的镜像,但把任务转化为4条尖锐质疑——"如果我质疑你们的每个候选域,你们能回答什么?"

效果(已验证):

  • 外部Agent面对B版时,自我怀疑深度显著增加(源C中Hunyuan主动承认2个候选域可能应该替换,Kimi放弃了5个候选域并逐条说明被哪条质疑击毙)
  • A版产出的域在B版质疑下约30-40%被修正或降级——说明单独用A版会导致过度乐观
  • 这不是"表演性的对抗"——外部Agent在没有真正挑战的情况下不会产生同等程度的自我反思

适用条件

  • 外部Agent有足够的推理能力(当前kimi和hunyuan均满足)
  • 任务本身存在多个同样合理的方向(无唯一正确答案)
  • 不适用于"查事实"类任务——只适用于"提出可能性"类任务

五、人类决策节奏

两个子项目中反复验证的模式:

原则说明
集中审查,不分片判断不要在每一小步后都停下来让人类做判断——认知碎片化。把同类判断收集到一起,一次性高效完成
直觉过滤先于精细评分对于大量候选(50+),先做一轮快速的"感觉对不对"过滤,标记排除,再做精细评分。逐域精细评分会导致决策疲劳
框架操作优先于领域判断人类不判断"这个域的内容是否准确"(需要领域专家),而是判断"这个域的框架得分是否合理"(需要元认知)
统一自检,不逐域自检认知纪律自检清单在整个阶段结束时统一填写——不是每做完一个域就填一次。分片自检会产生"我已经做了自检"的错觉
记录排除原因每个被排除的候选域记录一句话原因。不是为辩护——是为后续重新审视时知道当时是怎么想的

5.1 人类角色混合模式(新增)

v1.0 将人类定位为"框架守护者"而非"领域专家"。但实践中,人类有时就是领域专家——此时角色不应被强制分割。

混合模式规则

  • 人类可同时担任"领域专家+框架守护者"
  • 但必须标记"此刻我在哪个角色说话":
    • [领域专家]:输出的判断基于领域知识——"这个域的内容不对,因为……"
    • [框架守护者]:输出的判断基于方法论——"这个域的框架得分不合理,因为……"
  • 领域专家输出的内容,必须再由框架守护者角色做一次审查
  • 两种角色的判断记录在同一文件中,用标签区分——方便后续追溯"哪个角色的判断被推翻"

为什么需要这个:当人类确实是领域专家时,强行压制领域知识是反效率的。但领域专家的自信和框架守护者的怀疑是两种不同的认知模式——分开标注可以防止"领域自信污染元认知审慎"。


六、失败模式分类学(新增)

v1.0 的质量防线和自检清单都是"出了问题怎么办",但没有系统地分类"通常出什么问题"。v2.0 建立失败模式分类,让每一个自检都绑定到具体防御目标。

核心失败模式

F1|框架偏移
    症状:框架建完后,填充过程中不自觉漂移到了另一个问题
    检测信号:回头看步1的问题定义,发现当前产出的答案已经不是针对原问题
    防御:每个阶段开始时重读步1的问题定位(30秒)

F2|盲区遗漏
    症状:三源都在同一块认知大陆上,有一整块大陆谁都没看到
    检测信号:三源高度一致且没有真正"惊讶"的发现
    防御:当三源全一致时触发共享偏差警报(见 §1.1)

F3|过度结构化
    症状:把没有清晰结构的东西硬整出结构,制造虚假清晰
    检测信号:框架的分类在直觉上感到牵强;"这个分类到底有用吗?"
    防御:每个框架节点问"如果不这样分,还有什么分法?"——如果找不到替代,结构可能是在强加而非发现

F4|认知偷懒
    症状:用了框架的"形"但没有用框架的"神"——走完流程但没真的思考
    检测信号:自检清单全部打勾但回想不起具体"怀疑过什么"
    防御:自检清单改为"列出具体怀疑过的项"而非"打勾"

F5|反馈循环
    症状:LLM输出被人类接受→喂回LLM→自我强化→偏差固化
    检测信号:多轮后产出方向越来越窄;外部Agent反馈开始趋同
    防御:每3轮强制插入一次"零背景扫描"(外部Agent不被告知当前方向)

F6|锚定陷阱
    症状:第一个被提出的方向严重锚定了后续所有探索方向
    检测信号:源A/B/C都围绕同一个核心主题变奏
    防御:源C的简报刻意不提已有发现;反锚定配额必须严格执行

F7|外部引用未验证
    症状:URL、域名、API端点、外部数据引用被假设为"应该是这样",在多个文件中反复使用但从未实际访问证实
    检测信号:同一个URL出现在 ≥3 个产出文件中但无一次实际浏览器访问记录
    后果:发送出去的邮件/文档中的链接是死链——2026-05-21 实例:co-cognition-lab.pages.dev 应为 co-cognition.org,5 个 outreach 文件、已发送冷邮件和 MokaHR 附件全部失效
    防御:任何外部引用(URL、API key、邮箱、数据格式)在首次使用时做一次实际访问/验证,记录在对应项目的 TOOLS.md 或 NOTES 中

F8|跨Session信息隔离  ⚡ 基础设施失败
    性质:与 F1-F7 不同——F1-F7 是认知失败("人怎么想错了"),F8 是基础设施失败("系统怎么设计错了")
    症状:同一错误信息(如URL、数据源、假设)在多个独立 session 中重复出现,因为各 session 不共享验证状态
    实例:co-cognition-lab.pages.dev(错误域名)在 5+ 个文件的多个独立 session 中出现,每个 agent 都假设域名是对的,没有一个实际访问验证
    根因:session 之间没有共享的"已验证事实注册表"
    防御:交叉审查协议(见 §八.3)+ 共享事实注册表(见 §九.2)

失败模式-自检绑定

每个自检问题都必须对应至少一个失败模式。v2.0 的自检清单直接标注目标失败模式(见 §7.2)。


七、质量防线

不是"在质量出问题后补救",而是"在结构层面预防质量问题":

防线机制何时用防御的失败模式
三源交叉不同来源的候选域互相检验覆盖范围——不是找一致,是找盲区探索型项目的第一步填充F2
反锚定配额强制一定比例的候选域来自未覆盖领域源C独立扫描F2, F6
陌生度探测当人类对候选域完全不熟悉时,触发额外谨慎标记深度标注阶段F2
方向性筛查检查帮助方向的合理性——实证→理论路径默认不成立筛选阶段F1
认知纪律自检6条强制问题——在阶段结束时填写,不是逐域填写每个阶段结束时F1-F6
多Agent交叉审查L1/L2/L3三级交叉审查前置,拦截日常运营偏误所有子项目产出交付人类审查前F7, F8

7.1 LLM认知偏差映射(新增)

v1.0 承认LLM有偏差但没列出具体偏差。v2.0 列出对本方法论最危险的5个LLM偏差:

B1|完整性幻觉
    "我列了10个方向" ≠ "这是所有方向"
    对本方法论的威胁:分类学扫描的"全面"是LLM训练数据分布的全面,不是人类知识的全面

B2|流畅性欺骗
    "我回答得很有条理" ≠ "我答案正确"
    对本方法论的威胁:清晰的框架结构容易让人类觉得"这肯定对"

B3|共识偏好
    "我认同你" ≠ "我是对的"
    对本方法论的威胁:LLM倾向于认同人类提出的方向,即使它有问题(逢迎偏误)

B4|锚定服从
    "你说了A方向" ≠ "A方向是好的"
    对本方法论的威胁:一旦人类提出方向,LLM难以真正"反对"——它在你的锚周围建东西

B5|反事实弱化
    "我列出了反对意见" ≠ "我真认为它们有力"
    对本方法论的威胁:LLM可以列出反对意见,但通常只是"形式上列出"而非"真正相信"

7.2 加权认知纪律自检清单

v2.0 对6条自检问题分层加权,并绑定失败模式和LLM偏差:

致命级(必须通过,任一未通过即暂停当前阶段)

[ ] Q6: LLM是否将我的判断"包装"为其产出的一部分?
     防御目标:F5(反馈循环)  │  关联偏差:B3(共识偏好)、B4(锚定服从)
     通过标准:能指出至少一处"这个方向是我先提出,LLM随后同意的"

[ ] Q2: 在不熟悉领域过度信任LLM?
     防御目标:F2(盲区遗漏)、F6(锚定陷阱)  │  关联偏差:B1(完整性幻觉)、B2(流畅性欺骗)
     通过标准:对至少一个陌生域能说出"我为什么觉得这里可能有水份"

[ ] Q7: 理论工具和分析对象是否共享同一认知架构的同源偏差?  ⚡ v2.4 新增
     防御目标:F5(反馈循环的递归版本)  │  关联偏差:B3(共识偏好)
     通过标准:能明确指出"我引用的理论工具本身是否也是人+AI协作产物?
             如果是,它和我正在分析的对象是否共享同一认知架构?"
     来源:GLM5.2 独立审计发现——当引用的理论工具本身是人+AI协作产物、
           研究对象也是人+AI协作时,两者可能共享同源偏差

严重级(建议通过,未通过需记录理由)

[ ] Q1: 因"听起来合理"跳过批判性判断?
     防御目标:F4(认知偷懒)  │  关联偏差:B2(流畅性欺骗)
     通过标准:能列出至少一个"听起来合理但我主动质疑过"的判断

[ ] Q3: 因"流畅性"和"结构感"误判正确性?
     防御目标:F3(过度结构化)  │  关联偏差:B2(流畅性欺骗)
     通过标准:能指出至少一个"结构漂亮但内容可能虚"的模块

警示级(记录即可,为后续回顾积累数据)

[ ] Q4: 保持了"不信任"的能力?
     防御目标:F4(认知偷懒)  │  关联偏差:B3(共识偏好)
     记录标准:本轮我怀疑过什么?——如果什么都想不起来,就是最危险的信号

[ ] Q5: 批判性审查比上一轮更松懈?
     防御目标:F4(认知偷懒)  │  关联偏差:全部偏差
     记录标准:对比上一轮自检时的心态——更警觉/差不多/更松懈

八、外部Agent使用模式

8.1 使用模式

用法何时效果
独立平行推演同一简报发给两个agent,互不知情收敛=强信号,发散=盲区候选
对抗性质询B版简报替换任务描述为尖锐质疑深度自我怀疑,产出修正率高
框架审核框架完成后发给agent群做系统性审核发现框架盲区(v0.4吸收了27条建议)
去锚定自由扫描不告知已有项目背景发现源A/B未覆盖的陌生领土
三源零背景扫描每3轮强制插入一次,不告知当前方向打破反馈循环(F5),检测锚定漂移(F6)

关键约束

  • 所有外部Agent都是LLM——它们共享"语言模型的认知棱镜"限制。三个LLM的差异远小于一个LLM和一个人的差异
  • 外部Agent反馈的"一致性"不意味着"正确"——可能只是三个LLM共享同一个训练数据分布的偏差
  • 外部Agent的反馈必须经过人类框架审查——不是"采纳",而是"检视后决定采纳/修正/排除"

8.2 Agent-任务匹配矩阵(新增)

v1.0 的外部Agent选择标准过于粗糙("Kimi和Hunyuan都满足")。v2.0 建立任务匹配矩阵:

任务类型首选Agent特性次选特性说明
广度扫描(源A)训练数据覆盖广、长上下文推理深度覆盖比深重要
对抗性检验(B版简报)高怀疑倾向、批判性推理稳定性宁可疑心重,不要老好人
独立自由扫描(源C)输出方差大、倾向不常见答案覆盖率惊喜比全面重要
框架审核结构感强、能识别逻辑断层速度逻辑比博学重要
选题探索(步0)好奇心驱动、能提原创新问题系统框架感提问比回答重要

选择规则

  • 同一任务可以用多个Agent,但必须区分角色(一个广度扫描,一个对抗检验)
  • 不要用同一个Agent连续执行两个需要独立视角的任务——锚定会污染
  • 记录每次使用的Agent和角色,用于后续追溯和Agent表现评估

8.3 多Agent交叉审查协议(新增)

核心问题:5/22 全天 9 子项目并行运行,实证发现——人的审查粒度随并行密度连续退化(1-2项目细节级 → 3项目中等 → 4-5项目粗粒度 → 5+项目仅最严重错误可被捕获),而 LLM 的三个固有偏误(过度自信、迎合、模板套用)在人的审查深度不足时不会被自动纠正。当前架构中,人是所有子项目产出的唯一跨项目审查节点——这是单点瓶颈。

解决方案:所有子项目产出在交付人类审查前,必须先经过至少一个其他 agent 的交叉审查。交叉审查分为三级:

级别定义适用场景执行者成本
L1 同模型交叉同一底层模型的 2 个 agent 互审日常低风险产出同模型不同 session
L2 异构模型交叉不同底层模型的 2 个 agent 互审中高风险产出如 DS v4 + Kimi k2.6
L3 全异构三方对撞3 个不同模型独立产出后交叉比较关键交付物(冷邮件、公开发表、框架提案、外部链接)3 个不同模型 agent

核心规则

  • 交叉审查的结果(包括一致和分歧)必须随交付物一起提交给人的审查节点
  • 人的审查从"检查产出质量"转变为"裁决 agent 间的分歧"——审查负荷从 O(n) 降为 O(争议数)
  • L1 是最低防线——拦截 URL 不验证、语法错误、明显逻辑矛盾等基础问题
  • L2/L3 是实质性盲区探测——不同模型对同一问题的分析路径有结构性差异,这些差异暴露单一模型的隐含假设
  • L3 对关键交付物强制执行——不是"建议",是"必须"

对失败模式的覆盖(多Agent vs 单Agent 检测能力):

失败模式单 Agent 自检L1 同模型L2 异构L3 三方
F1 框架偏移部分⚠️ 可能共盲
F2 盲区遗漏⚠️
F3 过度结构化⚠️
F4 认知偷懒⚠️
F5 反馈循环⚠️
F6 锚定陷阱部分⚠️
F7 外部引用未验证⚠️
F8 跨Session隔离✅ 直接解

F8 的特殊性:F8 是唯一一个 L1 即可直接解决的失败模式——因为 F8 的本质是"没有 agent 验证过这个引用",而 L1 交叉审查的第一步就是"检查对方产出的外部引用是否可达"。


九、版本化与文件管理

规则说明
每步产出一个MD文件不是一个大文件持续追加——分开的文件让历史清晰
版本号在文件名中step3_R1_candidates.mdstep3_R1_final_50.md
框架文件追踪当前状态FRAMEWORK.md 或类似文件行踪每个阶段的完成状态和产出文件
外部Agent反馈存档原始回复保存为独立文件(标注来源和日期),合成文件为派生文件
变更记录在文件末尾日期/版本/变更内容的简明记录
回退标记回退操作在变更记录中标注 [ROLLBACK] 原因:xxx

9.1 项目规模缩放(新增)

当前方法论针对2-3人周的子项目优化。当子项目数量增长时:

规模预判瓶颈应对
5-10个子项目文件名开始混乱,跨项目关系难以追踪建立项目索引文件 INDEX.md,每个子项目一句话定位
10-20个子项目框架文件之间的交叉引用靠记忆不可靠引入目录层次 category/project/ 替代平铺文件名
20-50个子项目方法论本身的执行质量因规模下降引入自动化交叉引用检查;定期方法论执行回顾(MERA,见 §10)

9.2 共享事实注册表(新增)

当子项目数量 ≥5 时,跨 session 信息隔离(F8)成为系统性风险。在项目根目录维护 SHARED_FACTS.md,记录所有跨项目使用的关键外部引用及其验证状态:

事实验证状态验证人/时间有效截止
网站域名 = co-cognition.org✅ 已验证LobsterAI / 2026-05-22长期
DeepSeek v4-pro context window = 200K✅ 已验证LobsterAI / 2026-05-21随模型升级更新

维护规则

  • 每个子项目 agent 启动时应读取此文件——在任务 prompt 或 session 初始化中包含
  • 新增外部引用前必须在此文件中注册并验证
  • 验证状态三态:✅ 已验证 / ⚠️ 待验证 / ❌ 已证伪
  • 已证伪的引用保留在表中(标注 ❌ 勿用)——防止后续 agent 重新发现并再次使用
  • 维护成本约 5 分钟/周——写一条验证 vs 修复一条错误繁殖链的成本不对称

十、方法论自身进化(新增)

v1.0 说明了如何用方法论做项目,但没有说明"如何让方法论本身变得更好"。v2.0 引入元学习闭环。

10.1 方法论执行回顾(MERA)

MERA(Methodology Execution Retrospective & Adaptation)——在每个子项目结束时执行:

MERA 六问:
1. 方法论帮了我什么?
   → 具体哪个机制产生了价值?(例:A/B对抗让源C的产出质量提升了30%)
2. 方法论没帮到什么?
   → 哪个阶段方法论"在场但没起作用"?(例:质量自检走了流程但没发现真问题)
3. 应该改什么?
   → 已有的失败模式是否需要新增?是否需要调整优先级?是否需要补充新的防御?
4. 发现了什么新东西?
   → 有没有"撞见"的惊喜——方法论没有预设但实践中发现有效的机制?
5. 我们停对了吗?
   → 收敛信号出现了哪些(S1-S5)?是自然收敛还是外部 deadline?
   → 如果是自然收敛——停下来的"未解问题"是什么?写下来作为下一版的入口
   → 如果是外部 deadline 逼停——有没有被斩断的探索线?需要在下个周期重新打开
6. 我们能画出信念更新路径吗?
   → 先验是什么?触发修正的证据是什么?后验是什么?
   → 如果画不出来——是没学到,还是没记录,还是这个项目本身就没有需要修正的信念?
   → 这条路径不是展示工具,是内容质量约束——写不出一条清晰的先验→证据→后验链,说明故事的信念变化缺乏可追溯性

10.2 进化规则

  • MERA 记录独立存档在方法论版本库中(MERA/MERA_项目名_日期.md
  • 每完成 3 个子项目,基于 MERA 积累更新方法论小版本(v2.0 → v2.1)
  • 每完成一个"领域类簇"(5+ 个子项目),基于跨项目 MERA 做方法论主版本更新(v2.x → v3.0)
  • 方法论版本更新必须引用哪些 MERA 触发了哪些变更——保持可追溯

十一、适用这类方法论的子项目特征

不是所有项目都需要这套机制。以下特征如果满足≥3个,这套方法论可能适用:

  • 对象是元层面的("探索本身如何探索")而非操作层面的
  • 没有明确的目标预设——"我们不知道会找到什么"
  • 需要大量外部视角来暴露盲区
  • 人类协作者是单领域专家,无法独立判断跨域内容
  • 产出需要供他人继续探索,而非问题终结

变更记录

版本日期变更
v1.02026-05-19初版。9个模块:三体架构/四步框架/搜索策略/A-B对抗/决策节奏/质量防线/外部Agent/版本管理/适用范围
v2.02026-05-20重大更新。基于 DeepSeek V4 深度分析(10条优化建议)全面重构:新增步0选题定位(§2.1)、轻量级回滚协议(§2.2)、认知负荷管理(§2.3)、三源冲突消解协议(§1.1)、人类混合模式(§5.1)、失败模式分类学(§6)、LLM认知偏差映射(§7.1)、加权自检清单(§7.2)、Agent-任务匹配矩阵(§8.2)、项目规模缩放(§9.1)、MERA方法论进化闭环(§10)
v2.12026-05-22增量更新。基于 P1 盲区审计反馈(P4→P1 理论反馈链)新增三项:项目类型判定与盲区自检模式选择(§2.4)、收敛判断机制(§2.5)、MERA 第五问。不改变 v2.0 核心架构
v2.22026-05-23增量更新。基于 5/22 多项目并行退化实证新增三项:多Agent交叉审查协议(§八.3)、F8跨Session信息隔离(§六)、共享事实注册表(§九.2)
v2.32026-06-09增量更新。基于 P6 自我指涉项目 MERA(方法论写方法论)新增 MERA 第六问——信念更新路径可追溯性。核心洞察:信念更新路径不只是展示格式,更是内容质量约束——写不出先验→证据→后验链,说明故事的信念变化缺乏可追溯性。源自 P6 步 3 叠加贝叶斯更新路径时的发现:为了写出清晰的链路,必须回到源材料逐条追踪每次信念变化的触发事件——模糊的"经过多轮迭代改进了"填不满这个格式。不改变 v2.2 核心架构
v2.42026-06-26增量更新。基于 GLM5.2 独立审计(外部 Agent 在不知道 Lab 内部讨论的情况下对 v2.3 做的独立评价)新增致命级自检 Q7:理论-对象同源性检查。核心洞察:当引用的理论工具本身是人+AI协作产物、研究对象也是人+AI协作时,两者可能共享同一认知架构的同源偏差——自检需检测 F5(反馈循环)的递归版本。附带验证:GLM5.2 用方法论诊断了自身偏误(将 JEPA 与 Lab 的连接做得太顺滑),证明方法论的自检机制在外部 Agent 独立使用时有效。不改变 v2.3 核心架构

返回适用性指南