人+LLM 协同认知方法论:适用性指南
版本:v1.0 | 日期:2026-06-08
这是什么
一套操作模式手册。 它不规定你想什么——只描述当一个人和多个 AI 一起探索"不知道会找到什么"时,什么做法反复验证有效、什么做法反复撞墙。
三个故事
P3 危机认知——"我知道目标,但不知道怎么走"
他要从军事指挥、灾害响应、急诊医学、HRO 这些完全不对话的领域里,提取跨域可操作的"认知韧性设计原则"。他先做了内部批判——攻击自己"这 8 个领域共享同一个底层结构"的假设——然后同时发给两个外部 Agent 做独立审核。两份审核指出他自己没发现的系统性偏差:他太倾向于发现差异而非共享结构。 这不是"帮他想方案",是"告诉他自己看偏了"。
先验:"8个领域共享同一个底层结构"
↓ Phase D 内部批判:HRO 和灾害学被判为"独立成簇"
后验 v1:"它们各自不同,不是一个统一的元域"
↓ Hunyuan + Kimi 独立审核:"你太倾向于发现差异"
后验 v2:"它们共享退化递归结构,Phase D 的判断是偏差不是发现"→ 目标明确但路径不明、需从跨域案例中提取模式:A/B 对抗简报和独立外部审核最适合你。
PN 财富继承——"我是领域专家,但专家直觉可能就是盲区"
他要设计一套"AI 时代中国家庭财富自检框架"。第一轮就用了物理学隐喻——"IEHL 半衰期"来衡量资产购买力衰减。三轮外部 Agent 评审、七轮版本迭代、两份案例实战——
正面:v0.1→v0.8.3 的 70% 实质性修正来自外部 Agent 反馈。最锐利的修正(MCA 从"资产"→"乘数"、IEHL 从精确年数→⚡闪电符号)都来自外部攻击。
反面:花了七轮才发现,"原子衰变"隐喻可能根本不适合中国家庭的财富观——中国家庭更接近"河流"或"容器"。步 2 没有强制做"底层隐喻适配性检验",方法论没拦住这个锚定。
先验:"IEHL半衰期是最合适的隐喻"
↓ 外部Agent评审:MCA应改为"乘数"
后验 v1:"方向对但需去伪精确化——用⚡替代年数"
↓ Round 7 裂变:人类框架守护者:"放弃裂变,保持诚实"
后验 v2:"隐喻本身可能不适合——原子衰变 vs 河流/容器"→ 你是领域专家时,人类混合模式标签和三源交叉是必选项。在隐喻上投入大量轮次后,停下来做"隐喻适配性检验"。
P2 Co-Cognition 全景图——"我不知道会找到什么"
他要扫描人类知识中任意两门学科之间可能产生 co-cognition 新洞见的位置——没有预设框架。三种搜索策略并行:分类学扫描 + 基因辐射 + 独立自由扫描(强制至少 2 个候选域来自未覆盖学科)。框架 v0.4 吸收 27 条外部建议;反锚定配额催生了 P3 子项目。
待证据:P2 尚未收束,MERA 未执行。→ 目标模糊、"不知道会找到什么":步 0 选题定位 + 三源交叉 + 反锚定配额。
判定表
| 如果你的项目… | 最像 | 从这些机制开始 | 最大的坑 |
|---|---|---|---|
| 目标模糊、需大量外部视角 | P2 | 步0、三源交叉、反锚定配额 | 框架对称性可能是设计的不一定是发现的 |
| 目标明确但路径不明 | P3 | A/B对抗简报、独立外部审核、加权自检 | 内部批判可能有系统性偏差 |
| 你是领域专家 | PN | 三源交叉、人类混合模式、MERA | 被第一个想法绑架(F6) |
| 数据充分、需执行方案 | — | 不建议用 | 时间开销 > 价值 |
什么时候不该用
纯定量/数据驱动型项目(如因子模型、网络拓扑)→ 标准实验设计 + 稳健性检验。单人、单领域、短期 deadline 的执行型项目 → 高效信息收集比步 0 选题定位更对口。
自我指涉
你正在读的这份指南,本身就是用这套方法论写的。
最简启动包
- 三源交叉:同一个问题问两个不同的 LLM——找"它们共同没看到什么"
- A/B 对抗简报:把任务描述改成质疑格式再发一次
- 致命级自检:Q2(不熟悉领域过度信任了吗)+ Q6(LLM 把我的判断包装为产出了吗)
停止规则:连续两轮没产生新洞察,就是够了。
延伸阅读
→ 规则池治理:Lab 的 11 类文档化规则如何从静态文档进化为可追踪的规则演化系统(v2.2,基于 JERP 思想)