Skip to content

人+LLM 协同认知方法论:适用性指南

版本:v1.0 | 日期:2026-06-08


这是什么

一套操作模式手册。 它不规定你想什么——只描述当一个人和多个 AI 一起探索"不知道会找到什么"时,什么做法反复验证有效、什么做法反复撞墙。


三个故事

P3 危机认知——"我知道目标,但不知道怎么走"

他要从军事指挥、灾害响应、急诊医学、HRO 这些完全不对话的领域里,提取跨域可操作的"认知韧性设计原则"。他先做了内部批判——攻击自己"这 8 个领域共享同一个底层结构"的假设——然后同时发给两个外部 Agent 做独立审核。两份审核指出他自己没发现的系统性偏差:他太倾向于发现差异而非共享结构。 这不是"帮他想方案",是"告诉他自己看偏了"。

先验:"8个领域共享同一个底层结构"
  ↓ Phase D 内部批判:HRO 和灾害学被判为"独立成簇"
后验 v1:"它们各自不同,不是一个统一的元域"
  ↓ Hunyuan + Kimi 独立审核:"你太倾向于发现差异"
后验 v2:"它们共享退化递归结构,Phase D 的判断是偏差不是发现"

→ 目标明确但路径不明、需从跨域案例中提取模式:A/B 对抗简报和独立外部审核最适合你。


PN 财富继承——"我是领域专家,但专家直觉可能就是盲区"

他要设计一套"AI 时代中国家庭财富自检框架"。第一轮就用了物理学隐喻——"IEHL 半衰期"来衡量资产购买力衰减。三轮外部 Agent 评审、七轮版本迭代、两份案例实战——

正面:v0.1→v0.8.3 的 70% 实质性修正来自外部 Agent 反馈。最锐利的修正(MCA 从"资产"→"乘数"、IEHL 从精确年数→⚡闪电符号)都来自外部攻击。

反面:花了七轮才发现,"原子衰变"隐喻可能根本不适合中国家庭的财富观——中国家庭更接近"河流"或"容器"。步 2 没有强制做"底层隐喻适配性检验",方法论没拦住这个锚定。

先验:"IEHL半衰期是最合适的隐喻"
  ↓ 外部Agent评审:MCA应改为"乘数"
后验 v1:"方向对但需去伪精确化——用⚡替代年数"
  ↓ Round 7 裂变:人类框架守护者:"放弃裂变,保持诚实"
后验 v2:"隐喻本身可能不适合——原子衰变 vs 河流/容器"

→ 你是领域专家时,人类混合模式标签和三源交叉是必选项。在隐喻上投入大量轮次后,停下来做"隐喻适配性检验"。


P2 Co-Cognition 全景图——"我不知道会找到什么"

他要扫描人类知识中任意两门学科之间可能产生 co-cognition 新洞见的位置——没有预设框架。三种搜索策略并行:分类学扫描 + 基因辐射 + 独立自由扫描(强制至少 2 个候选域来自未覆盖学科)。框架 v0.4 吸收 27 条外部建议;反锚定配额催生了 P3 子项目。

待证据:P2 尚未收束,MERA 未执行。

→ 目标模糊、"不知道会找到什么":步 0 选题定位 + 三源交叉 + 反锚定配额。


判定表

如果你的项目…最像从这些机制开始最大的坑
目标模糊、需大量外部视角P2步0、三源交叉、反锚定配额框架对称性可能是设计的不一定是发现的
目标明确但路径不明P3A/B对抗简报、独立外部审核、加权自检内部批判可能有系统性偏差
你是领域专家PN三源交叉、人类混合模式、MERA被第一个想法绑架(F6)
数据充分、需执行方案不建议用时间开销 > 价值

什么时候不该用

纯定量/数据驱动型项目(如因子模型、网络拓扑)→ 标准实验设计 + 稳健性检验。单人、单领域、短期 deadline 的执行型项目 → 高效信息收集比步 0 选题定位更对口。


自我指涉

你正在读的这份指南,本身就是用这套方法论写的。


最简启动包

  1. 三源交叉:同一个问题问两个不同的 LLM——找"它们共同没看到什么"
  2. A/B 对抗简报:把任务描述改成质疑格式再发一次
  3. 致命级自检:Q2(不熟悉领域过度信任了吗)+ Q6(LLM 把我的判断包装为产出了吗)

停止规则:连续两轮没产生新洞察,就是够了。


延伸阅读

规则池治理:Lab 的 11 类文档化规则如何从静态文档进化为可追踪的规则演化系统(v2.2,基于 JERP 思想)