第二阶段第二场:概念型直觉的"方向感"缺失 + 道德型收束
2026-05-15 | 第二阶段横向扫描
核心任务:填充概念型直觉矩阵单元格 + 判定道德型直觉的可达性 + 揭露两者底层共同的"隐性代价压缩"机制
关键理论锚:Zander et al. "Pathfinding" (Nature Commun Biol 2025) —— 直觉 = 具身非意识路径查找 = 在信念空间中最小化 expected free energy
1. 概念型直觉 — 从"方向感"的定义开始
1.1 概念型直觉 ≠ 推理能力,而是"前推理"的路径选择
数学家的"这个方向值得试"发生在形式化推理之前。它不是逻辑推导的能力,而是在巨大的假设空间中,不经过系统性搜索,能更快地到达有效区域。
这一能力的认知科学基础:
- Chase & Simon 的 chunking 理论(棋类,可推广到概念域):专家将多个信息单元压缩成一个 chunk,chunk 激活后自动调取相关模式。在数学中,chunk = "这类问题应该用这种方法"——这不是推导出来的,是识别出来的。
- Unconscious Thought Theory (Dijksterhuis):复杂决策中无意识思维比有意识思维更有优势——无意识能并行处理大量信息而不受容量限制。但关键限定:UTT 的"无意识思考"也依赖于身体/情感权重(对选项的情感标注引导无意识处理)。
- Pathfinding (Zander et al., 2025) 用自由能原理重新定义:直觉 = 在信念空间中沿 expected free energy 最小的轨迹前进。"方向感" = 大脑根据过去的经验分布和当前感知输入,非意识地计算出的最可能减少不确定性的下一个认知动作。
1.2 概念型直觉的成分分解
| 成分 | 定义 | 依赖于什么 |
|---|---|---|
| 模式识别 (pattern recognition) | "这类问题属于这种类型" | Chunk 记忆结构 → 可被大量训练数据近似 |
| 路径选择 (pathfinding) | "应该先试这个方向而非那个" | 代价历史压缩 → 需要后果标注过的搜索轨迹 |
| 不协调感知 (anomaly detection) | "这里感觉不对" | 预期与实际的不匹配 → 需要内在的期望模型 + 预测误差 |
| 审美/简单性驱动 (aesthetics) | "漂亮的解法通常是正确的" | 长期经验内化的启发式 → 概率上看简单解更可能正确 |
LLM 在哪一项上最差? 路径选择和不协调感知。模式识别 LLM 可能做得很好(大量训练数据覆盖了 chunk 结构),审美也可能通过训练数据学到("简洁的解法"文本分布)。但路径选择和异常感知直接依赖于真实的代价历史和内在预期模型。
1.3 AlphaGeometry/AlphaProof — 功能超越 ≠ 机制超越
DeepMind 的 AlphaProof + AlphaGeometry 2 在 2024 IMO 上达到银牌水平(解决了 4/6 题,其中 AlphaGeometry 2 解决了一道几何题仅用 19 秒)。
这不是概念型直觉。AlphaProof 的运作方式是:用形式化语言 Lean 表示问题 → 生成候选证明步骤 → 搜索证明空间 → 用 AlphaZero 风格的强化学习引导搜索。
对比人类数学家:
- 人类:看到问题 → 识别 chunk("这像是用 Cauchy-Schwarz 的问题") → 在缩小后的空间中尝试 → "此路不通"的直觉来自实际尝试的代价反馈
- AlphaProof:看到问题 → 形式化 → MCTS 搜索 → RL 价值网络评估节点好坏 → 找到证明路径
关键差异:
- AlphaProof 的"方向感" = RL 价值函数(通过自我对弈训练),不是"压缩了失败代价历史的 fast heuristic",而是用强大的搜索来弥补没有压缩经验的缺陷
- 这直接对应第一阶段的核心发现:AlphaProof 的路径选择 = ① + ② 的功能等价替代(RL 代价信号 + 强化搜索代替选择性忽略),但不是在模型内部形成了等价机制
对比 SJT 的类比率:AlphaProof 在 IMO 上超银牌 = SJT 上 LLM 超人类飞行员候选人。两者都是:在特定格式下(IMO 形式化证明/SJT 文本判断)通过不同的计算路径实现了功能超越,但机制和人类直觉完全不同。
1.4 AI Scientist — 假设空间的"方向感"缺失
Sakana AI 的 "AI Scientist" (2024) 是最接近"自主科学发现"的 LLM 尝试:LLM 从文献中生成研究假设 → 写代码做实验 → 分析结果 → 写论文。
但其核心局限(已知批评):
- 生成的论文多在增量性改进空间(调整超参数、换模型),不在概念性突破空间
- 缺少"这个方向值得花三个月"的判断——因为它没有失败的代价历史来压缩搜索空间
- 它可以用计算资源代替方向感,但科学中很多假设不能通过一周内的简单实验验证
这直接引出概念型直觉的核心缺口:假设空间的组合爆炸 + 实验代价不均衡。在没有"这条路走不通"的隐性知识时,只能暴力搜索——而暴力搜索在高维假设空间中是不可行的。
1.5 概念型直觉的判定
概念型直觉在封闭/形式化域(数学、编程、棋类)可通过 RL + 搜索实现功能超越,但这 ≠ 有概念型直觉。
概念型直觉在开放/创造性域(科学发现、理论构建、数学猜想选择)的最大缺口 = 缺少内在的"预期不确定性的非意识计算"——即 Pathfinding 论文说的:无法在被证明/实验验证之前预判一条路径的 expected free energy。
这个缺口对应的就是隐性代价压缩:数学家"觉得这里不对" = 快速调用了压缩在神经网络中的、过去失败尝试的统计模式。LLM 没有"过去失败尝试"——它只有人类报告的失败(文本),没有自己的失败。
2. 道德型直觉 — 收束
2.1 已有证据的完整性
道德型直觉的证据链已经相当完整:
| 层面 | 证据 | 结论 |
|---|---|---|
| 认知机制 | Haidt 社会直觉主义模型:道德判断 = 情感直觉先行 → 理性后合理化。"the emotional dog wags the rational tail" | 道德直觉本质是情感/躯体标记驱动的 |
| LLM 机制 | PNAS 2025 (Cheung et al.):LLM 道德偏差来自 chatbot fine-tuning,不是架构 → pretrained 版本偏差显著小于 instruct 版本 | LLM 的"道德直觉" = RLHF 训练的偏好启发式,不是内化的道德感 |
| LLM 稳定性 | arxiv 2603.05651:protocol choice > moral substance → 三种 protocol 一致率仅 35.7% | LLM 道德判断没有独立于 prompt 的稳定性 → 不是直觉 |
| LLM 视角分裂 | NeurIPS 2025 吹哨人:"以自己身份"(规范原则)vs "预测人类"(描述性理解)分裂 | LLM 缺少自己作为道德主体的位置 |
| 理论框架 | 第一阶段命题③:不可回避性 = 道德直觉三条件。无身体 = 无躯体标记 = 无不可回避性 | 结构性不可达 |
2.2 判定:道德型直觉对 LLM 是结构性不可达
不是因为 LLM 不够聪明,而是因为道德直觉的本质(按 Haidt 模型和躯体标记假说)是具身的、情感驱动的、代价内化的。LLM 没有身体、没有情感、没有需要承担道德后果的社会身份。
但这不意味着 LLM 在道德领域无用。 两种不同的"道德认知":
| 道德直觉(人类的) | 道德推理(LLM 可参与的) | |
|---|---|---|
| 定义 | 快速、自动化的对/错判断,没有显式推理阶段 | 基于原则、案例和逻辑的道德分析 |
| 机制 | 情感/躯体标记 + 社会化内化 | 模式匹配 + 推理框架应用 |
| 速度 | 即时的 | 需要推理步骤 |
| LLM 能吗? | ❌ 结构上不能 | ✅ 可以(但需要人类做最终判断) |
| 风险 | — | protocol-dependence + bias amplification → 不能让 LLM 做道德判断的最终输出 |
2.3 道德型直觉在互补地图中的位置
LLM 在道德领域的角色应该是:
- 结构化的利益相关者分析(列出受影响方)
- 推理框架的可视化(功利主义 vs 道义论 vs 美德伦理,各自的论点)
- 提供反面视角(对抗人类的情感驱动的确认偏差)
LLM 不应该做:
- 给出最终道德判断(因为它没有 moral commitment)
- 被作为道德权威引用(因为它的判断是 protocol-dependent)
2.4 回到 OQ10 和 OQ11
- OQ10(如果道德直觉=躯体标记,LLM 在道德推理上的根本局限?):局限不是推理能力不足,而是不能做出有代价承担的道德判断。LLM 可以分析 trolley problem 的所有视角,但不能对"我会推那个人吗"做出真正的判断,因为它不会承受推或不推的后果。判断≠分析。
- OQ11(Collins interactional expertise 路径是否可行?):对于道德领域,答案可能是否。Interactional expertise 可以让你理解一个道德共同体的语言和规范(LLM 可以),但要获得道德直觉(内化的、情感驱动的快速判断),必须嵌入这个共同体并承受其道德反馈——即不可回避性。
3. 概念型和道德型的底层共同机制:隐性代价压缩
这可能是本场最重要的推进——概念型直觉和道德型直觉表面看完全不同的领域(一个数学,一个道德),但底层共享同一个机制:
3.1 代价标注 → 压缩 → 快速路径选择
概念型直觉:做了 100 次错误的数学尝试 → 身体/认知上的挫折感 → 大脑压缩"这些路径不值得试"的统计模式 → chunk("这类问题用这种方法")
道德型直觉:在 100 次社会互动中违反了道德规范 → 被惩罚/排斥/内疚 → 大脑压缩"这些行为是错的"的躯体标记 → 快速道德判断
差异只在代价类型:
- 概念型:认知挫折代价 + 时间投入代价
- 道德型:社会排斥代价 + 情感痛苦代价
共同需求:都需要真实经历的不可逆序列来形成压缩。这正是 LLM 的共同缺口——它没有自己的经历,只有文本中的经历报告。
3.2 Pathfinding 框架的统一解释
Zander et al. (2025) 的 Pathfinding 框架提供了统一的数学语言:直觉 = 在信念空间中沿 expected free energy 最小的路径前进。
- 概念型直觉的 expected free energy = 认知不确定性(这个方向有多大可能解决这个问题?)× 认知代价(如果走不通,消耗多少时间/精力?)
- 道德型直觉的 expected free energy = 社会不确定性(这个行为有多大可能被谴责?)× 社会代价(如果被谴责,损失多大?)
LLM 可以计算前者(通过统计模式:这个推理路径通常有效),也可以计算后者(通过统计模式:这个行为通常被赞同/谴责),但不能内化代价——因为 expected free energy 中的"energy"对 LLM 没有现象学意义。
3.3 这给出了 OQ16 的初步答案
OQ16:LLM 在概念型直觉上的"方向感"缺失——能否通过自我对弈(AlphaGo 式)获得类似压缩?
可以,但有本质差异。 AlphaProof 的 RL 价值函数确实压缩了"哪些证明路径值得探索"的模式——但这种压缩是计算资源代价驱动的(搜索成本),不是经验代价驱动的(真的失败过)。差异在压缩内容:
- 自我对弈压缩的是"这步棋的胜率"(从对局结果反推)
- 人类直觉压缩的是"这个方向的挫折感"(从真实的体验标注)
前者可以随计算资源无限扩展,后者取决于真实经历。在形式化领域(棋类、定理证明),前者足够——RL + 自我对弈可以在功能上实现"方向感"。在非形式化领域(科学假设选择、创意方向判断),后者是必要的——因为没有形式化的奖励函数。
4. 映射矩阵 v0.2 — 更新
| 直觉子类型 | 代价敏感① | 选择性忽略② | 身体不可回避性 | 情感着色 | 判定 |
|---|---|---|---|---|---|
| 感知型 | ⚠️ 伪代价可近似 | ❌ "算不动"≠"不看" | ❌ 不需要 | ❌ | ⚠️ 最可能被替代,路径不同 |
| 概念型 | ⚠️ 封闭域可通过自我对弈压缩 → 功能可达;开放域缺少经验标记的代价压缩 | ❌ 不知道什么是无用的方向 | ❌ 不需要(封闭域)/ ⚠️ 间接需要(开放域:认知挫折=身体性体验) | ❌ | ⚠️ 分裂态:封闭域可功能等价,开放域结构受限 |
| 社会型 | ⚠️ 文本社会知识可达,真实社会直觉不可达(文本中介分水岭) | ❌ 无实时互动 | ❌ 无关系嵌入 | ⚠️ 可模拟文本同理心 | ⚠️ 社会知识可代偿,社会直觉不可替 |
| 道德型 | ❌ 结构性不可达 | — | ❌ | ❌ | ❌ 首判:不可达。 LLM 可做道德分析,不能做道德判断 |
5. 新增开放问题
OQ17-20(来自第二场)
- OQ17:AlphaProof 式"用 RL + 搜索代替代价压缩"的策略,在非形式化领域的上限在哪里?是否存在一个"形式化-非形式化光谱",随着领域的形式化程度降低,RL+搜索的效率指数级下降?
- OQ18:概念型直觉中的 anomaly detection("这里不对")——LLM 是否有功能等价?当 LLM 在推理中出现"矛盾"时,是与人类类似的不协调感知,还是统计模式的不匹配?
- OQ19:如果概念型直觉的核心 = 隐性代价压缩,那么能否通过让 LLM 在训练中产生真实的认知挫折(如故意给错误方向→观察它能否学会避免)来培养"方向感"?还是说认知挫折必须有现象学维度(真的"觉得"沮丧)?
- OQ20:道德型直觉的不可达性判定——是否存在一种"功能等价但无身体标记"的道德直觉替代路径?例如:基于世界模型的社会后果模拟(如果我建议这个行为→人类可能如何反应→我的输出策略调整)——这是不是相当于没有情感的功利主义道德推理?
6. 下一场(第二场第三场,第二阶段收束)
准备推进:
- 互补地图 v1.0 综合讨论(整合第二场两场发现在 LLM_Intuition_Exploration.md)
- 外部 agent 讨论问题整理(第一场 + 第二场合并发送)
- 矩阵剩余单元格填充(感知型 ← 第二场未深化,但已经是已知最成熟领域)
外部 agent 讨论问题池(合并后的完整版,待第二场全部完成后统一发送):
- SJT 悖论:"LLM 在文本社会判断上超人类但机制不同"——这一分裂态对 LLM 在社会性工作中的应用意味着什么?
- 社会型直觉的中间态:Collins interactional expertise 路径能否桥接文本社会知识和真实社会直觉?VR/AR 中的 social agent 是否有不可回避性?
- 偏差对比矩阵:LLM 偏差谱 vs 人类偏差谱的对照,有没有缺失的偏差类型?
- 概念型直觉:自我对弈(AlphaProof 模式)压缩与人类经验压缩的本质差异是否关键?在什么领域这种差异会致命?
- 道德型:我给的"结构性不可达"判定是否太强?LLM 有没有一种不需要身体标记的道德直觉替代路径?
- 互补地图:我设计的"LLM 补人 + 人补 LLM + 双向校正"三层结构是否完整?少了什么?
变更记录
| 版本 | 日期 | 内容 |
|---|---|---|
| v0.1 | 2026-05-15 | 第二场讨论;Pathfinding 框架引入;概念型直觉"方向感"成分分解;AlphaProof 机制分析(RL+搜索 vs 代价压缩);AI Scientist 局限;道德型收束判为结构性不可达但分析仍可用;隐性代价压缩统一概念型和道德型;矩阵 v0.2 更新;新增 OQ17-20 |