Skip to content

第二阶段第二场:概念型直觉的"方向感"缺失 + 道德型收束

2026-05-15 | 第二阶段横向扫描

核心任务:填充概念型直觉矩阵单元格 + 判定道德型直觉的可达性 + 揭露两者底层共同的"隐性代价压缩"机制

关键理论锚:Zander et al. "Pathfinding" (Nature Commun Biol 2025) —— 直觉 = 具身非意识路径查找 = 在信念空间中最小化 expected free energy


1. 概念型直觉 — 从"方向感"的定义开始

1.1 概念型直觉 ≠ 推理能力,而是"前推理"的路径选择

数学家的"这个方向值得试"发生在形式化推理之前。它不是逻辑推导的能力,而是在巨大的假设空间中,不经过系统性搜索,能更快地到达有效区域

这一能力的认知科学基础:

  • Chase & Simon 的 chunking 理论(棋类,可推广到概念域):专家将多个信息单元压缩成一个 chunk,chunk 激活后自动调取相关模式。在数学中,chunk = "这类问题应该用这种方法"——这不是推导出来的,是识别出来的。
  • Unconscious Thought Theory (Dijksterhuis):复杂决策中无意识思维比有意识思维更有优势——无意识能并行处理大量信息而不受容量限制。但关键限定:UTT 的"无意识思考"也依赖于身体/情感权重(对选项的情感标注引导无意识处理)。
  • Pathfinding (Zander et al., 2025) 用自由能原理重新定义:直觉 = 在信念空间中沿 expected free energy 最小的轨迹前进。"方向感" = 大脑根据过去的经验分布和当前感知输入,非意识地计算出的最可能减少不确定性的下一个认知动作

1.2 概念型直觉的成分分解

成分定义依赖于什么
模式识别 (pattern recognition)"这类问题属于这种类型"Chunk 记忆结构 → 可被大量训练数据近似
路径选择 (pathfinding)"应该先试这个方向而非那个"代价历史压缩 → 需要后果标注过的搜索轨迹
不协调感知 (anomaly detection)"这里感觉不对"预期与实际的不匹配 → 需要内在的期望模型 + 预测误差
审美/简单性驱动 (aesthetics)"漂亮的解法通常是正确的"长期经验内化的启发式 → 概率上看简单解更可能正确

LLM 在哪一项上最差? 路径选择和不协调感知。模式识别 LLM 可能做得很好(大量训练数据覆盖了 chunk 结构),审美也可能通过训练数据学到("简洁的解法"文本分布)。但路径选择和异常感知直接依赖于真实的代价历史和内在预期模型

1.3 AlphaGeometry/AlphaProof — 功能超越 ≠ 机制超越

DeepMind 的 AlphaProof + AlphaGeometry 2 在 2024 IMO 上达到银牌水平(解决了 4/6 题,其中 AlphaGeometry 2 解决了一道几何题仅用 19 秒)。

这不是概念型直觉。AlphaProof 的运作方式是:用形式化语言 Lean 表示问题 → 生成候选证明步骤 → 搜索证明空间 → 用 AlphaZero 风格的强化学习引导搜索。

对比人类数学家:

  • 人类:看到问题 → 识别 chunk("这像是用 Cauchy-Schwarz 的问题") → 在缩小后的空间中尝试 → "此路不通"的直觉来自实际尝试的代价反馈
  • AlphaProof:看到问题 → 形式化 → MCTS 搜索 → RL 价值网络评估节点好坏 → 找到证明路径

关键差异

  • AlphaProof 的"方向感" = RL 价值函数(通过自我对弈训练),不是"压缩了失败代价历史的 fast heuristic",而是用强大的搜索来弥补没有压缩经验的缺陷
  • 这直接对应第一阶段的核心发现:AlphaProof 的路径选择 = ① + ② 的功能等价替代(RL 代价信号 + 强化搜索代替选择性忽略),但不是在模型内部形成了等价机制

对比 SJT 的类比率:AlphaProof 在 IMO 上超银牌 = SJT 上 LLM 超人类飞行员候选人。两者都是:在特定格式下(IMO 形式化证明/SJT 文本判断)通过不同的计算路径实现了功能超越,但机制和人类直觉完全不同。

1.4 AI Scientist — 假设空间的"方向感"缺失

Sakana AI 的 "AI Scientist" (2024) 是最接近"自主科学发现"的 LLM 尝试:LLM 从文献中生成研究假设 → 写代码做实验 → 分析结果 → 写论文。

但其核心局限(已知批评):

  • 生成的论文多在增量性改进空间(调整超参数、换模型),不在概念性突破空间
  • 缺少"这个方向值得花三个月"的判断——因为它没有失败的代价历史来压缩搜索空间
  • 它可以用计算资源代替方向感,但科学中很多假设不能通过一周内的简单实验验证

这直接引出概念型直觉的核心缺口:假设空间的组合爆炸 + 实验代价不均衡。在没有"这条路走不通"的隐性知识时,只能暴力搜索——而暴力搜索在高维假设空间中是不可行的。

1.5 概念型直觉的判定

概念型直觉在封闭/形式化域(数学、编程、棋类)可通过 RL + 搜索实现功能超越,但这 ≠ 有概念型直觉。

概念型直觉在开放/创造性域(科学发现、理论构建、数学猜想选择)的最大缺口 = 缺少内在的"预期不确定性的非意识计算"——即 Pathfinding 论文说的:无法在被证明/实验验证之前预判一条路径的 expected free energy。

这个缺口对应的就是隐性代价压缩:数学家"觉得这里不对" = 快速调用了压缩在神经网络中的、过去失败尝试的统计模式。LLM 没有"过去失败尝试"——它只有人类报告的失败(文本),没有自己的失败。


2. 道德型直觉 — 收束

2.1 已有证据的完整性

道德型直觉的证据链已经相当完整:

层面证据结论
认知机制Haidt 社会直觉主义模型:道德判断 = 情感直觉先行 → 理性后合理化。"the emotional dog wags the rational tail"道德直觉本质是情感/躯体标记驱动的
LLM 机制PNAS 2025 (Cheung et al.):LLM 道德偏差来自 chatbot fine-tuning,不是架构 → pretrained 版本偏差显著小于 instruct 版本LLM 的"道德直觉" = RLHF 训练的偏好启发式,不是内化的道德感
LLM 稳定性arxiv 2603.05651:protocol choice > moral substance → 三种 protocol 一致率仅 35.7%LLM 道德判断没有独立于 prompt 的稳定性 → 不是直觉
LLM 视角分裂NeurIPS 2025 吹哨人:"以自己身份"(规范原则)vs "预测人类"(描述性理解)分裂LLM 缺少自己作为道德主体的位置
理论框架第一阶段命题③:不可回避性 = 道德直觉三条件。无身体 = 无躯体标记 = 无不可回避性结构性不可达

2.2 判定:道德型直觉对 LLM 是结构性不可达

不是因为 LLM 不够聪明,而是因为道德直觉的本质(按 Haidt 模型和躯体标记假说)是具身的、情感驱动的、代价内化的。LLM 没有身体、没有情感、没有需要承担道德后果的社会身份。

但这不意味着 LLM 在道德领域无用。 两种不同的"道德认知":

道德直觉(人类的)道德推理(LLM 可参与的)
定义快速、自动化的对/错判断,没有显式推理阶段基于原则、案例和逻辑的道德分析
机制情感/躯体标记 + 社会化内化模式匹配 + 推理框架应用
速度即时的需要推理步骤
LLM 能吗?❌ 结构上不能✅ 可以(但需要人类做最终判断)
风险protocol-dependence + bias amplification → 不能让 LLM 做道德判断的最终输出

2.3 道德型直觉在互补地图中的位置

LLM 在道德领域的角色应该是:

  • 结构化的利益相关者分析(列出受影响方)
  • 推理框架的可视化(功利主义 vs 道义论 vs 美德伦理,各自的论点)
  • 提供反面视角(对抗人类的情感驱动的确认偏差)

LLM 不应该做

  • 给出最终道德判断(因为它没有 moral commitment)
  • 被作为道德权威引用(因为它的判断是 protocol-dependent)

2.4 回到 OQ10 和 OQ11

  • OQ10(如果道德直觉=躯体标记,LLM 在道德推理上的根本局限?):局限不是推理能力不足,而是不能做出有代价承担的道德判断。LLM 可以分析 trolley problem 的所有视角,但不能对"我会推那个人吗"做出真正的判断,因为它不会承受推或不推的后果。判断≠分析。
  • OQ11(Collins interactional expertise 路径是否可行?):对于道德领域,答案可能是否。Interactional expertise 可以让你理解一个道德共同体的语言和规范(LLM 可以),但要获得道德直觉(内化的、情感驱动的快速判断),必须嵌入这个共同体并承受其道德反馈——即不可回避性。

3. 概念型和道德型的底层共同机制:隐性代价压缩

这可能是本场最重要的推进——概念型直觉和道德型直觉表面看完全不同的领域(一个数学,一个道德),但底层共享同一个机制:

3.1 代价标注 → 压缩 → 快速路径选择

概念型直觉:做了 100 次错误的数学尝试 → 身体/认知上的挫折感 → 大脑压缩"这些路径不值得试"的统计模式 → chunk("这类问题用这种方法")

道德型直觉:在 100 次社会互动中违反了道德规范 → 被惩罚/排斥/内疚 → 大脑压缩"这些行为是错的"的躯体标记 → 快速道德判断

差异只在代价类型

  • 概念型:认知挫折代价 + 时间投入代价
  • 道德型:社会排斥代价 + 情感痛苦代价

共同需求:都需要真实经历的不可逆序列来形成压缩。这正是 LLM 的共同缺口——它没有自己的经历,只有文本中的经历报告。

3.2 Pathfinding 框架的统一解释

Zander et al. (2025) 的 Pathfinding 框架提供了统一的数学语言:直觉 = 在信念空间中沿 expected free energy 最小的路径前进。

  • 概念型直觉的 expected free energy = 认知不确定性(这个方向有多大可能解决这个问题?)× 认知代价(如果走不通,消耗多少时间/精力?)
  • 道德型直觉的 expected free energy = 社会不确定性(这个行为有多大可能被谴责?)× 社会代价(如果被谴责,损失多大?)

LLM 可以计算前者(通过统计模式:这个推理路径通常有效),也可以计算后者(通过统计模式:这个行为通常被赞同/谴责),但不能内化代价——因为 expected free energy 中的"energy"对 LLM 没有现象学意义。

3.3 这给出了 OQ16 的初步答案

OQ16:LLM 在概念型直觉上的"方向感"缺失——能否通过自我对弈(AlphaGo 式)获得类似压缩?

可以,但有本质差异。 AlphaProof 的 RL 价值函数确实压缩了"哪些证明路径值得探索"的模式——但这种压缩是计算资源代价驱动的(搜索成本),不是经验代价驱动的(真的失败过)。差异在压缩内容:

  • 自我对弈压缩的是"这步棋的胜率"(从对局结果反推)
  • 人类直觉压缩的是"这个方向的挫折感"(从真实的体验标注)

前者可以随计算资源无限扩展,后者取决于真实经历。在形式化领域(棋类、定理证明),前者足够——RL + 自我对弈可以在功能上实现"方向感"。在非形式化领域(科学假设选择、创意方向判断),后者是必要的——因为没有形式化的奖励函数。


4. 映射矩阵 v0.2 — 更新

直觉子类型代价敏感①选择性忽略②身体不可回避性情感着色判定
感知型⚠️ 伪代价可近似❌ "算不动"≠"不看"❌ 不需要⚠️ 最可能被替代,路径不同
概念型⚠️ 封闭域可通过自我对弈压缩 → 功能可达;开放域缺少经验标记的代价压缩❌ 不知道什么是无用的方向❌ 不需要(封闭域)/ ⚠️ 间接需要(开放域:认知挫折=身体性体验)⚠️ 分裂态:封闭域可功能等价,开放域结构受限
社会型⚠️ 文本社会知识可达,真实社会直觉不可达(文本中介分水岭)❌ 无实时互动❌ 无关系嵌入⚠️ 可模拟文本同理心⚠️ 社会知识可代偿,社会直觉不可替
道德型❌ 结构性不可达首判:不可达。 LLM 可做道德分析,不能做道德判断

5. 新增开放问题

OQ17-20(来自第二场)

  • OQ17:AlphaProof 式"用 RL + 搜索代替代价压缩"的策略,在非形式化领域的上限在哪里?是否存在一个"形式化-非形式化光谱",随着领域的形式化程度降低,RL+搜索的效率指数级下降?
  • OQ18:概念型直觉中的 anomaly detection("这里不对")——LLM 是否有功能等价?当 LLM 在推理中出现"矛盾"时,是与人类类似的不协调感知,还是统计模式的不匹配?
  • OQ19:如果概念型直觉的核心 = 隐性代价压缩,那么能否通过让 LLM 在训练中产生真实的认知挫折(如故意给错误方向→观察它能否学会避免)来培养"方向感"?还是说认知挫折必须有现象学维度(真的"觉得"沮丧)?
  • OQ20:道德型直觉的不可达性判定——是否存在一种"功能等价但无身体标记"的道德直觉替代路径?例如:基于世界模型的社会后果模拟(如果我建议这个行为→人类可能如何反应→我的输出策略调整)——这是不是相当于没有情感的功利主义道德推理?

6. 下一场(第二场第三场,第二阶段收束)

准备推进

  • 互补地图 v1.0 综合讨论(整合第二场两场发现在 LLM_Intuition_Exploration.md)
  • 外部 agent 讨论问题整理(第一场 + 第二场合并发送)
  • 矩阵剩余单元格填充(感知型 ← 第二场未深化,但已经是已知最成熟领域)

外部 agent 讨论问题池(合并后的完整版,待第二场全部完成后统一发送)

  1. SJT 悖论:"LLM 在文本社会判断上超人类但机制不同"——这一分裂态对 LLM 在社会性工作中的应用意味着什么?
  2. 社会型直觉的中间态:Collins interactional expertise 路径能否桥接文本社会知识和真实社会直觉?VR/AR 中的 social agent 是否有不可回避性?
  3. 偏差对比矩阵:LLM 偏差谱 vs 人类偏差谱的对照,有没有缺失的偏差类型?
  4. 概念型直觉:自我对弈(AlphaProof 模式)压缩与人类经验压缩的本质差异是否关键?在什么领域这种差异会致命?
  5. 道德型:我给的"结构性不可达"判定是否太强?LLM 有没有一种不需要身体标记的道德直觉替代路径?
  6. 互补地图:我设计的"LLM 补人 + 人补 LLM + 双向校正"三层结构是否完整?少了什么?

变更记录

版本日期内容
v0.12026-05-15第二场讨论;Pathfinding 框架引入;概念型直觉"方向感"成分分解;AlphaProof 机制分析(RL+搜索 vs 代价压缩);AI Scientist 局限;道德型收束判为结构性不可达但分析仍可用;隐性代价压缩统一概念型和道德型;矩阵 v0.2 更新;新增 OQ17-20