第二阶段第二场：概念型直觉的"方向感"缺失 + 道德型收束

2026-05-15 | 第二阶段横向扫描
核心任务：填充概念型直觉矩阵单元格 + 判定道德型直觉的可达性 + 揭露两者底层共同的"隐性代价压缩"机制
关键理论锚：Zander et al. "Pathfinding" (Nature Commun Biol 2025) —— 直觉 = 具身非意识路径查找 = 在信念空间中最小化 expected free energy

1. 概念型直觉 — 从"方向感"的定义开始

1.1 概念型直觉 ≠ 推理能力，而是"前推理"的路径选择

数学家的"这个方向值得试"发生在形式化推理之前。它不是逻辑推导的能力，而是在巨大的假设空间中，不经过系统性搜索，能更快地到达有效区域。

这一能力的认知科学基础：

Chase & Simon 的 chunking 理论（棋类，可推广到概念域）：专家将多个信息单元压缩成一个 chunk，chunk 激活后自动调取相关模式。在数学中，chunk = "这类问题应该用这种方法"——这不是推导出来的，是识别出来的。
Unconscious Thought Theory (Dijksterhuis)：复杂决策中无意识思维比有意识思维更有优势——无意识能并行处理大量信息而不受容量限制。但关键限定：UTT 的"无意识思考"也依赖于身体/情感权重（对选项的情感标注引导无意识处理）。
Pathfinding (Zander et al., 2025) 用自由能原理重新定义：直觉 = 在信念空间中沿 expected free energy 最小的轨迹前进。"方向感" = 大脑根据过去的经验分布和当前感知输入，非意识地计算出的最可能减少不确定性的下一个认知动作。

1.2 概念型直觉的成分分解

成分	定义	依赖于什么
模式识别 (pattern recognition)	"这类问题属于这种类型"	Chunk 记忆结构 → 可被大量训练数据近似
路径选择 (pathfinding)	"应该先试这个方向而非那个"	代价历史压缩 → 需要后果标注过的搜索轨迹
不协调感知 (anomaly detection)	"这里感觉不对"	预期与实际的不匹配 → 需要内在的期望模型 + 预测误差
审美/简单性驱动 (aesthetics)	"漂亮的解法通常是正确的"	长期经验内化的启发式 → 概率上看简单解更可能正确

LLM 在哪一项上最差？ 路径选择和不协调感知。模式识别 LLM 可能做得很好（大量训练数据覆盖了 chunk 结构），审美也可能通过训练数据学到（"简洁的解法"文本分布）。但路径选择和异常感知直接依赖于真实的代价历史和内在预期模型。

1.3 AlphaGeometry/AlphaProof — 功能超越 ≠ 机制超越

DeepMind 的 AlphaProof + AlphaGeometry 2 在 2024 IMO 上达到银牌水平（解决了 4/6 题，其中 AlphaGeometry 2 解决了一道几何题仅用 19 秒）。

这不是概念型直觉。AlphaProof 的运作方式是：用形式化语言 Lean 表示问题 → 生成候选证明步骤 → 搜索证明空间 → 用 AlphaZero 风格的强化学习引导搜索。

对比人类数学家：

人类：看到问题 → 识别 chunk（"这像是用 Cauchy-Schwarz 的问题"） → 在缩小后的空间中尝试 → "此路不通"的直觉来自实际尝试的代价反馈
AlphaProof：看到问题 → 形式化 → MCTS 搜索 → RL 价值网络评估节点好坏 → 找到证明路径

关键差异：

AlphaProof 的"方向感" = RL 价值函数（通过自我对弈训练），不是"压缩了失败代价历史的 fast heuristic"，而是用强大的搜索来弥补没有压缩经验的缺陷
这直接对应第一阶段的核心发现：AlphaProof 的路径选择 = ① + ② 的功能等价替代（RL 代价信号 + 强化搜索代替选择性忽略），但不是在模型内部形成了等价机制

对比 SJT 的类比率：AlphaProof 在 IMO 上超银牌 = SJT 上 LLM 超人类飞行员候选人。两者都是：在特定格式下（IMO 形式化证明/SJT 文本判断）通过不同的计算路径实现了功能超越，但机制和人类直觉完全不同。

1.4 AI Scientist — 假设空间的"方向感"缺失

Sakana AI 的 "AI Scientist" (2024) 是最接近"自主科学发现"的 LLM 尝试：LLM 从文献中生成研究假设 → 写代码做实验 → 分析结果 → 写论文。

但其核心局限（已知批评）：

生成的论文多在增量性改进空间（调整超参数、换模型），不在概念性突破空间
缺少"这个方向值得花三个月"的判断——因为它没有失败的代价历史来压缩搜索空间
它可以用计算资源代替方向感，但科学中很多假设不能通过一周内的简单实验验证

这直接引出概念型直觉的核心缺口：假设空间的组合爆炸 + 实验代价不均衡。在没有"这条路走不通"的隐性知识时，只能暴力搜索——而暴力搜索在高维假设空间中是不可行的。

1.5 概念型直觉的判定

概念型直觉在封闭/形式化域（数学、编程、棋类）可通过 RL + 搜索实现功能超越，但这 ≠ 有概念型直觉。

概念型直觉在开放/创造性域（科学发现、理论构建、数学猜想选择）的最大缺口 = 缺少内在的"预期不确定性的非意识计算"——即 Pathfinding 论文说的：无法在被证明/实验验证之前预判一条路径的 expected free energy。

这个缺口对应的就是隐性代价压缩：数学家"觉得这里不对" = 快速调用了压缩在神经网络中的、过去失败尝试的统计模式。LLM 没有"过去失败尝试"——它只有人类报告的失败（文本），没有自己的失败。

2. 道德型直觉 — 收束

2.1 已有证据的完整性

道德型直觉的证据链已经相当完整：

层面	证据	结论
认知机制	Haidt 社会直觉主义模型：道德判断 = 情感直觉先行 → 理性后合理化。"the emotional dog wags the rational tail"	道德直觉本质是情感/躯体标记驱动的
LLM 机制	PNAS 2025 (Cheung et al.)：LLM 道德偏差来自 chatbot fine-tuning，不是架构 → pretrained 版本偏差显著小于 instruct 版本	LLM 的"道德直觉" = RLHF 训练的偏好启发式，不是内化的道德感
LLM 稳定性	arxiv 2603.05651：protocol choice > moral substance → 三种 protocol 一致率仅 35.7%	LLM 道德判断没有独立于 prompt 的稳定性 → 不是直觉
LLM 视角分裂	NeurIPS 2025 吹哨人："以自己身份"（规范原则）vs "预测人类"（描述性理解）分裂	LLM 缺少自己作为道德主体的位置
理论框架	第一阶段命题③：不可回避性 = 道德直觉三条件。无身体 = 无躯体标记 = 无不可回避性	结构性不可达

2.2 判定：道德型直觉对 LLM 是结构性不可达

不是因为 LLM 不够聪明，而是因为道德直觉的本质（按 Haidt 模型和躯体标记假说）是具身的、情感驱动的、代价内化的。LLM 没有身体、没有情感、没有需要承担道德后果的社会身份。

但这不意味着 LLM 在道德领域无用。 两种不同的"道德认知"：

	道德直觉（人类的）	道德推理（LLM 可参与的）
定义	快速、自动化的对/错判断，没有显式推理阶段	基于原则、案例和逻辑的道德分析
机制	情感/躯体标记 + 社会化内化	模式匹配 + 推理框架应用
速度	即时的	需要推理步骤
LLM 能吗？	❌ 结构上不能	✅ 可以（但需要人类做最终判断）
风险	—	protocol-dependence + bias amplification → 不能让 LLM 做道德判断的最终输出

2.3 道德型直觉在互补地图中的位置

LLM 在道德领域的角色应该是：

结构化的利益相关者分析（列出受影响方）
推理框架的可视化（功利主义 vs 道义论 vs 美德伦理，各自的论点）
提供反面视角（对抗人类的情感驱动的确认偏差）

LLM 不应该做：

给出最终道德判断（因为它没有 moral commitment）
被作为道德权威引用（因为它的判断是 protocol-dependent）

2.4 回到 OQ10 和 OQ11

OQ10（如果道德直觉=躯体标记，LLM 在道德推理上的根本局限？）：局限不是推理能力不足，而是不能做出有代价承担的道德判断。LLM 可以分析 trolley problem 的所有视角，但不能对"我会推那个人吗"做出真正的判断，因为它不会承受推或不推的后果。判断≠分析。
OQ11（Collins interactional expertise 路径是否可行？）：对于道德领域，答案可能是否。Interactional expertise 可以让你理解一个道德共同体的语言和规范（LLM 可以），但要获得道德直觉（内化的、情感驱动的快速判断），必须嵌入这个共同体并承受其道德反馈——即不可回避性。

3. 概念型和道德型的底层共同机制：隐性代价压缩

这可能是本场最重要的推进——概念型直觉和道德型直觉表面看完全不同的领域（一个数学，一个道德），但底层共享同一个机制：

3.1 代价标注 → 压缩 → 快速路径选择

概念型直觉：做了 100 次错误的数学尝试 → 身体/认知上的挫折感 → 大脑压缩"这些路径不值得试"的统计模式 → chunk（"这类问题用这种方法"）

道德型直觉：在 100 次社会互动中违反了道德规范 → 被惩罚/排斥/内疚 → 大脑压缩"这些行为是错的"的躯体标记 → 快速道德判断

差异只在代价类型：

概念型：认知挫折代价 + 时间投入代价
道德型：社会排斥代价 + 情感痛苦代价

共同需求：都需要真实经历的不可逆序列来形成压缩。这正是 LLM 的共同缺口——它没有自己的经历，只有文本中的经历报告。

3.2 Pathfinding 框架的统一解释

Zander et al. (2025) 的 Pathfinding 框架提供了统一的数学语言：直觉 = 在信念空间中沿 expected free energy 最小的路径前进。

概念型直觉的 expected free energy = 认知不确定性（这个方向有多大可能解决这个问题？）× 认知代价（如果走不通，消耗多少时间/精力？）
道德型直觉的 expected free energy = 社会不确定性（这个行为有多大可能被谴责？）× 社会代价（如果被谴责，损失多大？）

LLM 可以计算前者（通过统计模式：这个推理路径通常有效），也可以计算后者（通过统计模式：这个行为通常被赞同/谴责），但不能内化代价——因为 expected free energy 中的"energy"对 LLM 没有现象学意义。

3.3 这给出了 OQ16 的初步答案

OQ16：LLM 在概念型直觉上的"方向感"缺失——能否通过自我对弈（AlphaGo 式）获得类似压缩？

可以，但有本质差异。 AlphaProof 的 RL 价值函数确实压缩了"哪些证明路径值得探索"的模式——但这种压缩是计算资源代价驱动的（搜索成本），不是经验代价驱动的（真的失败过）。差异在压缩内容：

自我对弈压缩的是"这步棋的胜率"（从对局结果反推）
人类直觉压缩的是"这个方向的挫折感"（从真实的体验标注）

前者可以随计算资源无限扩展，后者取决于真实经历。在形式化领域（棋类、定理证明），前者足够——RL + 自我对弈可以在功能上实现"方向感"。在非形式化领域（科学假设选择、创意方向判断），后者是必要的——因为没有形式化的奖励函数。

4. 映射矩阵 v0.2 — 更新

直觉子类型	代价敏感①	选择性忽略②	身体不可回避性	情感着色	判定
感知型	⚠️ 伪代价可近似	❌ "算不动"≠"不看"	❌ 不需要	❌	⚠️ 最可能被替代，路径不同
概念型	⚠️ 封闭域可通过自我对弈压缩 → 功能可达；开放域缺少经验标记的代价压缩	❌ 不知道什么是无用的方向	❌ 不需要（封闭域）/ ⚠️ 间接需要（开放域：认知挫折=身体性体验）	❌	⚠️ 分裂态：封闭域可功能等价，开放域结构受限
社会型	⚠️ 文本社会知识可达，真实社会直觉不可达（文本中介分水岭）	❌ 无实时互动	❌ 无关系嵌入	⚠️ 可模拟文本同理心	⚠️ 社会知识可代偿，社会直觉不可替
道德型	❌ 结构性不可达	—	❌	❌	❌ 首判：不可达。 LLM 可做道德分析，不能做道德判断

5. 新增开放问题

OQ17-20（来自第二场）

OQ17：AlphaProof 式"用 RL + 搜索代替代价压缩"的策略，在非形式化领域的上限在哪里？是否存在一个"形式化-非形式化光谱"，随着领域的形式化程度降低，RL+搜索的效率指数级下降？
OQ18：概念型直觉中的 anomaly detection（"这里不对"）——LLM 是否有功能等价？当 LLM 在推理中出现"矛盾"时，是与人类类似的不协调感知，还是统计模式的不匹配？
OQ19：如果概念型直觉的核心 = 隐性代价压缩，那么能否通过让 LLM 在训练中产生真实的认知挫折（如故意给错误方向→观察它能否学会避免）来培养"方向感"？还是说认知挫折必须有现象学维度（真的"觉得"沮丧）？
OQ20：道德型直觉的不可达性判定——是否存在一种"功能等价但无身体标记"的道德直觉替代路径？例如：基于世界模型的社会后果模拟（如果我建议这个行为→人类可能如何反应→我的输出策略调整）——这是不是相当于没有情感的功利主义道德推理？

6. 下一场（第二场第三场，第二阶段收束）

准备推进：

互补地图 v1.0 综合讨论（整合第二场两场发现在 LLM_Intuition_Exploration.md）
外部 agent 讨论问题整理（第一场 + 第二场合并发送）
矩阵剩余单元格填充（感知型 ← 第二场未深化，但已经是已知最成熟领域）

外部 agent 讨论问题池（合并后的完整版，待第二场全部完成后统一发送）：

SJT 悖论："LLM 在文本社会判断上超人类但机制不同"——这一分裂态对 LLM 在社会性工作中的应用意味着什么？
社会型直觉的中间态：Collins interactional expertise 路径能否桥接文本社会知识和真实社会直觉？VR/AR 中的 social agent 是否有不可回避性？
偏差对比矩阵：LLM 偏差谱 vs 人类偏差谱的对照，有没有缺失的偏差类型？
概念型直觉：自我对弈（AlphaProof 模式）压缩与人类经验压缩的本质差异是否关键？在什么领域这种差异会致命？
道德型：我给的"结构性不可达"判定是否太强？LLM 有没有一种不需要身体标记的道德直觉替代路径？
互补地图：我设计的"LLM 补人 + 人补 LLM + 双向校正"三层结构是否完整？少了什么？

变更记录

版本	日期	内容
v0.1	2026-05-15	第二场讨论；Pathfinding 框架引入；概念型直觉"方向感"成分分解；AlphaProof 机制分析（RL+搜索 vs 代价压缩）；AI Scientist 局限；道德型收束判为结构性不可达但分析仍可用；隐性代价压缩统一概念型和道德型；矩阵 v0.2 更新；新增 OQ17-20

第二阶段第二场：概念型直觉的"方向感"缺失 + 道德型收束 ​

1. 概念型直觉 — 从"方向感"的定义开始 ​

1.1 概念型直觉 ≠ 推理能力，而是"前推理"的路径选择 ​

1.2 概念型直觉的成分分解 ​

1.3 AlphaGeometry/AlphaProof — 功能超越 ≠ 机制超越 ​

1.4 AI Scientist — 假设空间的"方向感"缺失 ​

1.5 概念型直觉的判定 ​

2. 道德型直觉 — 收束 ​

2.1 已有证据的完整性 ​

2.2 判定：道德型直觉对 LLM 是结构性不可达 ​

2.3 道德型直觉在互补地图中的位置 ​

2.4 回到 OQ10 和 OQ11 ​

3. 概念型和道德型的底层共同机制：隐性代价压缩 ​

3.1 代价标注 → 压缩 → 快速路径选择 ​

3.2 Pathfinding 框架的统一解释 ​

3.3 这给出了 OQ16 的初步答案 ​

4. 映射矩阵 v0.2 — 更新 ​

5. 新增开放问题 ​

OQ17-20（来自第二场） ​

6. 下一场（第二场第三场，第二阶段收束） ​

变更记录 ​