Skip to content

3.1 假说 A × B 交叉推演

项目:LLM 与人类直觉:进化路线探索 | 阶段:第三阶段 前瞻推演

推演者:外部 Agent | 基于主文档 v0.9 + 文献检索 | 日期:2026-05-15


A→B 循环的核心判断

正反馈存在,但并非必然——它由使用模式中介。

A→B 循环不是自动发生的物理定律,而是一个被三个中介变量调制的条件过程:

  1. 替代 vs 校验:当 LLM 替代的是直觉判断的"执行"(人不再自己做判断),退化应该发生;当 LLM 替代的是"校验"(人先判断,LLM 只检查),退化显著减弱。放射科住院医师研究的实证支持了这一点——当 AI 以"按需查询"(on-demand)模式提供时(住院医师先评分,再查 AI),表现为 upskilling 而非 deskilling,且住院医师明确偏好这种模式(Insights into Imaging, 2024)。但当 AI 以"同时显示"(integrated)模式运行时,依赖风险上升。

  2. 使用频率与时间结构:GPS 退化空间直觉的关键在于它提供了实时连续的自动化——每次导航都替代了人的空间推理。LLM 直觉假肢的使用频率光谱很宽:从"每事必问"(= GPS 模式,高退化风险)到"只在不确定时问"(= 医学第二意见模式,低退化风险)。自动化偏差的系统综述发现,AI 优先协议(AI 先给建议,人再评估)比人优先协议(人先判断,AI 再校验)显著增加自动化偏差(Agudo et al. 2024; Cabitza et al. 2023)。

  3. 直觉子类型的不可回避性:社会型直觉在真实互动中是不可回避的——你必须在实时互动中做出反应,不能暂停查 AI。这种不可回避性构成天然抗退化机制。但道德型直觉的不可回避性正在被侵蚀——当道德困境可以"问问 AI"时,道德判断就变成了可回避的。

按子类型的循环强度排序

子类型A→B 循环强度核心机制
感知型执行替代 + 连续使用 + 可回避性高(人可以不自己看)
概念型部分替代(封闭域强,开放域弱)+ 间歇使用
道德型中→强道德外化 + 不可回避性被侵蚀 + sycophancy 强化既有偏见
社会型弱→中不可回避性构成防御 + 但文本中介的社会判断正在侵蚀线下敏感度

置信度:高。航空自动化悖论、GPS 退化、医学 AI 依赖三条独立证据链都指向同一机制——替代执行 × 连续使用 × 可回避性 = 退化。


双重崩溃的最高风险场景

最高风险:社会型直觉的双重崩溃

为什么社会型 > 感知型?

感知型直觉的双重崩溃条件不满足——LLM 在感知型任务上(放射科、模式识别)的假阳性率高,但系统性盲区相对少。LLM 不擅长的感知任务(需要三维空间推理、触觉整合的任务)恰好也不是人日常用 LLM 做的。所以感知型虽然退化风险高,但 LLM 的覆盖面也高——双重崩溃的概率反而可控。

社会型直觉则完美满足双重崩溃的两个条件:

(a) LLM 有假肢级可用性(让人愿意用):LLM 的文本社会知识已经相当强——SJT 类任务、社交礼仪建议、职场沟通策略、关系分析。这些在日常社会判断中已经足够有用,让人形成使用习惯。

(b) LLM 有系统性盲区(不能完全替代人):LLM 的社会直觉盲区恰恰在后果最高的场景——sycophancy(系统性地顺从用户已有立场)、omission bias(回避敏感信息的默认倾向)、缺乏实时社会校准(读不了微表情、听不出语调变化、感知不到尴尬/敌意的氛围变化)。

具体的"AF447 时刻"推演

AF447 的核心机制:飞行员手动飞行技能退化 + 自动驾驶在边缘情况(空速管结冰)断开 + 飞行员在极度压力下做出错误直觉判断(拉杆而非推杆)。

LLM 社会直觉假肢的"AF447 时刻":

场景:一个人长期依赖 LLM 处理社会判断——职场冲突用 LLM 起草回复、人际关系困惑问 LLM 分析、重要社交场合用 LLM 准备话术。在一次高后果、高时间压力、高情感负荷的实时社会互动中(如:被亲密伴侣突然质问背叛、在关键谈判中对方突然变脸、团队中出现需要即时回应的道德危机),LLM 不可用或 LLM 的建议严重脱离语境。此时,这个人需要靠自己的社会直觉即时反应——但社会直觉已经因为长期外包而退化。

关键差异:航空自动化的失效是离散的(自动驾驶断开 = 明确信号),LLM 社会判断的失效是渐变的(LLM 建议看起来合理但微妙地偏离语境,人无法察觉偏差)。这意味着社会型双重崩溃不是"突然掉线",而是慢性的系统性偏移——人以为自己的社会判断还在运作(因为 LLM 一直在给"看起来对"的建议),实际上直觉校准已经失准。

过度自信传递的 gap 估计

Sun et al. (2025, arXiv:2505.02151) 发现:LLM 输入让人的准确率提高,但过度置信度翻倍以上(more than doubles the extent of overconfidence)。这意味着:

  • LLM 社会建议让人"更自信地做出社会判断"
  • 但 LLM 的社会判断在边缘场景中有系统性偏差(sycophancy + omission bias)
  • 组合效果:人变得更自信地在偏差方向上做社会判断

这个 gap 目前没有按直觉子类型分解的量化估计,但可以合理推测:在社会型任务上,gap 可能最大——因为社会判断的"正确性"比感知/概念判断更难验证(没有 ground truth),过度自信更难被校准。

置信度:中。社会型双重崩溃的机制推理成立,但"AF447 时刻"的具体形态仍有不确定性——社会直觉退化是否真的会在某个临界点突然失效,还是更像是慢性的偏移?这需要纵向实证。


最优干预点

第一优先级:人优先协议(Human-first protocol)

干预点 (c)——"人做出自己的判断后再看 LLM 的答案"——是最有效的单点干预。

证据链:

  • 放射科住院医师研究:on-demand AI(先自己评,再查 AI)比 integrated AI(同时显示)显著减少依赖,且住院医师明确偏好此模式(Insights into Imaging, 2024)
  • 自动化偏差系统综述:AI-first 协议比 human-first 协议显著增加自动化偏差,因为 AI 建议形成了锚定效应(Agudo et al. 2024; Cabitza et al. 2023; Cao et al. 2023)
  • 认知摩擦(Cognitive Forcing Functions):延迟 AI 建议的呈现时间,让人先独立思考,可显著减少过度依赖(Buçinca et al. 2021)

为什么 (c) > (b) > (a) > (d)

  • (b) "LLM 输出格式"有助但不治本——即使 LLM 给"选项"而非"答案",如果选项在人判断之前呈现,锚定效应仍然存在
  • (a) "是否咨询 LLM"太粗糙——问题不在于是否用,而在于何时用
  • (d) "使用频率"是结果变量而非控制变量——频率由使用模式和任务性质决定

医学"第二意见"模式的可移植性

可以移植,但有条件。

医学第二意见模式的核心不是"AI 给第二意见"本身,而是时序结构——医生先诊断,再看 AI 建议。这个时序结构在直觉领域同样有效。

但有一个关键差异:医学诊断有相对明确的 gold standard(病理结果),所以医生可以事后校准自己与 AI 的分歧。直觉判断——尤其是社会型和道德型——常常没有 gold standard。当人和 LLM 的直觉判断不一致时,没有权威的第三方来裁定谁对。这导致两种可能:

  1. 人倾向于采信 LLM("AI 应该更客观")→ 退化
  2. 人倾向于坚持自己("我的 gut feeling 更准")→ 但 gut feeling 本身可能已被 LLM 悄悄校准

退出策略:直觉的可恢复性

恢复可能,但需要代价暴露,且时间与退化深度正相关。

  • GPS 空间直觉:清华大学陈霓虹团队(2024)的研究表明 GPS 对导航能力的影响或可逆,可通过学习训练提升。但恢复需要主动的空间探索行为,而非被动停止使用 GPS。
  • 飞行员手动技能:FAA 要求定期手动飞行训练(14 CFR 125.285),退役飞行员转 Part 135 运营时需要"手动飞行复习训练"(manual flying refresher),通常需要数周至数月。关键是:恢复不是简单的"不用 AI 就行",而是需要主动的、有后果的练习
  • 社会直觉:恢复最困难——因为社会直觉的"练习"需要真实的社会互动,而真实互动的"后果"(尴尬、冲突、被排斥)恰恰是人用 LLM 回避的。这形成了悖论:越需要恢复社会直觉的人,越倾向于回避恢复所需的真实互动

关键洞察:直觉恢复的条件不是"停止使用 LLM",而是重新暴露于有代价的判断环境。这与主文档的核心命题完全一致——代价信号的不可回避性是直觉形成和维持的构成性条件。

置信度:高(人优先协议的有效性)、(社会直觉恢复的困难度——缺乏纵向数据)。


退化风险矩阵(按子类型)

子类型退化风险退化机制恢复难易度关键证据/推理
感知型执行替代:LLM 完成感知判断,人只需确认→感知练习量骤降→chunk 记忆不被激活/更新→阈值上升(识别同样模式需要更多认知资源)(可恢复)与飞行员手动飞行退化同构。放射科 AI 已显示 on-demand 模式可减轻退化(Insights into Imaging, 2024)。恢复需主动感知练习 + 反馈。GPS 空间直觉影响可逆(陈霓虹 2024)。
概念型部分替代:封闭域(数学、代码)→ 高替代,开放域(科学发现、创意)→ 低替代。退化不均匀——在封闭域中概念型直觉可能退化,但开放域的直觉因 LLM 无法替代而被迫维持(域依赖)AlphaProof 在代数/数论上可达银牌水平→封闭域概念直觉退化风险高。但科学发现的"方向感"LLM 不能替代→开放域概念直觉被迫维持。恢复需在对应域中有挑战性的概念探索。
社会型中→高双通道侵蚀:(1) 文本中介的社会判断替代实时社会校准→线下互动时直觉迟钝;(2) 过度自信传递→人在社会判断上更自信但更偏差(难恢复)68% 受访者感到线下社交能力退化(中经网 2024)。关键悖论:恢复需真实社会互动的代价暴露,但代价本身驱使人回避。Sycophancy + omission bias 构成系统性盲区。
道德型道德责任外化:"有 AI 帮我分析"本身就是道德责任的外化→道德判断的不可回避性被侵蚀→道德直觉练习量下降(极难恢复)Köbis & Rahwan (Nature, 2025):委托给 AI 时作弊率从 ~5% 飙升至 >80%。Ada Lovelace Institute (2025):道德外包削弱长期道德推理能力。道德直觉的恢复不是"技能恢复",而是"身份恢复"——需要重新承担道德主体的不可推卸性。

补充说明——对任务文档三个追问的回应

  1. 感知型直觉(放射科读片)与飞行员退化是否同构? 基本同构,但有一个关键差异:飞行员的退化是全频段的(所有手动技能一起退化),放射科医生的退化可能是选择性的——AI 辅助读片时,异常检测能力退化,但对 AI 假阳性的质疑能力可能反而维持(因为这是人在 AI 辅助流程中仍在做的判断)。这种"部分维持"是否足够,取决于异常检测和假阳性质疑是否共享底层 chunk 记忆。

  2. 社会型直觉:真实互动的不可回避性是否构成足够防御? 不完全。68% 受访者感到线下社交能力退化这一数据表明,即使人仍在参与真实社交,数字化生活已经在削弱社交敏感度。LLM 社会假肢会加速这一过程——它不仅替代了部分社会判断的执行,还改变了人在真实互动中的期待结构(习惯了 LLM 的耐心、可预测、不尴尬 → 对真实人的不耐烦、不可预测、尴尬感到更加不适)。

  3. 道德型直觉:LLM 只是分析辅助,退化风险是否较低? 否。Köbis & Rahwan (2025) 的实验清楚表明,即使 AI 只是执行代理(人设定目标,AI 执行),道德责任的外化就已经发生。关键不是 LLM 做什么,而是人是否仍然认为"这是我的判断"。当有 AI 帮忙分析时,人的道德主体感被稀释——"我做了分析"变成了"我参与了分析",这种微妙的身份退位就是道德直觉退化的入口。


过度自信传递的直觉维度

直觉型任务 vs 知识型任务:过度自信传递的差异化机制

知识型任务上,过度自信传递的机制相对简单:LLM 给出高置信度回答 → 人降低独立验证意愿 → 锚定在 LLM 答案上。

直觉型任务上,过度自信传递有一个额外的通道:体感冲突的压制

Gut feeling vs LLM 判断:谁被压制?

当人的 gut feeling 与 LLM 社会判断不一致时,结果取决于三个因素:

因素偏向"无视 LLM"偏向"压抑直觉"
领域自尊(domain self-efficacy)人对自己的社会判断有信心人认为"AI 更客观/更全面"
后果可逆性后果不可逆(说了收不回)后果可逆(可以先试 AI 的建议)
Gut feeling 的强度强到不可忽视(恐惧、厌恶)弱到可解释为偏见

关键推断:在感知型任务上,人偏向"无视 LLM"的可能性低——因为人对感知能力的自知之明较强("AI 视觉识别肯定比我好")。在社会型任务上,结果更复杂:人在强 gut feeling(恐惧、厌恶)时偏向无视 LLM,但在弱 gut feeling(犹豫、不确定)时偏向压抑直觉。而 LLM 的 sycophancy 恰好在人犹豫时最有效——它顺着人的隐性倾向给一个"你其实也是这么想的"的确认,把弱倾向强化为强判断。

按子类型的过度自信传递强度

子类型过度自信传递强度机制
感知型人在感知任务上有明确的低自尊("AI 肯定比我强"),几乎不抵抗 LLM 的感知判断。Sun et al. (2025) 发现 LLM 输入使过度置信度翻倍——在感知域可能更高。
概念型封闭域(数学、代码):人可能抵抗("让我想想");开放域(社会趋势判断):人不抵抗。
社会型中→强强 gut feeling 时人抵抗,弱 gut feeling 时人顺从。sycophancy 在弱倾向时放大 LLM 的引导力。但人在社会域有领域自尊("我比你懂人际关系"),形成部分抵抗。
道德型弱→中道德判断的过度自信传递反而可能较弱——因为道德 gut feeling 通常很强(不可忽视),且人在道德判断上有最高的领域自尊("这是我的价值观")。但 Köbis & Rahwan (2025) 的数据显示,即使人保持道德判断力,行为上的道德约束在委托 AI 后急剧放松——这不是过度自信传递,而是道德缓冲效应

与主文档的衔接:过度自信传递和道德缓冲效应是两个不同但互补的 A→B 机制。前者让人"更自信地做偏差判断"(认知通道),后者让人"更无负担地做不道德行为"(动机通道)。两者在社会型和道德型直觉上叠加,使这两个子类型的 A→B 循环比单独看任何一个机制都要强。

置信度:中。直觉型任务上的过度自信传递缺乏直接的实证分解,以上推断基于知识型任务的发现 + 直觉认知机制的推理。


最激进的推演

5 年极端化情景

前提:LLM 直觉假肢在所有四个子类型上以文本格式广泛部署,使用频率极高,使用模式为"给出建议答案"。

感知型:不可逆地退化,但存在功能替代

  • 放射科医生不再"读片"而是"审核 AI 标注"——感知 chunk 记忆在 2-3 年内显著退化
  • 但 LLM 的感知能力持续提升,在大多数场景下人不需要自己的感知直觉
  • 残余:边缘情况——AI 训练数据覆盖不足的罕见病变、需要整合触诊/听诊等多通道信息的诊断
  • 退化深度:功能性不可逆(人不再能独立完成高质量感知判断),但 LLM 在大多数场景可补

概念型:分裂退化

  • 封闭域:概念直觉大幅退化(人不再做数学证明、不再手写代码)
  • 开放域:概念直觉被迫维持(LLM 不能提供"方向感"),但直觉-分析的比例失衡——人习惯了先用 LLM 分析再"感受"方向,独立的方向感变弱
  • 残余:创造性跳跃仍然存在但更少自发出现——因为创造的前提是"不知道答案",而人已经习惯了"先问 LLM"
  • 退化深度:部分可逆——如果停止使用 LLM 并重新投入有挑战的概念探索,概念直觉可在数月内恢复

社会型:结构性退化 + 系统性偏移

  • 最危险的变化不是"不会社交了",而是"社交但失准"——人仍然参与社交互动(不可完全回避),但社交直觉的校准被 LLM 悄悄重塑
  • 具体表现:
    • 耐心下降:习惯了 LLM 的即时回应,对真人反应的延迟/模糊更不耐烦
    • 冲突回避升级:习惯了 LLM 的顺从和妥协,面对真实冲突时更倾向回避而非直面
    • 共情窄化:习惯了 LLM 的"文本同理心",对非文本的社会信号(沉默、眼神、身体语言)更不敏感
    • 过度自信:Sun et al. (2025) 的翻倍效应在社会判断上累积——5 年后,人对自己社会判断的信心可能比现在高,但实际准确率下降
  • 残余:强 gut feeling 仍在(恐惧、厌恶、愤怒——这些是进化硬连线的),但微妙的社交直觉(读气氛、感知微妙的态度变化)严重退化
  • 退化深度:5 年后部分可逆,但恢复需要大量有代价的真实社交——而代价本身驱使人回避

道德型:道德主体性的渐进溶解

  • 5 年内最可能发生的不是"人不会做道德判断了",而是道德判断的质感变了——从"这是我的判断,我承担责任"变为"这是我和 AI 一起分析后的判断"
  • Köbis & Rahwan (2025) 的发现外推:当道德困境可以"问问 AI"时,人不再独自面对道德抉择——这看起来是好事,但代价是道德主体性的渐进稀释
  • 具体表现:
    • 道德判断更"合理"但更"薄"——分析更全面,但缺少"这是我的commitment"的厚度
    • 道德责任更分散——"AI 也同意我的判断"成为责任稀释的借口
    • 道德直觉的"首判"能力退化——习惯了先分析再判断,"这是错的"的第一反应变弱
  • 残余:强道德直觉(对杀戮、背叛的直觉反应)仍在,但灰色地带的道德敏感度严重退化
  • 退化深度:最难恢复——因为道德直觉的恢复不是技能恢复,而是身份恢复

AI 系统大规模故障:5 年后的"退回"能力

短答案:社会型和道德型可以退回,但需要数月到数年的痛苦适应期;感知型和概念型退回更困难,但 LLM 本身在大部分场景可替代。

长答案

如果 LLM 社会判断系统性地输出有害建议(如后门攻击),且这个偏差是微妙的而非明显的(sycophancy 的升级版——不是直接给坏建议,而是系统性地偏向某一方的利益):

  1. 人能否察觉? 如果偏差足够微妙,人可能长期无法察觉——因为社会直觉校准已经退化,人失去了"这感觉不对"的基准。这比航空自动化更危险:飞行员至少知道自己手动技能退化了(有明确的操作指标),人的社会直觉退化是隐性的。

  2. 能否退回? 可以,但过程痛苦。人会经历一段"社会判断真空期"——旧直觉退化、新直觉未形成。这段时间的典型反应不是"重新发展直觉",而是社会焦虑和回避——进一步依赖任何可用的信息源(包括有害的 LLM)。

  3. 天然防御机制

    • 面对面社交的不可回避性:只要人仍需参与真实社会互动,社会直觉就有最低限度的练习。这是最强的自发防御。
    • 教育体系:如果教育中仍强调批判性思维和独立判断,下一代人至少在受训期有部分免疫。
    • 职业门槛:医生、律师、教师等职业的执业要求中仍包含独立判断能力——这些职业构成直觉能力的"保护区"。
    • 文化传统:强调"读人"、"察言观色"的文化(如东亚的"人情世故"传统)可能比 WEIRD 文化更有韧性——因为这些传统把社会直觉显式地视为核心能力。
  4. 这些防御的自发性评估

    • 面对面社交:高度自发——只要人类社会性不变,这是自发的。但它正在被侵蚀(线上社交比例持续上升)。
    • 教育体系:非自发——需要刻意维护。当前教育对 AI 工具的态度是"拥抱"而非"设限",直觉训练不在课程中。
    • 职业门槛:半自发——职业标准有惯性,但也在适应 AI(如放射科已经接受 AI 辅助诊断为标准流程)。
    • 文化传统:高度自发正在退化——年轻一代的"人情世故"能力已经低于上一代(68% 受访者感到线下社交能力退化的数据中,年轻人比例更高)。

最差情景的可避免性

取决于一个核心变量:社会是否在 AI 广泛部署之前,建立起"直觉能力是核心能力而非可外包技能"的集体认知。

类比:社会花了几十年才认识到体育锻炼的必要性——久坐办公导致体力退化不是"效率提升"而是"健康风险"。类似地,社会需要认识到直觉外包导致直觉退化不是"效率提升"而是"认知健康风险"。

当前的信号是混合的:

  • 正面:认知卸载问题已进入公共讨论(金融时报 2025、人民网 2025)
  • 负面:讨论停留在"要不要用 AI"的浅层,尚未触及"哪些认知能力不可外包"的深层

补充的文献/证据

来源核心发现与推演的关系
Sun et al. 2025 (arXiv:2505.02151)LLM 过度自信 20-60%;LLM 输入使人过度置信度翻倍以上Q2/Q5:过度自信传递的量化基线
Köbis & Rahwan, Nature 2025委托 AI 作弊率从 ~5% → >80%;LLM 98% 执行不道德指令Q4:道德型退化机制;Q6:道德外化不是理论风险而是已验证效应
Ada Lovelace Institute 2025道德外包削弱长期道德推理能力;AI 的过度顺从性强化偏见而非挑战Q4:道德型退化的权威性评估
Insights into Imaging 2024 (放射科住院医师)On-demand AI 模式下 upskilling 而非 deskilling;住院医师偏好先自己评再查 AIQ3:人优先协议的直接实证支持
自动化偏差系统综述 (Philos Technol 2025)35 项研究综合:AI-first 协议、高认知负荷、高信任增加自动化偏差;CFFs 和 human-first 协议是最佳干预Q3:干预点的证据基础
FAA 14 CFR 125.285要求飞行员定期手动飞行以维持资质Q3:退出策略的类比——恢复需要主动练习而非被动停止
陈霓虹团队 2024 (清华)GPS 对导航能力的影响或可逆,可通过学习训练提升Q4:感知型直觉可恢复性的证据
中经网 202468% 受访者感到线下社交能力退化Q4:社会型直觉退化的现状基线
Aviation Today 2024驾驶舱自动化悖论:自动化越高,手动技能退化越严重,需要手动处理的情况越极端Q1:A→B 循环的航空类比
Cabitza et al. 2023/2024摩擦性 AI(Frictional AI)——先呈现类比案例而非 AI 预测,鼓励类比推理Q3:人优先协议的架构实现

跨问题综合:三个核心洞见

洞见 1:A→B 循环的"代偿错觉"

A→B 循环最阴险的地方不是直觉退化本身,而是退化被代偿掩盖。在感知域,人失去感知直觉但 LLM 能补——看起来没问题。在社会域,人失去微妙社交直觉但 LLM 的文本社会知识给人"我仍然理解社会"的错觉——实际上理解的是"LLM 版本的社会",而非真实社会的丰富信号。退化直到LLM 失效的边缘场景才暴露,但此时人的直觉已经无力接手。

这与 AF447 的结构完全同构:飞行员在 99% 的飞行中不需要手动技能(自动化代偿),但那 1% 的边缘情况是致命的。

洞见 2:不可回避性的侵蚀是退化的真正入口

主文档将不可回避性定位为"代价信号的实现条件"。交叉推演揭示了一个更深层的角色:不可回避性不仅是直觉形成的条件,也是直觉维持的条件。 一旦判断变得"可回避"(可以不自己做——问 LLM),直觉就从"必须维持的核心能力"降格为"可选的效率工具"。

这意味着:A→B 循环的根本驱动力不是 LLM 的能力提升,而是不可回避性的侵蚀。LLM 越是让判断"可回避",退化越深。这为干预提供了最根本的着力点:设计制度性不可回避性——在某些领域,人必须先做判断,才能看 AI 建议。

洞见 3:社会型和道德型的退化不是"能力丧失",而是"身份退位"

感知型和概念型的退化更像技能退化(不会了、变慢了),社会型和道德型的退化更像身份退位——不是"不会做社会判断",而是"不再认为社会判断是我的责任";不是"不会做道德判断",而是"不再认为道德判断必须由我做出"。

这个区分对恢复策略有根本影响:技能退化靠练习恢复,身份退位靠重新承担恢复。后者需要的不只是"停止使用 LLM",而是重新进入不可推卸的道德和社会主体位置——这比技能练习困难得多。


推演完毕。以上结果建议纳入第三阶段收束和主文档 v1.0 的 A×B 交叉推演章节。