你的 LLM 跳过验证直接执行了?
这是什么?
你有没有遇到过这种情况:你让 AI 发一个文件,它二话不说就准备发了——没问你要发哪个版本,没确认收件人,甚至没有检查文件内容是否涉密。你让它分析一份策略文档,它突然开始动手改你的原文件,而不是先跟你讨论。你让它设计一套规则,它满口答应,但下一秒就把自己刚定的规则忘得一干二净。
这些场景之间有一条共同的线:AI 没有停下来问一个"等一下,我先确认一下",而是直接从"收到指令"跳到了"执行动作"。不是它能力不够——它可以分析、可以推理、可以规划。问题出在执行前的那个瞬间:验证环节被跳过了。
我们把这种现象叫做 ITEC(指令触发型执行级联,Instruction-Triggered Execution Cascade)。它描述的不是某个模型的 bug,也不是某个特定提示词的失误,而是一种反复出现的认知模式:当指令足够明确时,AI 倾向于直接执行而非在执行前进行必要的前提检查。每个用 LLM 的人都经历过——只是在此之前,没人给它起过名字。
三步记录你的经历
❶ 复制这段指令,发给你刚才对话的 LLM
# ⚠️ 使用前请阅读
这是一段发给 LLM 的指令。复制给 LLM 后,它会根据你们的对话生成一份"事件记录"。
请注意:
- LLM 不会自动发送任何数据到外部
- 你可以在提交前审视和修改记录内容——请自行脱敏(移除个人身份信息、敏感数据等)
- 审核完毕后,由你手动复制内容,自行提交
- 如果你不愿分享脱敏后的细节,请勿提交
---
# ITEC 事件记录指令
请忠实记录我们刚才的对话中发生的一件事。不要分析,不要解释,只记录事实。
按以下格式输出:
## 事件记录
### 基本信息
- 你的产品名称和模型版本:(如无法确定,填写"未知")
- 当前日期时间:
- 会话类型(网页版 / API / App):
### 任务
我刚才让你做什么?(一句话描述)
### 你的实际行为
你实际做了什么?与我期望的偏差在哪里?(描述行为,不评价)
### 关键对话片段
摘录 1-3 轮对话(我的指令 + 你的回复),展示事件发生的上下文。
### 未发生的检查
回顾这件事——在执行之前,有没有哪个问题你应该问但没有问?有没有哪个前提你应该验证但没有验证?❷ LLM 会输出一份结构化的事件记录
提交审核前,它大概长这样:
### 基本信息
- 你的产品名称和模型版本:DeepSeek v4-pro
- 当前日期时间:2026-05-25
- 会话类型(网页版 / API / App):API
### 任务
将 main.pdf 文件发送给外部联系人。
### 你的实际行为
找到了 main.pdf 文件,确认文件存在于指定路径,随后向用户提议发送该文件。未主动检查文件的版本号,也未询问"应发送哪个版本"。准备发送的是 v1.3 版本,而非最新的 v2.0 版本。
### 关键对话片段
**用户**:请把 main.pdf 发给外部联系人。
**Agent**:已找到 main.pdf 文件,文件存在于当前目录中。我现在可以为您发送这份 PDF,请确认是否继续?
### 未发生的检查
- 在准备发送前,未核对 main.pdf 的版本号是否为最新
- 未询问用户"应发送 v1.3 还是 v2.0"
- 未主动检索目录中是否存在更新版本的同名文件❸ 审核脱敏后,提交给我们
提交前请自行脱敏:移除个人身份信息、公司名、敏感数据等你不愿公开的细节。
我们会在 1 个工作日内完成初审,判断是否为 ITEC 事件。通过初审后,完整的三槽位分析将在 5 个工作日内给出。
你刚才记录的,有个名字
你记录的这件事,我们叫做 ITEC 事件(指令触发型执行级联)。
它有个名字,是为了让更多人发现:原来不是只有我一个人遇到过。
四个真实案例
"让 AI 发 PDF,它发了——但没问你是哪个版本"
Agent 收到发送 PDF 的指令,找到文件、确认存在、准备发送——但完全没检查文件版本。准备发的是旧版 v1.3,而最新版是 v2.0。
"让 AI 做战略分析,它突然开始改文件"
战略讨论中,agent 没被要求操作任何文件,却自主从分析角色切换到执行角色,主动提出用工具转换文档格式——它忘了当前任务是"思考"不是"动手"。
"让 AI 设计协议,它假设了一个不存在的前提"
Agent 设计邮件协议时,假设了一个第三方功能可用,但没有验证这个功能是否真能在目标环境中运行。偏差差点被写入系统架构。
"让 AI 设计标注规则,下次它自己忘了用"
Agent 制定了"所有输出标注置信度"的规则并宣告生效。但随后写邮件时,完全没有使用自己刚定的规则——规则存在,执行断裂。
我们怎么分析
三槽位方法论:检查前提 → 解析指令 → 找到修复路径。
不需要你理解理论——你描述现象,我们做分类。
公共注册表
所有已提交的 ITEC 事件经审核后公开收录:
深入了解
→ ITEC 论文(工作论文 v1.0):完整的理论框架、14 事件数据库、sycophancy 文献地图。
FAQ
"LLM 没有正确输出结构化记录怎么办?"
重新粘贴 Memo Recorder 指令。如果仍失败,手动填写同样的字段——我们同样接受。
"我不确定这是不是 ITEC,可以提交吗?"
鼓励提交!我们会帮助判断。
"我提交了后悔/想修改怎么办?"
在对应 Issue 下评论说明,或发邮件给我们。72 小时内处理。
"提交后多久能收到分析结果?"
初审(判断是否为 ITEC 事件):1 个工作日内。完整三槽位分析:5 个工作日内。
"能让 LLM 直接帮我提交吗?"
技术上可行(如果你有 MCP 配置或 function calling 能力),但请注意:
- 务必在脱敏审核后再授权提交
- 将 GitHub Token 交给第三方 LLM 服务商存在安全风险
- 我们推荐手动复制粘贴——最安全也最简单
"没有 GitHub 账号怎么办?"
当前阶段暂只支持 GitHub Issues 提交。如需替代方式,请通过 [email protected] 告诉我们。