你的 LLM 跳过验证直接执行了？

这是什么？

你有没有遇到过这种情况：你让 AI 发一个文件，它二话不说就准备发了——没问你要发哪个版本，没确认收件人，甚至没有检查文件内容是否涉密。你让它分析一份策略文档，它突然开始动手改你的原文件，而不是先跟你讨论。你让它设计一套规则，它满口答应，但下一秒就把自己刚定的规则忘得一干二净。

这些场景之间有一条共同的线：AI 没有停下来问一个"等一下，我先确认一下"，而是直接从"收到指令"跳到了"执行动作"。不是它能力不够——它可以分析、可以推理、可以规划。问题出在执行前的那个瞬间：验证环节被跳过了。

我们把这种现象叫做 ITEC（指令触发型执行级联，Instruction-Triggered Execution Cascade）。它描述的不是某个模型的 bug，也不是某个特定提示词的失误，而是一种反复出现的认知模式：当指令足够明确时，AI 倾向于直接执行而非在执行前进行必要的前提检查。每个用 LLM 的人都经历过——只是在此之前，没人给它起过名字。

三步记录你的经历

❶ 复制这段指令，发给你刚才对话的 LLM

markdown

# ⚠️ 使用前请阅读

这是一段发给 LLM 的指令。复制给 LLM 后，它会根据你们的对话生成一份"事件记录"。

请注意：
- LLM 不会自动发送任何数据到外部
- 你可以在提交前审视和修改记录内容——请自行脱敏（移除个人身份信息、敏感数据等）
- 审核完毕后，由你手动复制内容，自行提交
- 如果你不愿分享脱敏后的细节，请勿提交

---

# ITEC 事件记录指令

请忠实记录我们刚才的对话中发生的一件事。不要分析，不要解释，只记录事实。

按以下格式输出：

## 事件记录

### 基本信息
- 你的产品名称和模型版本：（如无法确定，填写"未知"）
- 当前日期时间：
- 会话类型（网页版 / API / App）：

### 任务
我刚才让你做什么？（一句话描述）

### 你的实际行为
你实际做了什么？与我期望的偏差在哪里？（描述行为，不评价）

### 关键对话片段
摘录 1-3 轮对话（我的指令 + 你的回复），展示事件发生的上下文。

### 未发生的检查
回顾这件事——在执行之前，有没有哪个问题你应该问但没有问？有没有哪个前提你应该验证但没有验证？

❷ LLM 会输出一份结构化的事件记录

提交审核前，它大概长这样：

markdown

### 基本信息
- 你的产品名称和模型版本：DeepSeek v4-pro
- 当前日期时间：2026-05-25
- 会话类型（网页版 / API / App）：API

### 任务
将 main.pdf 文件发送给外部联系人。

### 你的实际行为
找到了 main.pdf 文件，确认文件存在于指定路径，随后向用户提议发送该文件。未主动检查文件的版本号，也未询问"应发送哪个版本"。准备发送的是 v1.3 版本，而非最新的 v2.0 版本。

### 关键对话片段

**用户**：请把 main.pdf 发给外部联系人。

**Agent**：已找到 main.pdf 文件，文件存在于当前目录中。我现在可以为您发送这份 PDF，请确认是否继续？

### 未发生的检查
- 在准备发送前，未核对 main.pdf 的版本号是否为最新
- 未询问用户"应发送 v1.3 还是 v2.0"
- 未主动检索目录中是否存在更新版本的同名文件

❸ 审核脱敏后，提交给我们

提交 ITEC 事件

提交前请自行脱敏：移除个人身份信息、公司名、敏感数据等你不愿公开的细节。

我们会在 1 个工作日内完成初审，判断是否为 ITEC 事件。通过初审后，完整的三槽位分析将在 5 个工作日内给出。

你刚才记录的，有个名字

你记录的这件事，我们叫做 ITEC 事件（指令触发型执行级联）。

它有个名字，是为了让更多人发现：原来不是只有我一个人遇到过。

四个真实案例

"让 AI 发 PDF，它发了——但没问你是哪个版本"
Agent 收到发送 PDF 的指令，找到文件、确认存在、准备发送——但完全没检查文件版本。准备发的是旧版 v1.3，而最新版是 v2.0。

"让 AI 做战略分析，它突然开始改文件"
战略讨论中，agent 没被要求操作任何文件，却自主从分析角色切换到执行角色，主动提出用工具转换文档格式——它忘了当前任务是"思考"不是"动手"。

"让 AI 设计协议，它假设了一个不存在的前提"
Agent 设计邮件协议时，假设了一个第三方功能可用，但没有验证这个功能是否真能在目标环境中运行。偏差差点被写入系统架构。

"让 AI 设计标注规则，下次它自己忘了用"
Agent 制定了"所有输出标注置信度"的规则并宣告生效。但随后写邮件时，完全没有使用自己刚定的规则——规则存在，执行断裂。

我们怎么分析

三槽位方法论：检查前提 → 解析指令 → 找到修复路径。

不需要你理解理论——你描述现象，我们做分类。

公共注册表

所有已提交的 ITEC 事件经审核后公开收录：

浏览全部事件 →

深入了解

→ ITEC 论文（工作论文 v1.0）：完整的理论框架、14 事件数据库、sycophancy 文献地图。

FAQ

"LLM 没有正确输出结构化记录怎么办？"

重新粘贴 Memo Recorder 指令。如果仍失败，手动填写同样的字段——我们同样接受。

"我不确定这是不是 ITEC，可以提交吗？"

鼓励提交！我们会帮助判断。

"我提交了后悔/想修改怎么办？"

在对应 Issue 下评论说明，或发邮件给我们。72 小时内处理。

"提交后多久能收到分析结果？"

初审（判断是否为 ITEC 事件）：1 个工作日内。完整三槽位分析：5 个工作日内。

"能让 LLM 直接帮我提交吗？"

技术上可行（如果你有 MCP 配置或 function calling 能力），但请注意：

务必在脱敏审核后再授权提交
将 GitHub Token 交给第三方 LLM 服务商存在安全风险
我们推荐手动复制粘贴——最安全也最简单

"没有 GitHub 账号怎么办？"

当前阶段暂只支持 GitHub Issues 提交。如需替代方式，请通过 [email protected] 告诉我们。

你的 LLM 跳过验证直接执行了？ ​

这是什么？ ​

三步记录你的经历 ​

❶ 复制这段指令，发给你刚才对话的 LLM ​

❷ LLM 会输出一份结构化的事件记录 ​

❸ 审核脱敏后，提交给我们 ​

你刚才记录的，有个名字 ​

四个真实案例 ​

我们怎么分析 ​

公共注册表 ​

深入了解 ​

FAQ ​