LLM 竞争格局 · 信念追踪器 v5

从"谁的模型最强"到"谁控制了价值链的哪个环节"。

v5 升级：引入四层价值链模型和中国 Agent 生态深度分析。v4 是初始先验（2026-05-19），v5 是第一次正式后验（2026-06-09），2026-06-11 基线重估（基于 Kimi 42 条全量信号扫描修正系统性低估）。

📖 阅读指引：3 分钟速览 → 阅读「四层价值链」+「概率变化总表」| 10 分钟深度 → 阅读 8 张情景追踪卡 | 完整研读 → v5 完整报告（~620 行，含完整证据链和数据溯源）

证据等级

我们为所有关键判断标注证据强度，让读者知道哪些是"有数据支撑的"、哪些是"推演中的"：

L1 框架推演	L2 类比外推	L3 单点信号	L4 模式确认	L5 因果验证
纯逻辑推理	其他领域迁移	单一事件支撑	多信号收敛	因果证明
最不确定				极罕见

大部分判断停留在 L3-L4。我们诚实地标注 L1 判断——欢迎被未来证据修正。

一、分析框架：四层价值链

模型不是独立竞争的。谁控制了算力供应链？谁锁定了开发者生态？谁掌握了用户入口？这些力量配置着模型竞争的边界条件。

第四层：终端产品/入口层 — 用户直接交互的 Agent 产品
   ↕  豆包（抖音2.3亿MAU）、元宝（微信1.14亿MAU）、通义千问、文心一言
第三层：平台/工具层 — Agent 开发、编排、分发的基础设施
   ↕  Coze（字节闭环）、Dify（开源20K+ Stars）、MaxKB（100万+安装）
第二层：模型/基础设施层 — 大模型底座 + API 服务
   ↕  Kimi K2.6、GLM-5.1、DeepSeek V4-Pro、Qwen3.7-Max
第一层：硬件/算力层 — 训练与推理的物理基础
     NVIDIA（受限）vs 华为昇腾（国产替代）vs 端侧芯片

层间关系：下层支撑上层，上层依赖下层。层与层之间是供给关系，不是竞争关系。同层之间才是竞争关系。

每层按 C 端（消费者）和 B 端（企业）双轴分析。

二、逐层关键发现

算力层

GLM-5.1 基于 100,000 张华为昇腾 910B 完成训练——旗舰模型首次实现"零 NVIDIA"。（L4·模式确认）

但推理层存量 CUDA 生态的迁移成本远高于训练层。算力脱钩在训练层已不可逆，在推理层仍存缓冲。

模型层（中国）

开源三强（Kimi K2.6 / GLM-5.1 / DeepSeek V4-Pro）在编码和数学维度已逼近海外前沿——差距从"代际"压缩至"百分点"。（L4·模式确认）

DeepSeek 的 0.02 元/M token 定价重新定义了模型层单位经济基准——API 商品化拐点已触发。（L4·模式确认）

社会型直觉（读人/判断可信度）对所有模型仍然"结构性不可达"——这不是性能差距，是具身性缺口。模型层权力向上传导存在硬天花板。（L1·框架推演）

平台/工具层

MCP（97M 月下载，10K+ 服务器）已赢下模型-工具层标准化。平台的"100+ 插件"不再是差异化壁垒。（L4·模式确认）

Coze 3.0 的"开发即分发"闭环验证了"平台层入口一体化"趋势。纯工具型平台面临被超级 App 截流的风险。（L3·单点信号）

终端/入口层

C 端已形成豆包/元宝双头格局（MAU 均破亿）。入口类型的 Agent 分发效率排序：微信（社交信任传递）> 抖音（内容沉浸）> 淘宝（交易场景）> 百度搜索（检索→委托行为跨越）。（L3→L2）

退化风险与入口强度正相关：微信生态中 12 亿用户的社会判断若被 Agent 中介，退化规模史无前例。（L1·框架推演——当前的核心理论假设，等待经验验证）

手机厂商拥有"零层入口"（系统级语音助手），但模型短板是硬约束。若与 Kimi/DeepSeek 合作，可能打破双头格局——但障碍在商业而非技术。（L1·框架推演）

三、8 情景信念追踪

这 8 个情景来源于 v4 分析框架（2026-05-19），是我们的初始先验。v5 将每个情景重新理解为"四层价值链上的应力分布"，基于新观测更新后验概率。

情景 ① 混合常态演进（35%，不变）→ 基线重估：28%（-7pp）

各方在现有框架内渐进竞争。全量信号显示多方向结构性压力（寡头化、退化、价格战、脱钩）正在压缩"渐进竞争"叙事空间。

情景 ② 智力民主化加速（30% → 32% → 基线重估：30%）

开源模型追平闭源，API 成本趋零。下调反映一个对冲力量：开源扩散在发生（GLM-5.1 MIT、DeepSeek 降价），但入口集中度也在加深（ChatGPT 9亿周活、豆包/元宝双头）——开源能力 ≠ 去中心化市场。

驱动力：感知型趋同（L4）+ DeepSeek 价格锚定（L4）+ MCP/A2A 降低互操作成本（L4）

价值链应力：模型层 ████████░░ → 平台层 ████░░░░░░ → 终端层 ████░░░░░░

情景 ③ Agent 共生（20% → 22% → 基线重估：18%）

Agent 嵌入工作流，人类保持判断。近期部署数据（Q1 科技裁员 78,557 人/47.9% AI 归因）指向"替代"而非"共生"。共生基础设施在建设（MCP/A2A/ACS），但短期部署向替代倾斜。

驱动力：协议层标准化推动"人优先"从定制开发变为协议兼容（L3→L4）+ 退化警告倒逼共生（L1）

价值链应力：终端层 ████████░░（用户行为转变）→ 平台层 ██████░░░░（治理工具需求）

情景 ③B 构成性退化暴露（18% → 16% → 基线重估：22%）

Agent 灾难暴露人类退化 → 监管急刹车。上调反映退化证据已从"叙事"升级为"量化事实"——Q1 科技裁员 78,557 人/47.9% AI 归因（L4），三名 CEO 公开确认 AI 驱动的结构性裁员。

为什么下调：ACS + EC-Council + ServiceNow 48h 同步涌现（L4）+ Databricks/Google MCP 平台层治理接入（L3）——治理基建在灾难发生前建立。

为什么只降 2pp：治理拦截 Agent 行为，不拦截人类认知外包。退化的底层动力学不受影响。（L1）

价值链应力：终端层 ██████████（退化主战场）→ 平台层 ██████░░░░（治理能否拦截灾难）

情景 ④ 智力质变飞跃（10%，不变）→ 基线重估：7%（-3pp）

训练范式突破。窗口期已过 2 个月，无任何非 Transformer 旗舰模型出现。概率自然收缩。

情景 ⑤ Agent 寡头化（8% → 12% → 基线重估：20%）

超级 App 入口控制 Agent 分发。上调反映全球入口集中度远超此前评估——ChatGPT 9 亿周活/50M 付费 + 豆包 3.15 亿 MAU/元宝嵌入微信 + DeepSeek $70 亿融资集中化 + Meta Llama 4 Behemoth 发布逾 1 年仍缺席。寡头化不是"可能发生"——是"已形成，正在加深"。

驱动力：豆包 2.3亿 + 元宝 1.14亿双头格局（L4）+ Coze 3.0 "开发即分发"闭环（L3）+ 手机厂商合作障碍在商业（L1）

价值链应力：终端层 ██████████（入口集中）→ 平台层 ████████░░（生态锁定）→ 模型层 ████░░░░░░（闭源大厂用入口反哺模型）

情景 ⑥ 地缘技术脱钩（5%，不变）→ 基线重估：10%（+5pp）

中美 AI 生态分裂。上调反映脱钩在工程层快于政策层——DeepSeek V4 全链路弃 NVIDIA 切换华为昇腾（L3，待官方确认）、华为 950PR 量产/160 万片目标、GLM-5.1 零 NVIDIA 训练已确认。

情景 ⑦ 价格战挤压利润（10%→ 12%→ 15% → 基线重估：20%）

API 定价锚定成本线。上调反映价格战从 DeepSeek 单边降价升级为行业均衡——腾讯云跟进 ¥0.02/M + DeepSeek $70 亿战争融资 = 模型 API 商品化已成市场结构而非短暂策略。

驱动力：DeepSeek 0.02 元/M 定义新基准（L4）+ 感知型趋同压缩差异化（L4）+ API 商品化拐点信号（L3）

价值链应力：模型层 ██████████（价格锚定）→ 平台层 ████░░░░░░（利好平台）→ 算力层 ██░░░░░░░░（倒逼自研芯片）

情景 ⑧ 未知的未知（2%，不变）

四、三线程竞速

v4 提出"中空期"隐喻——Agent 能力在上升，人类能力在下降。v5 新增第三条线程：

线程	方向	状态
Agent 能力	↑ 上升	感知型趋近前沿（L4），超级 App 使 Agent 触达 10 亿级用户
人类能力	↓ 下降	静默进行（L1），入口越强退化越深——微信 12 亿用户的社会判断外包
治理能力	↑ 上升	最晚出发但加速最快（L4）。但 Fable 5 国籍锁（6/2026）揭示实际治理方向偏向主权控制（国籍验证、强制数据保留）而非用户保护——治理在加速，方向在偏移

核心不确定性：三个线程的相对速率。新增不确定性：治理线程的方向偏移——主权治理能阻止跨国 Agent 事故，但不能阻止退化本身的静默累积。

五、与 v4 的关系

本页面是 v5 信念追踪器（2026-06-09）。v4 竞争格局页面（2026-05-19）是我们的初始先验——它以模型层竞争为轴心，给出了 8 个情景的首次概率估计。

两个版本并存。v4 不会被 v5 取代——读者可以比较我们的判断如何随时间演进。这正是贝叶斯更新框架的意义：不是"修正错误"，是"基于新证据更新信念"。

v5 相对于 v4 的主要变化：从单层（模型）扩展为四层价值链分析；情景⑤（寡头化）和⑦（价格战）概率显著上调；引入证据等级体系（L1-L5）使判断的可追溯性显式化。

📄 完整报告含详细方法论、数据溯源、层间传导分析和已知盲区声明。见 v5 完整报告。

本页面内容基于 2026 年 4-6 月初公开数据，有效期约 4-6 周。所有概率为方向性判断，不构成投资建议。数据缺口已显式标注。CC BY 4.0 · Co-Cognition Lab · 谦逊、可追溯、开源

LLM 竞争格局 · 信念追踪器 v5 ​

证据等级 ​

一、分析框架：四层价值链 ​

二、逐层关键发现 ​

算力层 ​

模型层（中国） ​

平台/工具层 ​

终端/入口层 ​

三、8 情景信念追踪 ​

情景 ① 混合常态演进（35%，不变）→ 基线重估：28%（-7pp） ​

情景 ② 智力民主化加速（30% → 32% → 基线重估：30%） ​

情景 ③ Agent 共生（20% → 22% → 基线重估：18%） ​

情景 ③B 构成性退化暴露（18% → 16% → 基线重估：22%） ​

情景 ④ 智力质变飞跃（10%，不变）→ 基线重估：7%（-3pp） ​

情景 ⑤ Agent 寡头化（8% → 12% → 基线重估：20%） ​

情景 ⑥ 地缘技术脱钩（5%，不变）→ 基线重估：10%（+5pp） ​

情景 ⑦ 价格战挤压利润（10%→ 12%→ 15% → 基线重估：20%） ​

情景 ⑧ 未知的未知（2%，不变） ​

四、三线程竞速 ​

五、与 v4 的关系 ​