LLM 竞争格局 · 信念追踪器 v5
从"谁的模型最强"到"谁控制了价值链的哪个环节"。
v5 升级:引入四层价值链模型和中国 Agent 生态深度分析。v4 是初始先验(2026-05-19),v5 是第一次正式后验(2026-06-09),2026-06-11 基线重估(基于 Kimi 42 条全量信号扫描修正系统性低估)。
📖 阅读指引:3 分钟速览 → 阅读「四层价值链」+「概率变化总表」| 10 分钟深度 → 阅读 8 张情景追踪卡 | 完整研读 → v5 完整报告(~620 行,含完整证据链和数据溯源)
证据等级
我们为所有关键判断标注证据强度,让读者知道哪些是"有数据支撑的"、哪些是"推演中的":
| L1 框架推演 | L2 类比外推 | L3 单点信号 | L4 模式确认 | L5 因果验证 |
|---|---|---|---|---|
| 纯逻辑推理 | 其他领域迁移 | 单一事件支撑 | 多信号收敛 | 因果证明 |
| 最不确定 | 极罕见 |
大部分判断停留在 L3-L4。我们诚实地标注 L1 判断——欢迎被未来证据修正。
一、分析框架:四层价值链
模型不是独立竞争的。谁控制了算力供应链?谁锁定了开发者生态?谁掌握了用户入口?这些力量配置着模型竞争的边界条件。
第四层:终端产品/入口层 — 用户直接交互的 Agent 产品
↕ 豆包(抖音2.3亿MAU)、元宝(微信1.14亿MAU)、通义千问、文心一言
第三层:平台/工具层 — Agent 开发、编排、分发的基础设施
↕ Coze(字节闭环)、Dify(开源20K+ Stars)、MaxKB(100万+安装)
第二层:模型/基础设施层 — 大模型底座 + API 服务
↕ Kimi K2.6、GLM-5.1、DeepSeek V4-Pro、Qwen3.7-Max
第一层:硬件/算力层 — 训练与推理的物理基础
NVIDIA(受限)vs 华为昇腾(国产替代)vs 端侧芯片层间关系:下层支撑上层,上层依赖下层。层与层之间是供给关系,不是竞争关系。同层之间才是竞争关系。
每层按 C 端(消费者)和 B 端(企业)双轴分析。
二、逐层关键发现
算力层
GLM-5.1 基于 100,000 张华为昇腾 910B 完成训练——旗舰模型首次实现"零 NVIDIA"。(L4·模式确认)
但推理层存量 CUDA 生态的迁移成本远高于训练层。算力脱钩在训练层已不可逆,在推理层仍存缓冲。
模型层(中国)
开源三强(Kimi K2.6 / GLM-5.1 / DeepSeek V4-Pro)在编码和数学维度已逼近海外前沿——差距从"代际"压缩至"百分点"。(L4·模式确认)
DeepSeek 的 0.02 元/M token 定价重新定义了模型层单位经济基准——API 商品化拐点已触发。(L4·模式确认)
社会型直觉(读人/判断可信度)对所有模型仍然"结构性不可达"——这不是性能差距,是具身性缺口。模型层权力向上传导存在硬天花板。(L1·框架推演)
平台/工具层
MCP(97M 月下载,10K+ 服务器)已赢下模型-工具层标准化。平台的"100+ 插件"不再是差异化壁垒。(L4·模式确认)
Coze 3.0 的"开发即分发"闭环验证了"平台层入口一体化"趋势。纯工具型平台面临被超级 App 截流的风险。(L3·单点信号)
终端/入口层
C 端已形成豆包/元宝双头格局(MAU 均破亿)。入口类型的 Agent 分发效率排序:微信(社交信任传递)> 抖音(内容沉浸)> 淘宝(交易场景)> 百度搜索(检索→委托行为跨越)。(L3→L2)
退化风险与入口强度正相关:微信生态中 12 亿用户的社会判断若被 Agent 中介,退化规模史无前例。(L1·框架推演——当前的核心理论假设,等待经验验证)
手机厂商拥有"零层入口"(系统级语音助手),但模型短板是硬约束。若与 Kimi/DeepSeek 合作,可能打破双头格局——但障碍在商业而非技术。(L1·框架推演)
三、8 情景信念追踪
这 8 个情景来源于 v4 分析框架(2026-05-19),是我们的初始先验。v5 将每个情景重新理解为"四层价值链上的应力分布",基于新观测更新后验概率。
情景 ① 混合常态演进(35%,不变)→ 基线重估:28%(-7pp)
各方在现有框架内渐进竞争。全量信号显示多方向结构性压力(寡头化、退化、价格战、脱钩)正在压缩"渐进竞争"叙事空间。
情景 ② 智力民主化加速(30% → 32% → 基线重估:30%)
开源模型追平闭源,API 成本趋零。下调反映一个对冲力量:开源扩散在发生(GLM-5.1 MIT、DeepSeek 降价),但入口集中度也在加深(ChatGPT 9亿周活、豆包/元宝双头)——开源能力 ≠ 去中心化市场。
驱动力:感知型趋同(L4)+ DeepSeek 价格锚定(L4)+ MCP/A2A 降低互操作成本(L4)
价值链应力:模型层 ████████░░ → 平台层 ████░░░░░░ → 终端层 ████░░░░░░
情景 ③ Agent 共生(20% → 22% → 基线重估:18%)
Agent 嵌入工作流,人类保持判断。近期部署数据(Q1 科技裁员 78,557 人/47.9% AI 归因)指向"替代"而非"共生"。共生基础设施在建设(MCP/A2A/ACS),但短期部署向替代倾斜。
驱动力:协议层标准化推动"人优先"从定制开发变为协议兼容(L3→L4)+ 退化警告倒逼共生(L1)
价值链应力:终端层 ████████░░(用户行为转变)→ 平台层 ██████░░░░(治理工具需求)
情景 ③B 构成性退化暴露(18% → 16% → 基线重估:22%)
Agent 灾难暴露人类退化 → 监管急刹车。上调反映退化证据已从"叙事"升级为"量化事实"——Q1 科技裁员 78,557 人/47.9% AI 归因(L4),三名 CEO 公开确认 AI 驱动的结构性裁员。
为什么下调:ACS + EC-Council + ServiceNow 48h 同步涌现(L4)+ Databricks/Google MCP 平台层治理接入(L3)——治理基建在灾难发生前建立。
为什么只降 2pp:治理拦截 Agent 行为,不拦截人类认知外包。退化的底层动力学不受影响。(L1)
价值链应力:终端层 ██████████(退化主战场)→ 平台层 ██████░░░░(治理能否拦截灾难)
情景 ④ 智力质变飞跃(10%,不变)→ 基线重估:7%(-3pp)
训练范式突破。窗口期已过 2 个月,无任何非 Transformer 旗舰模型出现。概率自然收缩。
情景 ⑤ Agent 寡头化(8% → 12% → 基线重估:20%)
超级 App 入口控制 Agent 分发。上调反映全球入口集中度远超此前评估——ChatGPT 9 亿周活/50M 付费 + 豆包 3.15 亿 MAU/元宝嵌入微信 + DeepSeek $70 亿融资集中化 + Meta Llama 4 Behemoth 发布逾 1 年仍缺席。寡头化不是"可能发生"——是"已形成,正在加深"。
驱动力:豆包 2.3亿 + 元宝 1.14亿 双头格局(L4)+ Coze 3.0 "开发即分发"闭环(L3)+ 手机厂商合作障碍在商业(L1)
价值链应力:终端层 ██████████(入口集中)→ 平台层 ████████░░(生态锁定)→ 模型层 ████░░░░░░(闭源大厂用入口反哺模型)
情景 ⑥ 地缘技术脱钩(5%,不变)→ 基线重估:10%(+5pp)
中美 AI 生态分裂。上调反映脱钩在工程层快于政策层——DeepSeek V4 全链路弃 NVIDIA 切换华为昇腾(L3,待官方确认)、华为 950PR 量产/160 万片目标、GLM-5.1 零 NVIDIA 训练已确认。
情景 ⑦ 价格战挤压利润(10%→ 12%→ 15% → 基线重估:20%)
API 定价锚定成本线。上调反映价格战从 DeepSeek 单边降价升级为行业均衡——腾讯云跟进 ¥0.02/M + DeepSeek $70 亿战争融资 = 模型 API 商品化已成市场结构而非短暂策略。
驱动力:DeepSeek 0.02 元/M 定义新基准(L4)+ 感知型趋同压缩差异化(L4)+ API 商品化拐点信号(L3)
价值链应力:模型层 ██████████(价格锚定)→ 平台层 ████░░░░░░(利好平台)→ 算力层 ██░░░░░░░░(倒逼自研芯片)
情景 ⑧ 未知的未知(2%,不变)
四、三线程竞速
v4 提出"中空期"隐喻——Agent 能力在上升,人类能力在下降。v5 新增第三条线程:
| 线程 | 方向 | 状态 |
|---|---|---|
| Agent 能力 | ↑ 上升 | 感知型趋近前沿(L4),超级 App 使 Agent 触达 10 亿级用户 |
| 人类能力 | ↓ 下降 | 静默进行(L1),入口越强退化越深——微信 12 亿用户的社会判断外包 |
| 治理能力 | ↑ 上升 | 最晚出发但加速最快(L4)。但 Fable 5 国籍锁(6/2026)揭示实际治理方向偏向主权控制(国籍验证、强制数据保留)而非用户保护——治理在加速,方向在偏移 |
核心不确定性:三个线程的相对速率。新增不确定性:治理线程的方向偏移——主权治理能阻止跨国 Agent 事故,但不能阻止退化本身的静默累积。
五、与 v4 的关系
本页面是 v5 信念追踪器(2026-06-09)。v4 竞争格局页面(2026-05-19)是我们的初始先验——它以模型层竞争为轴心,给出了 8 个情景的首次概率估计。
两个版本并存。v4 不会被 v5 取代——读者可以比较我们的判断如何随时间演进。这正是贝叶斯更新框架的意义:不是"修正错误",是"基于新证据更新信念"。
v5 相对于 v4 的主要变化:从单层(模型)扩展为四层价值链分析;情景⑤(寡头化)和⑦(价格战)概率显著上调;引入证据等级体系(L1-L5)使判断的可追溯性显式化。
📄 完整报告含详细方法论、数据溯源、层间传导分析和已知盲区声明。见 v5 完整报告。
本页面内容基于 2026 年 4-6 月初公开数据,有效期约 4-6 周。所有概率为方向性判断,不构成投资建议。数据缺口已显式标注。CC BY 4.0 · Co-Cognition Lab · 谦逊、可追溯、开源