大模型定价二元论简介:中间层率先死亡
2026年6月,Altimeter Capital合伙人Freda Duan提出"AI定价二元论":未来只有"足够出色"和"非常便宜"两种模型能活。中间层——既不够出色也不够便宜的模型——将率先被淘汰。
这一判断正在被市场数据验证。DeepSeek V4-Pro将输入缓存命中价格压到0.025元/百万Tokens,仅为GPT-5.5的三十五分之一;而另一端,Claude Fable 5将定价直接翻倍——输入10美元、输出50美元/百万Tokens。
"便宜路线":DeepSeek引领极致性价比
DeepSeek V4-Pro/Flash
DeepSeek用开源+低价策略席卷市场:
- 输入缓存命中:0.025元/百万Tokens
- 标准输入:4元/百万Tokens
- 输出:16元/百万Tokens
- OpenRouter周调用量4.94万亿Token,全球第一
豆包2.1系列
字节用"掀桌式降价"跟进:
- 豆包2.1 Pro输入6元、输出30元/百万Tokens
- 综合成本较Claude Opus降低约80%
- 日均Token调用量180万亿
小米MiMo V2.5
小米的模型同样主打低价:
- OpenRouter调用量排名全球第二
- 定位轻量高效,适合高频调用场景
"出色路线":Claude与GPT维持高端定位
Claude Fable 5 + Opus 4.8
Anthropic坚定走高端路线:
- Fable 5输入10美元、输出50美元/百万Tokens
- Opus 4.8维持5美元/25美元定价
- Agent生态成熟、编程榜单横扫
- Anthropic估值首次超过OpenAI(9650亿vs8520亿)
GPT-5.5/5.6
OpenAI在高端市场仍占据心智:
- GPT-5.5 Pro定价维持5美元/20美元
- GPT-5.6预计降价但仍远高于中国模型
- 多模态和Agent能力全球领先
中间层为什么率先死亡
中间层模型的困境在于两端挤压:
- 上方挤压:Claude/GPT在编程、推理、Agent等高端场景持续突破,中间层无法在能力上匹配
- 下方挤压:DeepSeek/豆包在通用场景已足够好用且价格极低,中间层无法在价格上竞争
- 用户选择:高端用户选Claude/GPT(能力优先),大众用户选DeepSeek/豆包(成本优先),中间层无人选
对中国大模型市场的影响
- 豆包2.1的"掀桌式降价"加速了中间层淘汰
- 智谱GLM-5.2上线即进OpenRouter前十,但定价空间被压缩
- MiniMax M3排名第三,同样走性价比路线
- 马斯克预测中国大模型2027年Q1追平Anthropic,智谱唐杰回复"不需要那么久"
适合人群与选择指南
- 能力优先:Claude Opus/Fable(编程、推理、Agent)
- 成本优先:DeepSeek V4/豆包2.1(日常生成、批量调用)
- 混合策略:高端场景用Claude/GPT+日常场景用DeepSeek/豆包
- 创业公司:先走便宜路线验证产品,后升级出色路线提升体验
评测总结
AI定价的二元分化不是趋势预测,而是正在发生的现实。DeepSeek 0.025元的极致低价和Claude Fable 5翻倍的自信定价,两端都在加速扩张。中间层的死亡不是缓慢萎缩,而是快速坍塌。对于用户而言,好消息是选择变得更清晰——要么追求极致能力,要么追求极致性价比。了解更多AI模型对比,请访问AiVsly AI工具导航。