融资概况与战略意图
2026年6月,美国AI推理部署平台Baseten完成15亿美元(约101亿人民币)新一轮融资,估值飙升至130亿美元。本轮投资方阵容豪华,英伟达赫然在列——这是这家GPU霸主近年来罕见地『亲自下场』投资一家纯软件公司。Baseten过去18个月收入暴增约2000%,已成为AI推理部署赛道的隐形冠军。
此轮融资背后,英伟达的战略意图非常清晰:在OpenAI自研芯片(参考Jalapeño芯片)、Anthropic评估自研方案的背景下,英伟达需要『用资本绑定』推理部署生态中最关键的基础设施公司。
Baseten究竟做什么?
Baseten的核心业务是企业级模型部署与多GPU集群推理调度。通俗讲,它解决『AI模型怎么在生产环境跑得又快又便宜』的问题。具体包括:
1) 多模型混合部署:同一集群跑开源模型(DeepSeek/Llama/Qwen)+ 闭源API,自动路由
2) 推理优化:动态批处理、KV Cache优化、量化(FP8/INT4)、推测解码等
3) 多GPU调度:支持H100/H200/B200集群,Tensor Parallelism + Pipeline Parallelism自动化
4) 冷启动优化:从0到生产部署仅需数小时,不需要专业MLOps团队
5) 成本监控:实时显示每千Token成本,提供优化建议
为什么估值130亿美元?
Baseten的增长故事,建立在三个相互强化的趋势上:
1) 开源模型主流化:DeepSeek V4、Qwen3.7、Llama 4等开源模型在企业市场快速渗透,而企业用开源模型的最大痛点就是『部署难、调优难』
2) 推理成本优化成为核心竞争力:在『模型同质化』趋势下,推理成本成为差异化关键(参考AI大模型定价二元论)
3) 企业AI落地加速:越来越多的企业从『PoC阶段』进入『生产阶段』,对部署基础设施需求激增
对国内市场的启示
Baseten的崛起,对国内AI基础设施公司有重要启示:
- 硅基流动(参考硅基流动B轮融资)、无问芯穹、清微智能等都在做类似的事,但国内推理部署市场尚未出现『绝对龙头』
- 中国市场的『国产芯片+国产模型』组合(昇腾+DeepSeek、寒武纪+Qwen)是差异化机会
- Token Plan+推理优化可能成为下一波ToB创新(参考百度千帆Token Plan)
对开发者的实际影响
对AI开发者来说,Baseten类产品降低了『生产部署』的门槛:
- 创业公司:无需自建MLOps团队,数小时即可上线AI服务
- 企业IT:可在私有云/混合云部署,数据合规可控
- 开源项目:为开源模型提供『一键商用』路径,加速社区商业化
风险与挑战
Baseten并非没有挑战:
1) 云厂商竞争:AWS Bedrock、Azure AI Foundry、阿里云PAI都在做类似服务,价格战不可避免
2) 模型公司自建:OpenAI、Anthropic、智谱等头部模型公司在自建部署能力,留给第三方平台的空间可能被压缩
3) 开源替代:vLLM、SGLang、TGI等开源推理框架不断成熟,部分客户可能选择自建
4) 商业可持续性:收入2000%增长背后,客户集中度、续约率、毛利率等关键指标仍需观察
总结
Baseten 15亿美元融资是AI基础设施赛道分水岭事件——它标志着『AI推理部署』从『技术活』变成『大生意』。英伟达的入局,既是认可也是绑定:Baseten未来可能成为英伟达GPU在企业市场的『渠道伙伴』。
对国内AI基础设施公司来说,这是一个值得研究的样本——在『模型+芯片』垂直整合趋势下,中立第三方平台如何找到自己的生态位,是下一个十年的关键问题。
了解更多AI编程工具,可参考我们的AI编程工具并购潮与BuilderIO Agent-Native评测。