贾扬清出走英伟达：7亿美元收购一年即决裂，AI Infra创业的开源理想撞上商业铜墙

Dawn Vision 编辑部 2026.06.30 约 10 分钟阅读 Issue 005

7亿美元。

这是2025年4月黄仁勋为收购LeptonAI开出的价码。一个只有20个人的创业公司，人均收购价3500万美元——在当时被传为AI Infra领域的天价收购神话。LeptonAI创始人贾扬清，这位Caffe框架的缔造者、TensorFlow的核心作者、前阿里云VP，带着团队和光环进入英伟达，出任系统软件副总裁。

1年零2个月后，神话碎了。

6月29日，半导体研究机构SemiAnalysis的一条推文在AI圈炸开：贾扬清已经从英伟达离职。消息传出当天，LeptonAI的开源社区页面访问量暴涨400%，开发者们涌入GitHub查看当初承诺开源的模型权重——什么都没有。那个被英伟达官方宣传为"将改变AI推理格局"的200亿参数开源模型，始终没有露面。核心产品DGX Lepton在英伟达的产品矩阵中几乎隐身，没有成为预期中的AI Infra标杆。

据多方信源透露，黄仁勋对LeptonAI的运营效果不满已久。收购时承诺的"保持独立运营+开源路线"在英伟达庞大的商业机器中逐渐被消解，贾扬清的开源信仰与英伟达闭源生态的商业逻辑之间的矛盾，最终到了不可调和的地步。

这不是一个人的离职故事。这是过去两年AI Infra创业浪潮的一个缩影——当所有创业者都在做"AI基础设施"，真正赚到钱的只有卖铲子的人。

被寄予厚望的7亿美元：为什么是LeptonAI

要理解这次收购为什么在当时引发轰动，需要先理解贾扬清在AI圈的地位。

贾扬清是框架时代的开创者之一。2013年在UC Berkeley读博期间，他写出了Caffe——那个开启了深度学习框架时代的开源项目。毕业后加入Google Brain，成为TensorFlow的核心作者之一。之后转战Facebook，领导Caffe2和PyTorch 1.0的开发。2019年回国加入阿里巴巴，出任阿里云智能事业群副总裁，负责AI平台和大数据计算。

2023年，他离开阿里创立LeptonAI，定位是"AI原生基础设施"——用云原生的方式做大模型推理和部署。在当时的AI Infra赛道上，LeptonAI不是融资最多的，也不是声量最大的，但它的团队配置堪称豪华：20人左右的核心团队几乎全是来自Google、Meta、阿里的资深基础设施工程师。

英伟达为什么愿意花7亿美元买一个20人的公司？表面原因是LeptonAI在推理优化和模型服务上的技术积累，但更深层的原因是英伟达需要在软件层加固自己的护城河。

2025年初，英伟达正面临一个微妙的时刻：硬件层面，AMD MI400系列开始在训练场景抢单，Google TPU v6在自家数据中心里跑满负荷，亚马逊Trainium2部署规模超10万芯片；软件层面，PyTorch虽然仍是主流，但各种推理引擎（vLLM、TensorRT-LLM、SGLang）百花齐放，英伟达对软件栈的控制力正在被稀释。LeptonAI的模型服务能力如果整合进DGX产品线，可以让英伟达的"硬件+软件"捆绑更紧。

而且贾扬清身上有英伟达最看重的一个标签：开源社区号召力。英伟达需要一个在开源社区有足够声望的人来弥合其商业闭源策略与开源社区之间的裂痕。收购时，英伟达官方明确表态：LeptonAI的开源项目将继续维护，承诺开源的200亿参数模型将按计划发布。

这个承诺，成了后来最大的争议点。

"英伟达收购LeptonAI的时候，大家以为这是开源的胜利。现在才发现，这是开源被收编的开始。" —— 一位不愿具名的AI Infra创业者

一年之痒：开源承诺如何被商业机器吞噬

被收购后的LeptonAI，经历了典型的大公司整合综合征。

首先是战略方向的偏移。贾扬清原本的计划是：以LeptonAI的推理平台为基础，构建一个跨硬件的中立模型服务层——类似AI时代的Nginx，不绑定任何芯片厂商。但进入英伟达后，这个定位与公司"卖更多DGX"的核心目标产生了根本冲突。你不能一边卖DGX，一边做一个让客户在AMD/Google芯片上也能跑同样好的中立平台。

DGX Lepton的产品化走得异常艰难。据前员工透露，团队花了大量时间适配英伟达最新的硬件和CUDA版本，但对非英伟达硬件的支持被反复延后。那个承诺开源的200亿参数模型，在内部优先级不断被下调——因为一个真正开源、能在多种芯片上高效运行的模型，对英伟达的硬件绑定策略未必是好事。

其次是人才和文化的冲突。LeptonAI的团队是典型的开源文化：快速迭代、公开讨论、社区驱动。而英伟达是一家以销售为导向的硬件公司，决策链条长，保密文化极强，对外发布任何开源项目都需要层层法务审批。一位加入英伟达的前LeptonAI工程师私下吐槽："在Lepton时我们每周发布，在这里一个release note要走六周审批。"

但最核心的矛盾，还是开源与闭源的根本分歧。

英伟达的商业模型建立在CUDA生态的锁定效应上——开发者用CUDA写代码，就离不开英伟达的GPU。它的软件栈越开放，硬件锁定效应反而越强（因为更多人用），但真正底层的性能优化和硬件细节，英伟达是绝对不会开源的。贾扬清的开源理想——让AI基础设施更普惠、更中立——在这个商业逻辑里找不到位置。

这不是英伟达的错，也不是贾扬清的错。这是两种根本不同的商业哲学之间的冲突：一个相信开放生态能把蛋糕做大，一个相信垂直整合能把利润做高。在AI算力供不应求的2025-2026年，后者显然更有话语权。

不只是贾扬清：AI Infra创业的集体困境

把视角从贾扬清个人拉到整个AI Infra赛道，你会发现他的困境不是个例。

过去两年，AI Infra是融资最热的赛道之一。推理优化、模型部署、向量数据库、Agent编排、特征平台、LLM网关……每个细分领域都挤进来几十家创业公司。但走到2026年中，一个残酷的现实浮现：绝大多数AI Infra公司都没有找到可持续的商业模式。

原因很简单：AI Infra的付费方主要是大模型公司和云厂商，而这两类客户都在自己做基础设施。

OpenAI在自研芯片Jalapeño——9个月完成流片，与Broadcom合作，计划年底规模化部署，直接挑战英伟达的推理市场。Google、Microsoft、Amazon、Meta甚至SpaceX都在走自研芯片的路线。从OpenAI到SpaceX，大科技公司集体"去英伟达化"，这已经不是秘密。大模型公司方面，Anthropic构建了自己的推理引擎和部署栈，DeepSeek从成立第一天起就自己做推理优化，字节、阿里、百度全都有自己的Infra团队。

当你的潜在客户都在自己做你做的东西时，你卖给谁？

向量数据库是一个典型例子。2023-2024年，几十家向量数据库公司拿了融资，但到2026年，PostgreSQL的pgvector扩展已经能满足80%的使用场景，各大云厂商（AWS、GCP、阿里云）都把向量搜索作为数据库的标配功能。独立向量数据库公司的生存空间被急剧压缩。

Agent编排框架也是如此。LangChain曾经是这个赛道的明星，但2026年开发者越来越倾向于直接用模型原生的function calling和各大平台自带的Agent工具。AWS推出开源框架Blocks，GitLab 19.0把Agentic AI嵌入合并请求和供应链安全，苹果推出Core AI框架为自研芯片优化端侧AI——当平台方把Agent能力做进基础设施，中间层的创业公司就被架空了。

被收购之外，AI Infra创业者还有出路吗

贾扬清的结局容易给人一种错觉：AI Infra创业的终点就是被大公司收购然后被同化。但事实并非如此。

2026年跑出来的AI Infra公司，走的是完全不同的路。

一类是"深度垂直"。它们不做通用平台，而是扎进某个具体行业的AI基础设施。比如医疗AI的推理合规平台、金融AI的实时决策引擎、制造业AI的边缘部署方案。这些领域的门槛不在技术有多先进，而在对行业know-how的理解和合规认证的积累——这些是大公司不愿意做也做不好的。

另一类是"开源社区+商业服务"。它们不是靠卖软件许可证赚钱，而是靠开源项目建立社区和标准，然后通过企业版、托管服务、技术支持变现。Hugging Face是这个模式的代表，但它的挑战在于如何在巨头环伺下保持独立性。更小众的例子包括一些做AI可观测性和AI安全的创业公司，它们通过开源工具建立开发者心智，再向企业销售合规和治理方案。

第三类是"反方向下注"。当所有人都在做"让大模型跑得更快"的基础设施时，一些创业者开始做"让大模型更省"的工具——模型压缩、边缘推理、国产芯片适配、混合精度调度。在算力成本持续上涨的背景下（Kimi B端负责人黄震昕坦言"所有模型厂商都在涨价，核心原因是算力成本上涨"），帮客户省钱的工具比帮客户花钱的工具更有生命力。

"AI Infra的黄金时代不是做平台的时代，而是做螺丝的时代。你不需要成为下一个英伟达，你只需要成为某一颗不可替代的螺丝。" —— 一位连续成功退出的AI创业者在内部交流中的判断

框架一代的退场与Agent一代的登场

贾扬清的离开，也标志着一个时代的结束。

他是"框架一代"的代表人物——Caffe、TensorFlow、PyTorch这一代深度学习框架，奠定了今天AI发展的基础。那一代工程师相信开源的力量，相信好的技术标准能统一生态，相信"让更多人用上好工具"是技术人的使命。

但AI竞争已经进入了一个新阶段。模型能力越来越强，框架的抽象层越来越高，大多数开发者不再需要理解底层的CUDA kernel或分布式训练细节。Agent时代的开发者关心的不是"怎么让模型跑快5%"，而是"怎么让Agent可靠地完成任务"。基础设施正在从"面向模型开发者"转向"面向Agent构建者"。

这种转变从近期的产品发布中可以看得很清楚：AWS的Blocks是面向Agent的后端框架，Herdr是终端里的Agent多路复用器，BrowserBC让人类一次点击就能教会所有Agent操作网页，Lore让coding agent记住团队的决策历史。这些工具的目标用户不是训练模型的工程师，而是构建Agent应用的开发者。

框架一代完成了他们的历史使命——把深度学习从实验室带到了产业界。但AI基础设施的故事不会停在这里。贾扬清的下一站还没有公布，但可以确定的是，像他这样的基础设施天才不会离开这个领域太久。

7亿美元的收购不算失败，但它确实没有达到任何一方的预期。英伟达没有得到期望中的开源社区影响力和软件生态加固，贾扬清没有实现他的开源普惠理想，LeptonAI的产品没有在英伟达体系中大放异彩。这是一个三输的结局，但也是一个有价值的教训：在AI这个赢家通吃的市场里，独立的基础设施公司如果不能建立不可替代的纵深，被收购不是终点，而是消解的开始。

对于正在AI Infra赛道上的创业者来说，贾扬清的故事是一面镜子。它照出了一个残酷的真相：在这个算力为王的时代，光有技术理想主义是不够的。你要么找到一个大公司不愿意做、也做不好的细分领域扎下去，要么建立足够强大的社区和生态让自己无法被轻易收购和同化，要么——你就得接受被整合然后被同化的命运。

这不是悲观，这是现实。

"英伟达收购LeptonAI的时候，大家以为这是开源的胜利。现在才发现，这是开源被收编的开始。" —— 一位不愿具名的AI Infra创业者

明天见。

创刊号下一篇 →

Sources · 参考来源

声明：本文为 Dawn Vision 基于公开信息的二次创作与独立分析，标题、观点、行文均为原创，仅供参考，不构成任何投资建议或决策依据。如有侵权请联系删除。

本文基于 Dawn Vision 认知引擎处理的 10 个源信号自动生成，经编辑部人工审核。素材来源：SemiAnalysis爆料、InfoQ/头条报道、TechCrunch芯片自研分析、AWS/GitLab产品发布信息。

相关入库笔记：贾扬清离职英伟达 · LeptonAI 7亿美元收购 · AI Infra创业困境 · 开源vs闭源 · 大公司收购整合 · 自研芯片趋势 · Agent基础设施兴起 · 框架时代结束