OpenAI的Jalapeño：当模型开始定义芯片 | Dawn Vision

Dawn Vision 编辑部 2026.06.25 约 9 分钟阅读 Issue 002

北京时间 6 月 25 日，OpenAI 联合博通正式发布了首款定制 AI 推理芯片——Jalapeño（墨西哥辣椒）。

从立项到流片仅 9 个月，刷新了高性能 ASIC 的开发周期纪录。要知道，这个行业通常需要 18-24 个月。博通 CEO 陈福阳在发布会上宣称，这颗芯片比传统 GPU 节省约 50% 推理成本、功耗降低约 30%，工程样品已经在实验室里稳定跑着 GPT-5.3-Codex-Spark。

听起来很美好。但资本市场的反应耐人寻味：消息发布当天，博通股价仅涨 1.6%。

要知道，2025 年双方签约的消息传出时，博通当天涨了 15%。这 1.6% 的涨幅，更像是一种礼貌性的鼓掌——"挺好的，然后呢？"

辣椒很辣，但谁来买单？

核心问题悬而未决：钱。

首阶段 1.3 吉瓦产能的芯片生产成本约 180 亿美元。博通的态度很明确：微软得先承诺采购 40%，否则融资不启动。微软呢？至今没有点头。

这不是一笔小账。OpenAI 自己预测，到 2029 年运营烧钱将超过 2000 亿美元。与此同时，他们还在推进 5000 亿美元的 Stargate 超级数据中心项目。一颗 Jalapeño 只是开胃菜，后面的满汉全席才是真正的账单。

"芯片行业有句老话：设计一颗芯片不难，难的是让别人为它买单。" —— 半导体行业观察者

理解这背后的博弈，需要回到一个更本质的问题：为什么 AI 公司突然开始自己做芯片了？

从"用芯片"到"定义芯片"：范式正在转移

过去三十年，芯片行业的逻辑是"芯片定义软件"——英特尔造出更快的 CPU，微软和开发者们再想办法把这些算力用起来。英伟达造出更强的 GPU，AI 实验室再围绕 CUDA 生态构建模型。

但 2026 年的今天，这个逻辑正在反转。

大模型的运算模式高度结构化、高度可预测：大量的矩阵乘法、固定的注意力机制、规律的内存访问模式。当你知道自己要跑什么 workload，通用 GPU 的很多设计就变成了浪费——就像你明知道每天只走同一条路上班，却非要开一辆全地形越野车。

于是"模型定义芯片"成为可能：AI 公司比任何人都清楚自己的模型需要什么样的硬件，他们可以反过来设计芯片——去掉不需要的电路，优化关键路径，为 Transformer 架构量身定制计算单元。

Jalapeño 不是第一个吃螃蟹的。谷歌 TPU 已经走了 13 年，亚马逊 Trainium/Inferentia 也迭代到了第三代，微软的 Athena、Meta 的 MTIA 都在推进中。但 OpenAI 的特殊之处在于：它是第一个真正意义上"模型公司"做芯片——它不卖云服务，不做广告，它的全部收入和未来都押注在模型本身。

这形成了一个诱人的飞轮：AI 设计芯片 → 芯片运行 AI → AI 变强 → 设计下一代芯片。理论上，这个飞轮一旦转起来，英伟达的 GPU 霸权将被釜底抽薪。

但飞轮转起来之前，你得先推第一把

理论很美，现实很骨感。

谷歌 TPU 走了 13 年，至今谷歌云仍然在大量采购英伟达 GPU。为什么？因为自研芯片的容错空间太小了。

英伟达的 CUDA 生态花了二十年构建，数百万开发者、数不清的软件库、成熟的工具链——这不是"芯片快 50%"就能轻易替代的。而且 GPU 是通用的：今天跑大模型，明天可以跑物理仿真，后天可以渲染电影。但 ASIC 是为特定 workload 定制的，如果模型架构变了呢？

想想看：2023 年大家都在堆稠密 Transformer，2024 年 MoE 成为主流，2025 年状态空间模型异军突起，2026 年的今天谁也说不清下一代架构是什么。一颗从设计到量产需要 18 个月的芯片，面对的是一个每 6 个月就可能颠覆自己的行业。

这就是 Jalapeño 面临的悖论：它为 GPT 架构优化，但如果 GPT-6 采用了完全不同的架构怎么办？这 180 亿美元的投入会不会变成下一个 Itanium？

更微妙的是 OpenAI 和微软的关系。微软是 OpenAI 最大的投资者、最大的云服务商、最重要的分销渠道。但现在 OpenAI 要自己做芯片，本质上是在减少对英伟达的依赖，也是在减少对 Azure 的依赖——微软不可能看不透这一点。

"你要我花 70 多亿美元买你的芯片，来削弱我自己的云业务竞争力？"——微软的犹豫完全可以理解。

真正的信号：不是芯片，是控制权

但 Jalapeño 的意义，可能远不止于一颗芯片本身。

2026 年的 AI 行业正在进入一个新阶段：模型能力的差距在缩小，但基础设施的控制力在分化。谁掌握了算力，谁就掌握了模型迭代的速度；谁掌握了芯片，谁就掌握了算力的成本曲线。

OpenAI 不是在和英伟达竞争，它是在争夺自己命运的控制权。如果推理成本不能持续下降，Agent 时代的大规模商用就永远是 PPT 上的故事——你不可能让每个用户都花 20 美元/月来供养一个需要昂贵 GPU 才能运行的 Agent。

50% 的成本下降意味着什么？意味着原本需要 100 亿美元算力才能支撑的产品，现在只需要 50 亿。意味着 Agent 从"高端玩具"变成"大众工具"的临界点，可能因为这一颗芯片而提前到来。

这也是为什么资本市场虽然反应冷淡，但没有人敢真正看空。大家都在等一个信号：微软会不会签那张 70 亿美元的采购单。

签了，飞轮启动，AI 行业的成本曲线将被重新定义。不签，Jalapeño 可能就是另一颗耀眼但短暂的流星——就像过去十年里无数诞生于发布会、消失于量产线的"芯片颠覆者"一样。

辣椒入菜，还需时日

Jalapeño 发布后的 24 小时，AI 圈的讨论已经从"芯片性能"转向了"商业可行性"。这本身就是一个信号：AI 硬件正在从"技术叙事"进入"商业叙事"阶段。

9 个月流片确实是工程奇迹，成本减半确实足够诱人，功耗降低确实是数据中心运营商梦寐以求的。但半导体行业从来不缺奇迹，缺的是能持续赚钱的奇迹。

对于普通从业者和观察者来说，Jalapeño 真正值得关注的不是参数，而是时间线：如果一切顺利，这颗芯片将在 2027 年量产，2028 年大规模部署。那时候，GPT-6 可能已经发布，Agent 可能已经成为主流交互方式，AI 的竞争格局可能已经完全不同。

但无论如何，一个趋势已经清晰：AI 公司正在向上游延伸，从模型到芯片到数据中心，垂直整合正在成为头部玩家的标配。就像特斯拉不满足于买车、还要造电池、还要做自动驾驶芯片一样，OpenAI 也在构建自己的垂直帝国。

墨西哥辣椒很辣，但能不能辣到英伟达嘴里，还要看微软愿不愿意当这个"第一个吃辣椒的人"。

明天见。

← 返回文章列表下一篇 →

Sources · 参考来源

声明：本文为 Dawn Vision 基于公开信息的二次创作与独立分析，标题、观点、行文均为原创，仅供参考，不构成任何投资建议或决策依据。如有侵权请联系删除。

本文基于 Dawn Vision 认知引擎处理的 11 个源信号自动生成，经编辑部人工审核。素材来源包括：OpenAI Jalapeño 发布会信息、博通财报分析、半导体行业研报、微软采购动态、Stargate 项目追踪。

相关入库笔记：AI 芯片自研潮全景 · 谷歌 TPU 十三年启示录 · 英伟达 CUDA 护城河解析 · OpenAI 垂直整合战略

OpenAI 的Jalapeño

辣椒很辣，但谁来买单？

从"用芯片"到"定义芯片"：范式正在转移

但飞轮转起来之前，你得先推第一把

真正的信号：不是芯片，是控制权

辣椒入菜，还需时日

OpenAI 的
Jalapeño