OpenAI芯片Jalapeño亮相，能否打破英伟达算力垄断？

转载于 2026-06-26 17:24:07 发布 · 11 阅读

OpenAI芯片Jalapeño惊艳亮相

OpenAI的芯片终于与大家见面了，只是亮相的场合有点让人意外：萨姆·奥尔特曼与博通总裁兼CEO陈福阳一起捧着一块标准的12英寸晶圆，底座上印着芯片的名字：Jalapeño。

Jalapeño名字背后的含义

Jalapeño原意是墨西哥辣椒，雷科技最初并没有深想这个名字，直到看完一个分析视频时才突然想到：这个词有点耳熟。努力回想后，想起自己第一次听到这个词，是作为雷科技MWC报道团成员，在巴塞罗那MWC会场的小食摊上买了一个taco时。当时因为那股酸爽带劲的辣味，问摊主那是什么辣椒，得到的答案就是——Jalapeño。Jalapeño的特点是带劲却又平易近人，这也是它随着西班牙文化而风靡全球的原因，或许也代表着OpenAI这款芯片的特点：性能足够强，且性价比十足。

审视Jalapeño芯片性能

OpenAI对Jalapeño的实际参数、制程等信息目前都还在“严防死守”，只是非常笼统地说：它是目前同规格里最强的，已经在实验室里跑通了GPT - 5.3 - Codex - Spark。这个模型是OpenAI专为实时编程需求训练的小型Codex模型，对芯片的需求是 “低延迟、高并发” ，而非绝对性能。再结合Jalapeño所采用的ASIC架构，基本上可以猜测其性能应该落在Google的第八代TPU芯片附近。如果按第八代TPU中最高性能的TPU 8t（12.6PFLOPS）来算，那么Jalapeño的理论算力或许会在13PFLOPS左右（仅猜测）。但是，如果从Jalapeño的推理用途出发，雷科技推测它的算力更有可能落在10PFLOPS附近，毕竟要兼顾效率和功耗。

研发速度与量产疑问

考虑到Jalapeño从宣布研发到流片成功仅花费9个月，这个速度和成果确实都足以让人感到惊讶。不过，看看站在奥尔特曼身边的陈福阳，这个“奇迹”倒也不难理解，毕竟博通本就是ASIC领域的巨头之一，算是让OpenAI也体验了一回“站在巨人肩膀上”的感觉。相比起研发速度，更让人好奇的是：OpenAI真的做好量产准备了吗？从目前已经透露出的消息来看，Jalapeño大概率会由台积电负责生产。众所周知的是，台积电现在并没有太多空余产能，想要部署一个足以支撑OpenAI算力需求的数据中心，至少短时间内是不可能的。所以，对于一些媒体吹嘘Jalapeño即将拉爆英伟达之类的言论，大家看看就好。即使按照OpenAI的计划，Jalapeño的部署周期也将延续到2029年，最终目标是建设一个10GW级别的算力中心。

跳出英伟达硬件生态的原因

从微软的Azure Maia 200到Google的第八代TPU，从亚马逊的Trainium3到阿里云的真武M890，这些产品背后，是曾经追在英伟达后面、渴求一张显卡的云服务龙头们。如今，它们都在自己“造芯”，现在就连英伟达“最亲密的战友”OpenAI也掏出了Jalapeño。大家不禁要问，为什么大家都想跳出英伟达的硬件生态，搭建自己的算力生态？答案自然是成本。具体分析，小雷在前两天发的《Google开卖TPU，大厂想要靠AI芯片生产“低价token”》一文中已经写过，有兴趣的朋友可以去看看。不想去看的，记住这段话就行了：英伟达挟天子（GPU + CUDA）以令诸侯，AI巨头们“苦英伟达久矣”。

OpenAI与英伟达的矛盾纠葛

OpenAI与英伟达的矛盾并非现在才显现，在去年9月，市场盛传英伟达将对OpenAI进行一笔规模巨大的战略投资，其金额可能高达1000亿美元。大家算算时间，正好是9个月前，换言之，当时的Jalapeño可能已经进入实质启动阶段。从这个角度来看，OpenAI的离职高管们对奥尔特曼的评价倒也没错：政治手腕高超、商业利益至上，对绝对控制权有执念。一边在谈判一笔史上最大的投资计划，一边却计划给对方来一招“釜底抽薪”。虽然很难用“道德”去衡量这种商业行为，但在英伟达眼里，必然会有一种自己受到背叛的感觉，以至于这个千亿投资计划在谈判数月后都没有太多进展。直到市场因为双方合作出现危机，而对AI行业的未来感到不安时，双方才出于对未来市场的考量，选择敲定一笔300亿美元的投资，而且英伟达只是作为三大投资商之一参股，甚至不是出钱最多的（亚马逊投了500亿美元）。而在这笔投资敲定后，黄仁勋也公开表示：“这可能是最后一次”。显然，彼时的英伟达有可能已经从供应链收到了消息，OpenAI正在开发Jalapeño，并且已经接近流片或处于流片阶段。自己投的钱或许会成为日后攻击自己的武器，这个滋味想必是不好受的。但是英伟达与OpenAI的绑定又太深了，双方都需要对方搭台子把“AI”这场大戏继续唱下去，所以双方都处于“谁也离不开谁”的状态。即使OpenAI有了Jalapeño也是如此，甚至可以说：只要Claude、DeepSeek、Gemini等AI模型还存在，那么OpenAI就离不开英伟达，因为它仍然需要最强的算力卡，去搭建最强的算力矩阵，用来训练“最强”的模型。但除此之外，所有云服务商都会有意识地削减对英伟达算力卡的依赖，这既可以说是为了利益，也可以说是为了让AI的未来不会被掌控在一家厂商手上。

ASIC芯片的特点与影响

从OpenAI到阿里云，都在捣鼓ASIC芯片，有人想问：ASIC到底是什么？AI行业要抛弃GPU了吗？简单来说，ASIC是“专用集成电路”的简称，并非某种固定结构，其设计目的就是根据企业的需求完全定制一颗芯片，而这颗芯片也仅适用于某类特定场景。所以，ASIC芯片的灵活性远不如GPU、CPU这样的通用型芯片，当模型架构发生大幅变化后，企业也往往需要设计新的ASIC芯片，以确保效率。这也是前面说大家其实都离不开英伟达的原因，因为只有GPU这样的通用型芯片才能同时承载多种不同架构的模型，并且依然保持较高效率运行，而ASIC则更像是摸透了模型的需求后，针对性打造的“专用工具”。事实上，每一代ASIC芯片的开发费用和耗时都不低，OpenAI的9个月在半导体行业中已经算得上是奇迹了。即便如此，对于云服务商们来说也是划算的，因为他们自己就能消化大批出货，通过规模效应来均摊单片成本，再算上后期维护等成本，终归是赚的。

半导体股的起伏与存储需求

在写这篇稿子的时候，恰逢半导体股连续暴跌后的回调，也让不少人坐了一回“心理过山车”。前几天的暴跌其实并不难理解。连日暴涨让美光等企业的股价已经达到前所未有的水平，与此同时，美光还宣布暂缓HBM内存的产能升级计划，将部分产能回调到GDDR等消费级产线。这让部分投资者认为HBM带来的增长神话即将破灭，AI行业的算力硬件前景预期下跌，再叠加其他因素，最终导致半导体企业的股价集体迎来一波暴跌。然后美光发布的财报，让跳水的股价来了一波“原地起飞”。事实上，如果了解目前的AI芯片状态，那么大概率不会怀疑存储厂商的未来营收（仅分析，不构成投资建议）。因为不管是英伟达的算力卡，还是各个公司自己开发的ASIC芯片，只要是用于高并发、高吞吐、低延迟的推理场景，那么HBM内存几乎是目前唯一的选择。这种情况会持续到突破性技术出现为止，比如Wafer - Scale架构彻底成熟、片上大SRAM设计（在芯片中内置大容量高速内存）完全跑通等。目前来看，以上技术虽然都取得了一定进展，但是距离完全成熟还有一定时间。真要说的话，目前最有可能出现的“黑天鹅事件”，是某个AI厂商突然宣布研发出一套全新的算法，可以让AI模型对存储的需求大幅度降低。比如前段时间Google公开的TurboQuant，据称可将推理内存需求降低6倍以上。虽然其论文结论尚存争议，但如果该技术成熟，将会对HBM的需求造成直接冲击。除此之外，DeepSeek的MoE路由优化、MLA路线，以及针对特定内存技术开发的新型模型结构（比如大小模型混合调度），都是可预期的方向。这也是存储企业其实不太喜欢DeepSeek的原因，因为他们真的是在“捣乱”。不过，至少在未来的两三年里，内存的短缺可能仍难以缓解。反而会因为芯片厂商们都在折腾自己的ASIC芯片（单颗芯片往往需要128GB以上的HBM内存），导致HBM供需进一步紧张。

AI行业未来展望

未来几年，AI行业大概会变得更加“火热”，因为目前的投资额，已经让大家都无法承担失败的后果。所以，英伟达的GPU神话大概率仍会继续，HBM的缺货周期还远未结束，ASIC的战争其实才刚刚开始。而消费者最终看到的，可能是一边越来越便宜的AI服务，另一边却是越来越贵的显卡、内存、SSD与电子产品。这么看来，Jalapeño这个名字是真的起得妙：它不像死神辣椒那样一口封喉，却足够让整个AI芯片市场感到火辣。AI公司的目标是让token变便宜。但在那之前，先被点燃的，可能是整个半导体产业链。