
【导语:OpenAI刚刚推出史上首颗自研芯片Jalapeño,仅用9个月就完成开发,刷新行业纪录。该芯片由AI辅助设计,专为大模型推理优化,有望大幅降低推理成本,重塑ChatGPT使用体验。】

OpenAI推出的自研芯片Jalapeño,专为大模型推理设计。仅用9个月,工程样片就跑通了GPT - 5.3 - Codex - Spark,且频率和功耗达到量产目标。通常,先进半导体行业设计高性能ASIC需18到24个月,如Google TPU两年一代,Amazon Trainium也类似,OpenAI此举一举刷新了先进半导体领域最快的ASIC开发周期。

Jalapeño的设计亮点在于OpenAI自家AI模型参与其中。芯片设计中最耗时的是设计 - 验证 - 改 - 再验证的循环,一颗先进芯片的验证要跑成千上万次,占掉大半周期。而AI擅长读历史设计数据、生成RTL代码、辅助验证和debug、优化布局布线,替人扛掉了最磨人的部分。此前Google也有用AI设计芯片的经验,OpenAI硬件团队掌门人Richard Ho就来自相关圈子。

OpenAI每年算力支出达百亿美元级别,这些成本最终会转嫁到用户身上。Jalapeño使推理成本砍半,普通用户最先能感受到响应变快,因为ChatGPT高峰期的排队、转圈、长对话变慢本质是算力不足。推理效率提升后,同等服务器能服务更多用户。其次,免费版能力有望放开,现在很多功能锁在Plus里,成本降低后下放给免费用户的可能性增大。长远来看,月费不变但用户获得的能力可能大幅提升。

OpenAI要做全栈AI公司,模型自己训,芯片自己设计,推理自己优化,部署自己控制。此前与Cerebras合作推理部署,让OpenAI摸清了专用推理硬件的价值。它用AI加速AI基础设施建设,再用更好的基础设施跑更强的AI。首批GW级数据中心将和Microsoft等合作方从2026年底开始部署。编辑观点:OpenAI自研芯片的推出是AI领域的重大突破,其快速开发和AI辅助设计模式值得关注,有望改变AI产业格局,推动AI应用更广泛普及。

被折叠的 条评论
为什么被折叠?



