OpenAI首款芯片Jalapeño问世:挑战英伟达,还是学苹果自建智能工厂?

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

OpenAI终于做芯片,目标并非英伟达

OpenAI终于做芯片了。很多人看到这条新闻,第一反应是:英伟达麻烦了。但事实恰恰相反,首款芯片Jalapeño最重要的意义,并非直奔着英伟达而来。这是OpenAI第一次公开承认,自己不满足于做一家模型公司,它想控制的是生产智能的整个过程,从模型到芯片,从数据中心到能源,从训练到推理,从生产Token到销售Token。Jalapeño表面是一颗芯片,实际上更像一张路线图,OpenAI终于把自己的野心摆到了桌面上。

模型差距缩小,计算差距扩大

自从大模型爆发以来,AI行业几乎所有注意力都在模型。GPT - 4出来行业被震一次,Claude追上来,Gemini追上来,DeepSeek把性价比打出来,Meta推开源。每次发布大家盯着同一组东西:参数、榜单、代码能力、数学能力、长上下文、多模态。然而,一个变化已经出现,模型领先的窗口正在变短。今天一个模型刚发布,几个月后开源社区、竞争对手、云厂商就会跟上。能力差距仍然存在,但越来越难独立构成长期壁垒。真正拉开差距的东西,开始往更底层走,算力供应、推理成本、系统吞吐、网络能力、数据中心建设、能源获取。这些虽没有模型发布那么好看,也不会立刻刷屏,但它们决定一家AI公司能不能长期跑下去。黄仁勋最近说:英伟达系统也许不是采购价格最低的,但能生成成本最低的Token、最高的Token吞吐量,最终带来最高收入。这就是AI时代新的账本,服务器和GPU不是最终单位,Token才是。OpenAI恰好站在这个问题最中心。ChatGPT每天处理海量请求,Codex要消耗更多推理步骤,未来还有Agent、视频生成、机器人、长推理链。模型越有用,Token消耗越大。产品越成功,推理账单越厚。残酷的是,OpenAI用户越多,英伟达越赚钱;OpenAI产品越强,底层算力税越重。如果每一个Token都要经过外部硬件平台收一道税,OpenAI就很难拥有完整的护城河。它可以有最强模型,有超级入口,有开发者生态,但最核心的生产成本始终卡在别人手里。Jalapeño的本质就在这里,OpenAI开始自己造Token工厂。

GPT开始设计GPT

Jalapeño这款芯片最容易被低估的细节,是九个月流片。传统高性能ASIC项目,周期通常18个月到36个月。先进工艺更麻烦,架构、验证、物理实现、封装、软件栈、调试,任何一环出问题成本迅速放大。OpenAI和博通把周期压到了九个月。这并非芯片行业突然变简单,OpenAI没有凭空长出一条半导体产业链,博通在定制芯片和网络基础设施上经验深厚,Celestica负责板卡、机架和系统工程。OpenAI真正贡献的是更稀缺的东西,它知道未来模型要怎么跑。很多芯片公司做AI加速器,难点在于猜负载。模型结构会变,推理方式会变,服务模式会变。芯片一旦流片,物理世界没有软件世界那么好回滚。OpenAI不用完全靠猜。每天运行ChatGPT、Codex和API,它知道哪些内核最常用,哪些内存搬运最浪费,哪些网络瓶颈最影响集群效率,哪些延迟会直接伤害产品体验。它还知道未来Agent产品会怎么消耗推理资源。这些经验以前只是后台工程知识,现在被写进芯片架构。在OpenAI的官方新闻稿里有一句话很关键:OpenAI使用自己的模型加速了部分设计和优化流程。还说,提供给用户的模型也在帮助改进运行未来模型的基础设施。GPT开始参与设计下一代GPT的机器。过去几十年芯片的链条是,先设计芯片,芯片运行软件,软件运行AI。现在链条开始回头,AI帮助人类设计芯片,芯片再运行下一代AI。一旦这个闭环成立,九个月可能只是开始。未来可能是六个月、三个月,甚至更密集的迭代。芯片行业过去有自己的节奏,模型行业有自己的节奏。前者慢后者快。Jalapeño把两个节奏往一起拉。这一步如果走通,OpenAI的飞轮会变得很吓人。更好的模型帮助设计更好的芯片,更好的芯片降低下一代模型运行成本,更低成本支撑更多用户和产品,更多用户和产品带来更多真实负载数据,这些数据再反过来定义下一代芯片。这才是OpenAI真正想要的循环。

削减推理税,控制现金流

Jalapeño不是训练芯片,它面向的是大语言模型推理。这点很关键。训练像造航母,一次投入巨大,需要极强的通用能力,需要不断适配新模型新架构新实验。训练市场仍然高度依赖英伟达,不只是GPU,而是CUDA、网络、系统、软件库、开发者生态整套平台。推理更像出租车队,每天跑,每小时跑,每分钟跑。用户每提一个问题,API每响应一次,Agent每推进一步,都要发生推理。它更在意低延迟、低成本、高吞吐、高利用率。训练烧阶段性大钱,推理烧日常现金流。这也是AI公司走到商业化阶段后最头疼的问题。GPT训练一次很贵,但推理每天都在发生。Agent时代会继续放大这个问题,一次任务可能包含几十次甚至几百次模型调用。长上下文、链式推理、多模态生成、代码执行,都在继续推高Token消耗。Jalapeño瞄准的就是这笔推理税。它更像OpenAI自己的TPU。Google、亚马逊、Meta、微软都走过类似路线,只要负载足够大,自研ASIC就有高性价比的经济意义。OpenAI现在具备这个条件,有真实请求、有产品路线、有模型团队、有博通这样的产业伙伴,还有巨大的成本压力。Jalapeño不需要对外出售也能证明价值。只要它让ChatGPT回答更便宜、让Codex跑得更快、让API毛利更高,它就有意义。OpenAI还提到,Jalapeño会减少数据传输,平衡计算、内存和网络资源,让实际利用率更接近理论峰值。算力贵很多时候贵在没被充分用起来,GPU等待网络,内存搬运拖慢计算,调度不佳造成空转,所有浪费最后都变成电费和资本开支。采购价只是第一层,系统效率才是最后的账。

OpenAI越来越像苹果

很多人会把Jalapeño理解成OpenAI挑战英伟达,但OpenAI并不想成为下一家英伟达,更像是在学苹果。苹果最厉害的地方从来不是某一个单点。iPhone强,iOS强,A系列和M系列芯片强,App Store强。但苹果真正难打的地方,是这些东西被放在同一个闭环里。芯片为系统优化,系统为应用优化,应用体验再反过来定义下一代芯片。这套闭环让苹果可以在同样电池、同样体积、同样散热约束下,做出别人很难复制的体验。OpenAI正在搭类似的东西。模型是智能内核,ChatGPT是超级入口,Codex是开发工具,API是生态分发层,Jalapeño是自研芯片,数据中心是AI工厂。OpenAI CEO Altman这两年反复谈芯片、能源、核聚变、数据中心,现在看可能压根不是在追概念,他已经不再用AI创业公司的方式规划OpenAI了。如果说英伟达卖铲子,那么OpenAI想拥有矿山。英伟达要做所有AI公司的工厂设备供应商,卖GPU、卖网络、卖系统、卖软件生态、卖AI工厂方案,理想客户是每一个需要生产Token的公司。OpenAI想给自己建一套工厂,卖的不是设备,是最终生成出来的智能。短期看,OpenAI离不开英伟达。训练和通用计算仍然需要GPU平台,Jalapeño也不可能很快覆盖全部负载。它大概率先进入OpenAI最确定、规模最大、优化收益最高的推理场景。长期看,裂缝已经出现。当模型公司开始拥有自己的芯片路线图,英伟达的客户就不再只是客户。它们也会成为AI基础设施的另一类玩家。

AI时代新规律,OpenAI野心初现

过去二十年,互联网最重要的资产是流量。谁掌握用户,谁掌握价值。今天,AI时代正在出现新的规律。模型越来越像流量,而计算越来越像土地。模型会迭代,产品会变化,排行榜会不断刷新。但那些生产智能的工厂,芯片、网络、数据中心、能源,会越来越集中在少数玩家手里。GPT开始设计GPT,看起来只是一次流片。但它真正宣告的事情是:OpenAI已经不满足于成为最聪明的公司,它想成为控制智能生产的公司。那么,OpenAI能否成功构建自己的智能生产闭环,又将对AI行业格局产生怎样的影响呢?

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

内容概要:本文围绕列车-轨道-桥梁交互仿真研究,基于Matlab平台构建数值模型,系统分析列车运行过程中轨道与桥梁结构间的动态相互作用机制。研究涵盖多体动力学建模、耦合系统运动方程求解、边界条件设定及仿真结果可视化等关键环节,重点揭示高速行车条件下基础设施的振动传递规律与力学响应特征。该仿真方法可有效评估结构安全性、舒适性指标及疲劳寿命,为轨道交通工程的设计优化与运维管理提供理论支撑和技术路径。文中配套提供了完整的Matlab代码实现方案及操作说明,便于用户复现、验证和拓展相关研究。; 适合人群:具备Matlab编程基础和结构动力学、车辆动力学等相关专业知识的研究生、科研人员及从事铁路工程、桥梁工程与交通系统安全评估的工程技术人才,尤其适合开展轨道交通耦合振动课题的研究者。; 使用场景及目标:①用于高校与科研机构进行列车-轨道-桥梁耦合系统动力学特性的教学演示与科学研究;②支撑高速铁路桥梁的设计优化、运营安全性评估与减振降噪方案验证;③为复杂交通基础设施的多物理场耦合仿真提供建模思路与代码参考。; 阅读建议:建议读者结合所提供的Matlab代码逐模块深入研读,重点关注系统建模假设、质量-刚度-阻尼矩阵构建方法及数值积分算法的实现细节,同时可通过调整参数进行敏感性分析,进一步掌握仿真模型的适用范围与优化方向。
内容概要:本文系统研究了非线性薛定谔方程的物理信息神经网络(PINN)求解方法,提出一种将物理规律嵌入深度学习模型的科学计算新范式。通过构建全连接神经网络架构,将非线性薛定谔方程及其初始/边界条件作为损失函数的核心组成部分,实现了在无须大量标注数据的前提下对复值偏微分方程的高精度数值求解。该方法充分利用自动微分技术精确计算方程残差,有效融合了数据驱动与模型驱动的优势,在光学孤子传播、量子系统演化等典型场景中展现出优异的逼近能力与泛化性能。文中配套提供了完整的Python实现代码,涵盖网络搭建、损失定义、训练优化与结果可视化全流程。; 适合人群:具备Python编程能力与深度学习基础知识,熟悉偏微分方程理论及科学计算的理工科研究生、科研人员,以及从事光学、量子物理、流体力学等领域建模与仿真的工程技术人员。; 使用场景及目标:① 掌握PINN方法的基本原理与实现技巧;② 学习如何将复杂物理方程转化为可训练的神经网络损失项;③ 应用于非线性光学、玻色-爱因斯坦凝聚、水波动力学等问题的仿真与预测;④ 为相关科研课题提供可复现的算法原型与代码参考。; 阅读建议:建议读者结合所提供的Python代码进行动手实践,重点理解神经网络对微分算子的近似机制、损失函数的多任务加权策略以及训练过程中的超参数调优方法,进而可迁移至其他非线性偏微分方程的求解任务,拓展其在交叉学科中的应用边界。
源码下载地址: https://pan.quark.cn/s/a4b39357ea24 微软推出的【AZ-900微软认证】是一项针对初学者的基础级云服务资格认证,其目的在于帮助学习者掌握云概念、微软Azure服务的运作机制以及云解决方案的核心知识。获得这一认证后,考生将能够清晰地理解云计算领域的基础术语、服务模式(包括IaaS、PaaS、SaaS等)以及这些服务在Azure平台上的实际应用方式。 在【必过考题】部分,我们可以观察到两个重点议题,它们分别聚焦于PaaS(平台即服务)的概念阐释和云成本的计算方式。 在第一个议题中,考生被要求辨别关于PaaS的正确性描述。PaaS平台提供了一个开发环境,但并不允许用户直接访问操作系统(Box 1: No)。比如,Azure Web Apps服务可以用来部署web应用,但用户无法直接管理虚拟机或IIS系统。另一方面,PaaS确实具备自动扩展的功能(Box 2: Yes),这表示可以根据实际需求自动增加负载均衡的虚拟机以支持web应用的运行。PaaS框架还为开发人员提供了构建和调整云端应用的工具,预置的应用组件能够有效缩短新应用的编程周期(Box 3: Yes)。 第二个议题同样关注云计算理念的理解,尤其强调IT支出从资本性支出(CapEx)向运营性支出(OpEx)的转型思想。传统的IT投资通常被视为CapEx,而云计算的按需付费机制使企业能够将这部分开支转化为OpEx,从而在财务规划上获得更大的自由度。 在为AZ-900考试做准备时,考生需要特别关注以下几个核心知识点: 1. **云服务模式**:深入理解IaaS(基础设施即服务)、PaaS和SaaS(软件即服务)之间的差异及其各自的应用情境。 2. **Azure服务*...
源码下载地址: https://pan.quark.cn/s/239a0d536a1e 依据所提供的文件资料,可以归纳出以下核心内容:由清华大学计算机系邓俊辉教授精心编纂的算法训练营题目合集,对于CSP(中国软件专业人才设计与创业大赛)及PAT(程序设计能力测试)这类编程竞赛具有极高的参考价值,堪称一份极具价值的参考资料。此类竞赛普遍对参赛者的算法功底和编程技巧提出严苛要求。该合集中的题目与算法领域紧密相连,其中包含了“最大红矩形”这一典型题目。所谓最大红矩形题目,其核心任务是针对一个由红色与绿色方格构成的棋盘,寻觅出最大的纯红矩形区域。要攻克这一问题,必须运用数据结构与算法的相关知识,特别是栈这一数据结构的应用。 “最大红矩形”问题能够被抽象转化为“直方图最大面积”问题。具体转化方法是将棋盘的每一列视为一个独立的直方图单元,其中红色方格的贡献体现为当前位置与前一个绿色方格所在行数的差值,从而保证每个直方图的基宽恒定为1。随后,借助扫描直方图的技术手段来探寻最大矩形面积。这一过程需要对每个直方图进行系统性遍历,并利用栈来记录各直方图的下标信息。一旦检测到当前直方图的高度小于栈顶元素所记录的高度,则意味着遭遇了一个“高点”,此时需计算以该“高点”为右边界条件的最大矩形面积。 在编程实践环节,必须高度关注栈的操作细节,以及如何精确地初始化和操纵栈来应对直方图问题。代码实现中,通常配置两个栈,一个用于储存直方图的高度值,另一个用于标记直方图的下标位置。当面对新高度时,需审慎判断当前高度与栈顶高度的相对关系,并据此抉择是执行入栈操作还是计算面积。针对“低点”(即当前高度小于栈顶),应直接将当前高度纳入栈中;而对于“高点”,则需执行弹出栈顶元素的操作,并基于该栈顶元素的高...
源码链接: https://pan.quark.cn/s/3af847fbbec7 在计算机科学与编程领域中,十六进制(Hexadecimal)以及二进制(Binary)是两种关键性的数值表示方法。十六进制属于一种基于16的计数系统,它运用0至9的数字以及字母A至F(分别象征10至15的数值)来呈现数值,与此同时,二进制则是一种基于2的计数系统,仅采用0和1两个符号。掌握这两种进制之间的相互转换对于深入理解计算机内部运作机制具有决定性意义,因为计算机在底层数据的存储与处理环节通常都是以二进制的形式来进行的。将十六进制转换成二进制的过程可以通过以下几个环节得以完成: 1. **单个十六进制符号的转换**:每一个十六进制符号对应着4位二进制序列。具体而言: - 十六进制中的`0`在二进制表达为`0000` - 十六进制中的`1`在二进制表达为`0001` - 十六进制中的`2`在二进制表达为`0010` - 依此类推 - 十六进制中的`9`在二进制表达为`1001` - 十六进制中的`A`或`a`在二进制表达为`1010` - 十六进制中的`B`或`b`在二进制表达为`1011` - 十六进制中的`C`或`c`在二进制表达为`1100` - 十六进制中的`D`或`d`在二进制表达为`1101` - 十六进制中的`E`或`e`在二进制表达为`1110` - 十六进制中的`F`或`f`在二进制表达为`1111` 2. **多位十六进制符号的转换**:针对一个由多个十六进制符号组成的数值,我们可以逐个符号进行转换,并将得到的二进制序列依次拼接。例如,十六进制数`3F`转换成二进制形式为`00111111`。 3. **编程实现方法**:在编程实践过程中,众多编程语言提...
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值