0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

全新NVIDIA Nemotron 3 Super模型重磅发布

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2026-03-16 16:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一款全新的开放 1,200 亿参数混合式 MoE (mixture‑of‑experts) 模型,专为 NVIDIA Blackwell 进行了优化,可解决拖慢自主智能体工作流的长时推理和上下文爆炸的成本难题。

NVIDIA Nemotron 3 Super 于今日发布,其为一款 1,200 亿参数开放模型,拥有 120 亿个活跃参数,旨在大规模运行复杂的代理式 AI 系统。

该模型现已上线,融合先进的推理能力,能够高效并精准地完成自主智能体的任务。

AI 原生公司:Perplexity 不仅为用户提供 Nemotron 3 Super 访问权限用于搜索,还将其作为 ‘Computer’ 平台中 20 个编排模型的组成部分。CodeRabbit、Factory 和 Greptile 等提供软件开发智能体的公司将该模型与自有模型结合,并集成到 AI 智能体中,在降低成本的同时提升准确性。Edison Scientific 和 Lila Sciences 等生命科学及前沿 AI 机构则将借助该模型为其智能体赋予深度文献检索、数据科学与分子理解能力。

企业软件平台:Amdocs、Palantir、Cadence、达索系统和西门子等行业领先企业,正部署并定制该模型,用于电信、网络安全、半导体设计与制造等领域的工作流自动化。

企业从聊天机器人向多智能体应用演进时,会面临两大制约因素。

第一个制约因素是上下文爆炸。与标准聊天相比,多智能体工作流生成的 token 数量多达其 15 倍,因为每次交互都需要重新发送完整的历史记录,包括工具输出和中间推理结果。

在长任务中,这样庞大的上下文不仅增加了成本,还可能导致目标偏离,即智能体在执行过程中逐渐脱离最初设定的任务目标。

第二个制约因素则是思考税。复杂智能体每一步都必须进行推理,但如果每个子任务都使用大模型,多智能体应用就会变得成本高昂和迟缓,难以投入实际使用。

Nemotron 3 Super 拥有一个 100 万 token 的上下文窗口,允许智能体在显存中保留完整的工作流状态,并防止目标偏离。

Nemotron 3 Super 树立了新标准,在 Artificial Analysis 的效率和开放性排名中位居榜首,并在同等规模的模型中展现出领先的准确性。

该模型还助力 NVIDIA AI-Q 研究智能体在 DeepResearch Bench 和 DeepResearch Bench II 排行榜上取得第一名。这些基准测试旨在衡量 AI 系统在海量文档中开展全面多步骤研究,并保持推理连贯性的能力。

混合架构

Nemotron 3 Super 采用了混合 MoE (mixture‑of‑experts) 架构,结合了三项主要创新,与之前的 Nemotron Super 模型相比,实现了高达 5 倍的吞吐量提升和高达 2 倍的准确率提升。

混合架构:Mamba 层实现 4 倍显存与计算效率提升,Transformer 层则提供高级推理能力。

混合专家 (MoE):在其 1,200 亿参数中,推理时仅激活 120 亿参数。

潜在混合专家 (MoE) 架构:这是一种新的推理技术,它以单个专家的成本来激活四个专家,从而显著提升 token 生成的准确率。

多 token 预测:能够同时预测多个未来的词语,从而使推理速度提高 3 倍。

在 NVIDIA Blackwell 平台上,该模型以 NVFP4 精度运行,降低了显存需求,并使推理速度较之在 NVIDIA Hopper 平台上使用 FP8 至高提升 4 倍,同时不损失准确性。

开放权重、数据和方案

NVIDIA 将 Nemotron 3 Super 的权重完全开放,并配以宽松许可协议。开发者可在工作站、数据中心或云端来进行部署和定制。

Nemotron 3 Super 基于前沿推理模型生成的合成数据训练而成。NVIDIA 将公布完整的训练方法,其中包括超过 10 万亿个 token 的预训练和后训练数据集,15 个用于强化学习的训练环境以及评估方案。研究人员还可借助 NVIDIA NeMo 平台对模型进行微调或构建专属模型。

在代理式系统中的应用

Nemotron 3 Super 旨在处理多智能体系统中的复杂子任务。

一个软件开发智能体可以一次性将整个代码库加载到上下文中,从而实现端到端的代码生成和调试,且无需进行文档分割。

在金融分析中,它能够将数千页的报告加载到显存中,避免在长对话中重复推理,从而提高效率。

Nemotron 3 Super 具有高精度的工具调用能力,确保自主智能体能够在海量的函数库中导航,避免在高风险环境中出现执行错误 (例如网络安全中的自主安全编排)。

如何获取

NVIDIA Nemotron 3 Super 作为 Nemotron 3 系列的一部分,可通过 NVIDIA 官网、Perplexity、OpenRouter 和 Hugging Face 获取。戴尔科技公司正将该模型引入 Hugging Face 上的 Dell Enterprise Hub,并针对 Dell AI Factory 的本地部署进行了优化,以推动多智能体 AI 工作流的发展。慧与 (HPE) 也将 NVIDIA Nemotron 引入其 Agents Hub,帮助确保在企业中扩展应用代理式 AI 。

企业与开发者可通过多家合作伙伴部署该模型:

云服务提供商:谷歌云的 Vertex AI、Oracle Cloud Infrastructure;即将登陆亚马逊云科技的 Amazon Bedrock 及 Microsoft Azure。

NVIDIA 云合作伙伴:Coreweave、Crusoe、Nebius 与 Together AI。

推理服务提供商:Baseten、CloudFlare、DeepInfra、Fireworks AI、Inference.net、Lightning AI、Modal 和 FriendliAI。

数据平台与服务:Distyl、Dataiku、DataRobot、德勤、安永及塔塔咨询服务。

该模型以 NVIDIA NIM 形式提供,支持从本地系统到云端的部署。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5682

    浏览量

    110079
  • AI
    AI
    +关注

    关注

    91

    文章

    40865

    浏览量

    302459
  • 模型
    +关注

    关注

    1

    文章

    3810

    浏览量

    52244

原文标题:全新 NVIDIA Nemotron 3 Super 将代理式 AI 吞吐量提升 5 倍

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA与亚马逊云科技深化合作伙伴关系

    NVIDIA 和亚马逊云科技 (AWS) 扩展双方合作,增强在 AWS 平台上的由 NVIDIA 驱动的数据处理能力,并增加对 NVIDIA Nemotron 开放
    的头像 发表于 03-23 15:17 405次阅读

    NVIDIA 成立由全球领先 AI 实验室组成的 Nemotron Coalition,推动开放前沿模型发展

    新闻摘要: ● NVIDIA Nemotron Coalition 是模型构建者和 AI 实验室的首个此类全球合作项目,致力于通过共享专业知识、数据和计算来推进开放前沿基础模型的发展。
    的头像 发表于 03-17 11:14 270次阅读
    <b class='flag-5'>NVIDIA</b> 成立由全球领先 AI 实验室组成的 <b class='flag-5'>Nemotron</b> Coalition,推动开放前沿<b class='flag-5'>模型</b>发展

    NVIDIA 扩展开放模型系列,推动代理式、物理和医疗 AI 下一阶段发展

    新闻摘要: ●NVIDIA Nemotron 3 全模态理解模型 (Omni-understanding Models) 为 AI 智能体提供动力 ,使其能够实现自然对话、复杂推理和高
    的头像 发表于 03-17 09:18 478次阅读
    <b class='flag-5'>NVIDIA</b> 扩展开放<b class='flag-5'>模型</b>系列,推动代理式、物理和医疗 AI 下一阶段发展

    NVIDIA Jetson模型赋能AI在边缘端落地

    开源生成式 AI 模型不再局限于数据中心,而是开始深入到现实世界的各种机器中。从 Orin 到 Thor,NVIDIA Jetson 系列正在成为运行 NVIDIA Nemotron
    的头像 发表于 03-16 16:27 563次阅读
    <b class='flag-5'>NVIDIA</b> Jetson<b class='flag-5'>模型</b>赋能AI在边缘端落地

    利用NVIDIA Nemotron开放模型构建智能文档处理系统

    基于 NVIDIA Nemotron 开放模型的 AI 驱动文档智能,增强科学研究、金融和法律等领域工作流。
    的头像 发表于 02-25 11:21 635次阅读

    NVIDIA在CES 2026发布全新开放模型、数据和工具

    为扩展开放模型生态,NVIDIA 发布全新开放模型、数据和工具,推动各行业 AI 技术的发展。
    的头像 发表于 01-09 10:42 692次阅读

    深入解析NVIDIA Nemotron 3系列开放模型

    这一全新开放模型系列引入了开放的混合 Mamba-Transformer MoE 架构,使多智能体系统能够进行快速长上下文推理。
    的头像 发表于 12-24 10:34 4268次阅读
    深入解析<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> <b class='flag-5'>3</b>系列开放<b class='flag-5'>模型</b>

    NVIDIA 推出 Nemotron 3 系列开放模型

    新闻摘要: ● Nemotron 3 系列开放模型包含 Nano、Super 和 Ultra 三种规模,具有极高的效率和领先的精度,适用于代理式 AI 应用开发。 ●
    的头像 发表于 12-16 09:27 787次阅读
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Nemotron</b> <b class='flag-5'>3</b> 系列开放<b class='flag-5'>模型</b>

    NVIDIA携手Mistral AI发布全新开源大语言模型系列

    全新 Mistral 3 系列涵盖从前沿级到紧凑型模型,针对 NVIDIA 平台进行了优化,助力 Mistral AI 实现云到边缘分布式智能愿景。
    的头像 发表于 12-13 09:58 1409次阅读

    NVIDIA推动面向数字与物理AI的开源模型发展

    NVIDIA 发布一系列涵盖语音、安全与辅助驾驶领域的全新 AI 工具,其中包括面向移动出行领域的行业级开源视觉-语言-动作推理模型(Reasoning VLA)
    的头像 发表于 12-13 09:50 1503次阅读

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025构建高性能AI应用

    搜索和调用外部 AI 模型的 SQL 原生 API。NVIDIA 与微软共同将 SQL Server 2025 与 NVIDIA Nemotron RAG 开放
    的头像 发表于 12-01 09:31 978次阅读
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> RAG和Microsoft SQL Server 2025构建高性能AI应用

    NVIDIA Nemotron模型如何推动AI发展

    Nemotron 开源技术能够帮助开发者与企业构建强大的通用和专用智能系统。
    的头像 发表于 10-13 11:12 1158次阅读

    NVIDIA Nemotron Nano 2推理模型发布

    NVIDIA 正式推出准确、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的头像 发表于 08-27 12:45 1987次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> Nano 2推理<b class='flag-5'>模型</b><b class='flag-5'>发布</b>

    欧洲借助NVIDIA Nemotron优化主权大语言模型

    NVIDIA 正携手欧洲和中东的模型构建商与云提供商,共同优化主权大语言模型 (LLM),加速该地区各行业采用企业级 AI。
    的头像 发表于 06-12 15:42 1364次阅读

    ServiceNow携手NVIDIA构建150亿参数超级助手

    Apriel Nemotron 15B 开源大语言模型 (LLM) 使用 NVIDIA NeMo、NVIDIA Llama Nemotron
    的头像 发表于 05-12 15:37 1040次阅读