一图看透：910B、H20、A100、H100、H200性能对比！

原创已于 2025-05-27 14:52:16 修改 · 4.2w 阅读

本内容遵循CC 4.0 BY-SA版权协议

标签

#人工智能 #深度学习 #transformer #pytorch #服务器

于 2025-03-04 15:18:52 首次发布

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen

文本生成

Qwen3

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化，内置完整运行环境与 Qwen3-32B 模型依赖，开箱即用。

写在前面

小弟最近需要去购买一些服务器，但是网上的一些显卡性能感觉都是大抄特抄，根本没有具体到显卡的型号，所以本人去Nvidia的官方文档记录了一些数据

*表示数据来源于网络，并非官方文档
SXM（Scalable Link Interface）是一种用于数据中心和超级计算机的高带宽、低延迟的接口标准，支持更高的功率和更高的带宽。SXM卡通常插入到支持NVIDIA SXM接口的服务器或工作站中。
NVL（NVIDIA Link）是一种适配卡，主要设计用于与 NVIDIA DGX 系列服务器和其他云计算平台配合工作。它的接口通常与标准的 PCIe插槽兼容，可以更容易地集成到现有的企业和云计算架构中
HGX就是使用的SXM接口

其实对于我们训模型来说，主要关注FP16、BF16、INT8的速度即可，其他的性能我觉得都不太重要。