一,基础配置对比
| 卡型 | 架构 | 卡数 | 显存 | CUDA | GPU Driver | (TDP)能源消耗 | CPU核数(超线程) | 内存大小 | CPU型号 | 发布日期 | 备注 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| A30 | Ampere | 8 | 24G | 11.0 | 450.51.06 | 165 Watt | 48 | 252 | AMD EPYC 7402 24-Core Processor | 2021 | PCIe |
| V100 | Volta | 8 | 32G | 11.4 | 470.57.02 | 250 Watt | 80 | 503 | Intel® Xeon® Gold 6230 CPU @ 2.10GHz | 2017 | NV Link |
二,模型训练对比
1,单卡模型训练对比
1.1, batch_size 为 128 对比
- 对比环境

- 性能对比


A30

V100
1.2,batch_size 为 256 对比
- 对比环境

- 性能对比


2,多卡模型训练对比
2.1, batch_size 为 128 对比
- 对比环境

- 性能对比


2.2, batch_size 为 256 对比
- 对比环境

- 性能对比

三,推理AB-压测对比
1,对比环境
共压80000数据,同时请求500数据。
2,压测性能对比

四,算力、带宽对比
A30:

V100:

注:
本文对比了A30与V100GPU在基础配置、模型训练(不同batch_size下的单卡和多卡训练性能)、推理压测以及算力和带宽方面的差异。在压测中,针对80000数据进行500数据的并发请求,同时探讨了PCI与PCIe的技术要点。



被折叠的 条评论
为什么被折叠?



