PyTorch → Quantize → ONNX → TensorRT Engine 流程总结
本文档梳理 PyTorch → 量化 → ONNX → TensorRT Engine 的完整流程,说明各阶段输入输出及如何衔接。以及端侧llm与数据中心的差异和特殊优化
一、目录里各仓库的角色
| 目录 | 作用 |
|---|---|
pytorch/ |
PyTorch 框架源码;提供 torch.onnx.export 等导出能力 |
onnx/ |
ONNX 格式规范与工具 |
onnx-tensorrt/ |
ONNX Parser(libnvonnxparser.so):把 ONNX 图解析成 INetworkDefinition;详见 Stage 4.1 |

订阅专栏 解锁全文
284

被折叠的 条评论
为什么被折叠?



