vLLM 巨大里程碑

原创于 2026-01-06 21:47:30 发布 · 620 阅读

·

4

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

标签

#人工智能

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

基于官方 Qwen-Image 基础镜像定制优化，适配 RTX 4090D 24GB 显存环境，预装 CUDA 12.4、对应驱动 550.90.07，配置 10 核 CPU / 120GB 内存运行环境，内置通义千问视觉语言模型依赖库、推理脚本与常用工具，开箱即用，支持大模型快速加载、图像理解、多模态推理等任务，无需重复配置环境。

大家好，我是 Ai 学习的老章

我是 vLLM 的粉丝，更新过 N 多相关文章，内网部署大模型全都是使用 vLLM

大模型本地部署，vLLM 睡眠模式来了
 vLLM v0.13.0 来了，对 DeepSeek 深度优化
 vLLM-Omni 帮助文档翻译，模型相关
 vLLM 最新版来了，Docker Model Runner 集成 vLLM
DeepSeek-OCR 本地部署（上）：CUDA 升级 12.9，vLLM 升级至最新稳定版

前文之后 vLLM 重要更新

继续介绍 vLLM 的最新的几个动态

🎉1、vLLM 官网上线（正式）

官网地址：https://vllm.ai/

这里面有个极友好的交互式 vLLM 安装选择器（GPU、CPU 等）

✨ 2、巨大里程碑——vLLM 语义路由 v0.1

实现的功能：
用户与多种 AI 模型之间的桥梁 ，通过捕捉请求上下文信号，智能地将请求路由到不同的 LLM 提供商和架构中。除模型选择外，也可以在安全过滤（脱狱/PII）、语义缓存和幻觉检测方面做出智能决策。

详细介绍：https://blog.vllm.ai/2026/01/05/vllm-sr-iris.html

🤝3、感谢一系列小号 vLLM

https://github.com/skyzh/tiny-llm
https://github.com/Wenyueh/MinivLLM
https://github.com/GeeeekExplorer/nano-vllm

其中 nano-vLLM 我之前介绍过：大模型本地部署，小号的 vLLM 来了

而 MinivLLM 那个项目更离谱，它建立在 nano-vLLM 之上更加迷你

4、🚀Day-0 支持一系列大模型

MiniMax-M2.1

GLM-4.7

Qwen-Image-2512

关于 vLLM-Omini，我也详细写过

全模态大模型部署，vLLM-Omni 来了，100% 开源

您可能感兴趣的与本文相关的镜像

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

Qwen

图片生成

ComfyUI

基于官方 Qwen-Image 基础镜像定制优化，适配 RTX 4090D 24GB 显存环境，预装 CUDA 12.4、对应驱动 550.90.07，配置 10 核 CPU / 120GB 内存运行环境，内置通义千问视觉语言模型依赖库、推理脚本与常用工具，开箱即用，支持大模型快速加载、图像理解、多模态推理等任务，无需重复配置环境。

机器学习算法与Python实战

博客等级

码龄12年

企业官方账号

361
原创

2023
点赞

4138
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

上一篇：: 阿里开源Wan2.2视频生成全家桶

下一篇：: DeepSeek-OCR-2 本地部署，实测

最新评论

OpenCode：开源版Claude Code来了，附Windows客户端
ha_lydms: 这个是 Windows 使用的吗

大家在看

最新文章

官方同款运行环境

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

基于官方 Qwen-Image 基础镜像定制优化，适配 RTX 4090D 24GB 显存环境，预装 CUDA 12.4、对应驱动 550.90.07，配置 10 核 CPU / 120GB 内存运行环境，内置通义千问视觉语言模型依赖库、推理脚本与常用工具，开箱即用，支持大模型快速加载、图像理解、多模态推理等任务，无需重复配置环境。

Qwen

图片生成

ComfyUI

Qwen-Image

显存大小

24GB

CPU

10核心

内存

120GB

系统盘/数据盘

40GB

无需本地环境部署，可直接运行

· AI 阅读助手

目录

展开全部

收起

官方同款运行环境

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

基于官方 Qwen-Image 基础镜像定制优化，适配 RTX 4090D 24GB 显存环境，预装 CUDA 12.4、对应驱动 550.90.07，配置 10 核 CPU / 120GB 内存运行环境，内置通义千问视觉语言模型依赖库、推理脚本与常用工具，开箱即用，支持大模型快速加载、图像理解、多模态推理等任务，无需重复配置环境。

Qwen

图片生成

ComfyUI

Qwen-Image

显存大小

24GB

CPU

10核心

内存

120GB

系统盘/数据盘

40GB

无需本地环境部署，可直接运行

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。