作为一个每天和Token账单打交道的人,我一直渴望真正的“调用自由”。上一篇文章我们讲了Ollama通用方案,这次聚焦通义千问(Qwen)系列——从Qwen2.5到最新的Qwen3.5,如何在Mac上完美运行,并与OpenClaw无缝对接。本文将提供完整的配置代码、硬件选型指南和避坑方案,让你彻底告别Token焦虑。
一、为什么选择Qwen系列本地部署?
1.1 Qwen的核心优势
通义千问(Qwen)是阿里云开源的大语言模型系列,在中文理解、代码生成和推理能力上表现优异。最新发布的Qwen3.5系列更是首个原生视觉-语言模型家族,支持多模态理解,在TAU2-Bench评测中得分86.7。
| 特性 | Qwen系列优势 |
|---|---|
| 中文能力 | 原生中文训练,理解和生成远超国外开源模型 |
| 模型规格 | 从0.6B到235B全覆盖,适配各种硬件 |
| 量化支持 | Ollama提供多种量化版本(Q4_0/Q8_0等),内存友好 |
| 上下文长度 | 最高支持128K-256K token,处理长文档无压力 |
| 多模态能力 | Qwen3.5支持图像理解,可处理截图、图片等 |
1.2 Mac硬件选型指南
在Mac上跑Qwen,内存(统一内存)是决定性因素。以下是基于实测的硬件建议:
| Mac内存 | 推荐模型及量化 | 文件大小 | 适用场景 |
|---|---|---|---|
| 8GB | Qwen2.5 7B (Q4_0) / Qwen3 4B (Q4_0) | 4-5GB | 轻量对话、文件整理、基础问答 |
| 16GB | Qwen2.5 7B (Q8_0) / Qwen3.5 9B (Q4_0) | 5-9GB | 复杂推理、代码生成、中等上下文 |
| 24-32GB | Qwen3.5 14B (Q4_0) / 35B (Q4_0) | 8-18GB | 长文本处理、多模态任务、专业应用 |
| 64GB+ | Qwen3 72B (Q4_0) / 235B MoE | 37GB+ | 科研、全场景覆盖 |
小知识:量化版本中,Q4_0是4-bit量化,文件最小、速度最快,适合内存有限的设备;Q8_0是8-bit量化,在速度和精度间取得平衡。
二、Ollama部署Qwen全流程
2.1 安装Ollama
# 使用Homebrew安装(推荐)
brew install ollama
# 或从官网下载安装包
# 访问 https://ollama.com/download 下载macOS版本
# 启动Ollama服务(后台运行)
ollama serve
# 验证安装
ollama --version # 应显示 0.5.0 或更高
设置开机自启:
# 将Ollama添加到登录项
# 系统设置 → 通用 → 登录项 → 点击"+"添加Ollama
2.2 下载Qwen模型
Ollama支持全系列Qwen模型,包括最新的Qwen2.5和Qwen3.5。
# 查看可用Qwen模型列表
ollama list | grep qwen
# 下载Qwen2.5 7B(中文能力强,推荐)
ollama pull qwen2.5:7b-instruct-q4_0 # 约4.1GB
# 下载Qwen2.5 14B(需要16GB+内存)
ollama pull qwen2.5:14b-instruct-q4_0 # 约8.2GB
# 下载Qwen3.5 9B("小钢炮",平衡之选)
ollama pull qwen3.5:9b-instruct-q4_0 # 约5.3GB
# 下载Qwen3.5 35B(需要24GB+内存,支持多模态)
ollama pull qwen3.5:35b-instruct-q4_0 # 约20GB
# 验证下载
ollama list
模型选择建议:
- 16GB Mac:首选
qwen2.5:7b-instruct-q4_0或qwen3.5:9b-instruct-q4_0 - 32GB Mac:可以考虑
qwen2.5:14b-instruct-q4_0 - 需要多模态:选
qwen3.5:35b-instruct-q4_0(需足够内存)
2.3 测试模型运行
# 直接在终端对话
ollama run qwen2.5:7b-instruct-q4_0
# 输入测试问题
>>> 介绍一下通义千问模型的特点
>>> /bye # 退出
# 测试Ollama的OpenAI兼容API
curl http://localhost:11434/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "qwen2.5:7b-instruct-q4_0",
"messages": [{"role": "user", "content": "你好,请做个自我介绍"}],
"stream": false
}'
如果返回正常,说明Ollama服务已经就绪。
三、OpenClaw安装与配置
3.1 安装OpenClaw
OpenClaw需要Node.js 22或更高版本。
# 1. 检查Node.js版本
node --version # 如果低于22,需要升级
# 2. 使用nvm安装Node.js 22(推荐)
curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.0/install.sh | bash
. "$HOME/.nvm/nvm.sh"
nvm install 22
nvm use 22
# 3. 配置npm国内镜像(加速安装)
npm config set registry https://registry.npmmirror.com
# 4. 全局安装OpenClaw


1133

被折叠的 条评论
为什么被折叠?



