OpenClaw + Qwen本地大模型部署教程：Mac上打造零Token成本的AI助手

原创

已于 2026-03-11 11:41:02 修改 · 2k 阅读

标签

#macos #人工智能 #ai

于 2026-03-11 11:40:39 首次发布

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏，讲透 AI 如何接管脏活累活

一键订阅

作为一个每天和Token账单打交道的人，我一直渴望真正的“调用自由”。上一篇文章我们讲了Ollama通用方案，这次聚焦通义千问（Qwen）系列——从Qwen2.5到最新的Qwen3.5，如何在Mac上完美运行，并与OpenClaw无缝对接。本文将提供完整的配置代码、硬件选型指南和避坑方案，让你彻底告别Token焦虑。

一、为什么选择Qwen系列本地部署？

1.1 Qwen的核心优势

通义千问（Qwen）是阿里云开源的大语言模型系列，在中文理解、代码生成和推理能力上表现优异。最新发布的Qwen3.5系列更是首个原生视觉-语言模型家族，支持多模态理解，在TAU2-Bench评测中得分86.7。

特性	Qwen系列优势
中文能力	原生中文训练，理解和生成远超国外开源模型
模型规格	从0.6B到235B全覆盖，适配各种硬件
量化支持	Ollama提供多种量化版本（Q4_0/Q8_0等），内存友好
上下文长度	最高支持128K-256K token，处理长文档无压力
多模态能力	Qwen3.5支持图像理解，可处理截图、图片等

1.2 Mac硬件选型指南

在Mac上跑Qwen，内存（统一内存）是决定性因素。以下是基于实测的硬件建议：

Mac内存	推荐模型及量化	文件大小	适用场景
8GB	Qwen2.5 7B (Q4_0) / Qwen3 4B (Q4_0)	4-5GB	轻量对话、文件整理、基础问答
16GB	Qwen2.5 7B (Q8_0) / Qwen3.5 9B (Q4_0)	5-9GB	复杂推理、代码生成、中等上下文
24-32GB	Qwen3.5 14B (Q4_0) / 35B (Q4_0)	8-18GB	长文本处理、多模态任务、专业应用
64GB+	Qwen3 72B (Q4_0) / 235B MoE	37GB+	科研、全场景覆盖

小知识：量化版本中，Q4_0是4-bit量化，文件最小、速度最快，适合内存有限的设备；Q8_0是8-bit量化，在速度和精度间取得平衡。

二、Ollama部署Qwen全流程

2.1 安装Ollama

# 使用Homebrew安装（推荐）
brew install ollama

# 或从官网下载安装包
# 访问 https://ollama.com/download 下载macOS版本

# 启动Ollama服务（后台运行）
ollama serve

# 验证安装
ollama --version  # 应显示 0.5.0 或更高

设置开机自启：

# 将Ollama添加到登录项
# 系统设置 → 通用 → 登录项 → 点击"+"添加Ollama

2.2 下载Qwen模型

Ollama支持全系列Qwen模型，包括最新的Qwen2.5和Qwen3.5。

# 查看可用Qwen模型列表
ollama list | grep qwen

# 下载Qwen2.5 7B（中文能力强，推荐）
ollama pull qwen2.5:7b-instruct-q4_0  # 约4.1GB

# 下载Qwen2.5 14B（需要16GB+内存）
ollama pull qwen2.5:14b-instruct-q4_0  # 约8.2GB

# 下载Qwen3.5 9B（"小钢炮"，平衡之选）
ollama pull qwen3.5:9b-instruct-q4_0  # 约5.3GB

# 下载Qwen3.5 35B（需要24GB+内存，支持多模态）
ollama pull qwen3.5:35b-instruct-q4_0  # 约20GB

# 验证下载
ollama list

模型选择建议：

16GB Mac：首选qwen2.5:7b-instruct-q4_0或qwen3.5:9b-instruct-q4_0
32GB Mac：可以考虑qwen2.5:14b-instruct-q4_0
需要多模态：选qwen3.5:35b-instruct-q4_0（需足够内存）

2.3 测试模型运行

# 直接在终端对话
ollama run qwen2.5:7b-instruct-q4_0

# 输入测试问题
>>> 介绍一下通义千问模型的特点
>>> /bye  # 退出

# 测试Ollama的OpenAI兼容API
curl http://localhost:11434/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen2.5:7b-instruct-q4_0",
    "messages": [{"role": "user", "content": "你好，请做个自我介绍"}],
    "stream": false
  }'

如果返回正常，说明Ollama服务已经就绪。

三、OpenClaw安装与配置

3.1 安装OpenClaw

OpenClaw需要Node.js 22或更高版本。

# 1. 检查Node.js版本
node --version  # 如果低于22，需要升级

# 2. 使用nvm安装Node.js 22（推荐）
curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.0/install.sh | bash
. "$HOME/.nvm/nvm.sh"
nvm install 22
nvm use 22

# 3. 配置npm国内镜像（加速安装）
npm config set registry https://registry.npmmirror.com

# 4. 全局安装OpenClaw