OpenClaw + Qwen本地大模型部署教程:Mac上打造零Token成本的AI助手

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

作为一个每天和Token账单打交道的人,我一直渴望真正的“调用自由”。上一篇文章我们讲了Ollama通用方案,这次聚焦通义千问(Qwen)系列——从Qwen2.5到最新的Qwen3.5,如何在Mac上完美运行,并与OpenClaw无缝对接。本文将提供完整的配置代码、硬件选型指南和避坑方案,让你彻底告别Token焦虑。

一、为什么选择Qwen系列本地部署?

1.1 Qwen的核心优势

通义千问(Qwen)是阿里云开源的大语言模型系列,在中文理解、代码生成和推理能力上表现优异。最新发布的Qwen3.5系列更是首个原生视觉-语言模型家族,支持多模态理解,在TAU2-Bench评测中得分86.7。

特性 Qwen系列优势
中文能力 原生中文训练,理解和生成远超国外开源模型
模型规格 从0.6B到235B全覆盖,适配各种硬件
量化支持 Ollama提供多种量化版本(Q4_0/Q8_0等),内存友好
上下文长度 最高支持128K-256K token,处理长文档无压力
多模态能力 Qwen3.5支持图像理解,可处理截图、图片等

1.2 Mac硬件选型指南

在Mac上跑Qwen,内存(统一内存)是决定性因素。以下是基于实测的硬件建议:

Mac内存 推荐模型及量化 文件大小 适用场景
8GB Qwen2.5 7B (Q4_0) / Qwen3 4B (Q4_0) 4-5GB 轻量对话、文件整理、基础问答
16GB Qwen2.5 7B (Q8_0) / Qwen3.5 9B (Q4_0) 5-9GB 复杂推理、代码生成、中等上下文
24-32GB Qwen3.5 14B (Q4_0) / 35B (Q4_0) 8-18GB 长文本处理、多模态任务、专业应用
64GB+ Qwen3 72B (Q4_0) / 235B MoE 37GB+ 科研、全场景覆盖

小知识:量化版本中,Q4_0是4-bit量化,文件最小、速度最快,适合内存有限的设备;Q8_0是8-bit量化,在速度和精度间取得平衡。

二、Ollama部署Qwen全流程

2.1 安装Ollama

# 使用Homebrew安装(推荐)
brew install ollama

# 或从官网下载安装包
# 访问 https://ollama.com/download 下载macOS版本

# 启动Ollama服务(后台运行)
ollama serve

# 验证安装
ollama --version  # 应显示 0.5.0 或更高

设置开机自启

# 将Ollama添加到登录项
# 系统设置 → 通用 → 登录项 → 点击"+"添加Ollama

2.2 下载Qwen模型

Ollama支持全系列Qwen模型,包括最新的Qwen2.5和Qwen3.5。

# 查看可用Qwen模型列表
ollama list | grep qwen

# 下载Qwen2.5 7B(中文能力强,推荐)
ollama pull qwen2.5:7b-instruct-q4_0  # 约4.1GB

# 下载Qwen2.5 14B(需要16GB+内存)
ollama pull qwen2.5:14b-instruct-q4_0  # 约8.2GB

# 下载Qwen3.5 9B("小钢炮",平衡之选)
ollama pull qwen3.5:9b-instruct-q4_0  # 约5.3GB

# 下载Qwen3.5 35B(需要24GB+内存,支持多模态)
ollama pull qwen3.5:35b-instruct-q4_0  # 约20GB

# 验证下载
ollama list

模型选择建议

  • 16GB Mac:首选qwen2.5:7b-instruct-q4_0qwen3.5:9b-instruct-q4_0
  • 32GB Mac:可以考虑qwen2.5:14b-instruct-q4_0
  • 需要多模态:选qwen3.5:35b-instruct-q4_0(需足够内存)

2.3 测试模型运行

# 直接在终端对话
ollama run qwen2.5:7b-instruct-q4_0

# 输入测试问题
>>> 介绍一下通义千问模型的特点
>>> /bye  # 退出

# 测试Ollama的OpenAI兼容API
curl http://localhost:11434/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen2.5:7b-instruct-q4_0",
    "messages": [{"role": "user", "content": "你好,请做个自我介绍"}],
    "stream": false
  }'

如果返回正常,说明Ollama服务已经就绪。

三、OpenClaw安装与配置

3.1 安装OpenClaw

OpenClaw需要Node.js 22或更高版本。

# 1. 检查Node.js版本
node --version  # 如果低于22,需要升级

# 2. 使用nvm安装Node.js 22(推荐)
curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.0/install.sh | bash
. "$HOME/.nvm/nvm.sh"
nvm install 22
nvm use 22

# 3. 配置npm国内镜像(加速安装)
npm config set registry https://registry.npmmirror.com

# 4. 全局安装OpenClaw

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏 ,讲透 AI 如何接管脏活累活

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值