微调Qwen1.8

原创已于 2026-05-13 09:14:48 修改 · 198 阅读

3 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#人工智能 #自然语言处理

于 2026-05-12 10:22:46 首次发布

AI 专栏收录该内容

17 篇文章

订阅专栏

1、准备环境

1.1、打开实例

打开魔搭平台免费实例：https://www.modelscope.cn/my/mynotebook

1.2、搭建LLaMA-Factory环境

搭建LLaMA-Factory环境，参见我的另一篇文章：https://blog.csdn.net/willhu2008/article/details/147999715?spm=1011.2415.3001.5331

1.3、下载模型

找到Qwen/Qwen1.5-1.8B-Chat，根据提示下载。

1.4、测试模型

模型下载完成后，先来运行一下试试。

创建模型运行命令，在LLaMA-Factory/examples/inference目录下，将llama3.yaml复制并重命名为QWen1.5_1.8b.yaml（名称不唯一），将内容更改为以下的内容，并保存（一定记得保存）。

model_name_or_path: ../Qwen1.5-1.8B-Chat
template: chatml
infer_backend: huggingface  # choices: [huggingface, vllm, sglang]
trust_remote_code: true

进入LLaMA-Factory目录下，激活虚拟环境:

source env/bin/activate

输入下列命令运行模型：

llamafactory-cli chat examples/inference/qwen1.5_1.8b.yaml

等待一段时间出现"User:"后，就可以输入问题进行对话了。

2、模型微调

2.1、修改微调训练数据

首先对大模型的身份进行调整。微调文件为：/LLaMA-Factory/data/identity.json。将其下载后，替换所有的{{author}}和{{name}}，再上传到该文件夹。

2.2 添加、注册自定义的训练数据集

也可以将自定义的数据集上传到data文件夹，并在/mnt/workspace/LLaMA-Factory/data/dataset_info.json中注册：

添加格式如下：

  "my_data_4": {    # 在webui的下拉框中显示的名称
    "file_name": "dataset_xx.json",   # 自定义数据集名称
    "formatting": "alpaca"            # 数据格式
  },
  "my_data_5": {
    "file_name": "dataset_yy.json",
    "formatting": "alpaca"
  }

2.3 利用WebUI微调

输入命令：

llamafactory-cli webui

显示错误：

退出虚拟环境：deactivate，运行命令：

wget https://cdn-media.hf-mirror.com/frpc-gradio-0.3/frpc_linux_amd64 -O /root/.cache/huggingface/gradio/frpc/frpc_linux_amd64_v0.3

注意：wget后不能留太多空格，否则显示：“wget　: 未找到命令”。

如果没有那个目录，则先用sudo创建：

sudo mkdir -p /root/.cache/huggingface/gradio/frpc

如果下载速度很慢，可以用系统浏览器先下载到电脑，然后上传，再复制，如

cp ./res/frpc_linux_amd64 /root/.cache/huggingface/gradio/frpc/frpc_linux_amd64_v0.3

安装成功后，修改权限：

chmod +x /root/.cache/huggingface/gradio/frpc/frpc_linux_amd64_v0.3

再次运行命令：llamafactory-cli webui，显示：

* Running on local URL:  http://0.0.0.0:7860
* Running on public URL: https://3b1fbc5c5cf19b0ca1.gradio.live
 
This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)

不用理会，直接点击打开http://0.0.0.0:7860或https://3b1fbc5c5cf19b0ca1.gradio.live

在打开的网页上，参考下图修改响应参数。

参数配置建议：

1. 基础设置
学习率：2e-4
训练轮数：8~10
截断长度：1024
批次大小：4
梯度累积：2
随机种子：42
2. LoRA 设置
LoRA 秩：8
LoRA Alpha：16
LoRA Dropout：0.05
LoRA 模块：all (全部训练)
3. 数据设置
验证集比例：0.1
预处理批次：8
打乱数据：✅ 开启
4. 保存设置
保存步数：50
日志步数：5
只保存最优模型：✅ 开启