个人微调qwen2-7B笔记

最新推荐文章于 2026-04-06 03:51:44 发布

原创

最新推荐文章于 2026-04-06 03:51:44 发布 · 1.5k 阅读

标签

#笔记

收录于

大模型：qwen2-7B

数据集：魔搭社区

可视化工具：swanlab

数据集下载：直接下载，别用git，会因为文件太大，git版本等问题出错

微调代码：

import json
import pandas as pd
import torch
from datasets import Dataset
from modelscope import snapshot_download, AutoTokenizer
from swanlab.integration.huggingface import SwanLabCallback
from peft import LoraConfig, TaskType, get_peft_model
from transformers import AutoModelForCausalLM, TrainingArguments, Trainer, DataCollatorForSeq2Seq
import os
import swanlab

def dataset_jsonl_transfer(origin_path, new_path):
    """
    将原始数据集转换为大模型微调所需数据格式的新数据集
    """
    messages = []

    # 读取旧的JSONL文件
    with open(origin_path, "r") as file:
        for line in file:
            # 解析每一行的json数据
            data = json.loads(l

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Gu_erye

关注关注

6
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【Qwen2微调实战】LLaMA-Factory框架对Qwen2-7B模型的微调实践

热门推荐

寻道AI，探索AI无限可能！

07-29

2万+

在人工智能的浪潮中，大型语言模型（LLMs）正逐渐成为研究和应用的热点。它们在自然语言处理（NLP）的各个领域，如文本生成、翻译、问答等任务中展现出了卓越的能力。Qwen2-7B模型，作为该领域的佼佼者，不仅因其庞大的参数量和强大的表示能力受到关注，更因其在微调后能够更好地适应特定任务而备受关注。本文将详细介绍如何利用LLaMA-Factory这一高效的微调框架对Qwen2-7B进行微调，以期达到提升模型在特定任务上的表现。

参与评论您还未登录，请先登录后发表或查看评论

【Qwen2微调实战】Lora微调Qwen2-7B-Instruct实践指南

寻道AI，探索AI无限可能！

07-24

1万+

在人工智能领域，自然语言处理（NLP）一直是研究的热点之一。随着深度学习技术的不断发展，大型预训练语言模型（如Qwen2-7B-Instruct）在理解与生成自然语言方面取得了显著的进展。然而，这些模型往往需要大量的计算资源和数据来进行微调，以适应特定的应用场景。Lora微调技术作为一种高效的模型优化手段，为解决这一问题提供了新的思路。本文将深入探讨Lora微调技术在Qwen2-7B-Instruct模型上的应用，旨在为读者提供一种高效、低成本的模型定制化方法。

Qwen2 阿里最强开源大模型（Qwen2-7B）本地部署、API调用和WebUI对话机器人

老牛啊

06-12

1万+

阿里云正式开源通义千问Qwen2系列模型，其中Qwen2-72B成为全球性能最强的开源模型，在全球权威测评中，性能超过美国最强开源模型Llama3-70B，也超过文心4.0、豆包pro、混元pro等众多中国闭源大模型。今天老牛同学部署和体验Qwen2-7B中等尺寸模型，包括本地部署、API嗲用和WebUI对话客户端……

Qwen2大语言模型微调、导出、部署实践

liguiyuan的博客

06-16

3745

上篇文章：我们介绍了Qwen1.5 大语言模型使用LLaMA-Factory 来微调，这篇文章我们介绍一下微调后模型的导出、部署。

[大模型]Qwen2-7B-Instruct Lora 微调

FL1623863129的博客

06-15

4518

LoraConfig这个类中可以设置很多参数，但主要的参数没多少，简单讲一讲，感兴趣的同学可以直接看源码。task_type：模型类型：需要训练的模型层的名字，主要就是attention部分的层，不同的模型对应的层的名字不同，可以传入数组，也可以字符串，也可以正则表达式。rlora的秩，具体可以看Lora原理lora_alphaLora alaph，具体作用参见Lora原理Lora的缩放是啥嘞？当然不是r（秩），这个缩放就是, 在这个LoraConfig中缩放就是4倍。

只需30分钟，微调阿里 Qwen2-7B，搭建专属 AI 客服

weixin_43829633的博客

06-07

3114

LLaMA-Factory 在data文件夹中提供了多个训练数据集示例，支持alpaca或sharegpt格式，不过我这里使用的是自己提前导出来做过处理的自定义数据集。自定义数据集选用alpaca因为我只有标注后的问答对，所以只需要填充和output部分即可，下面是部分数据，保存为 bajigo.json，并上传到 LLaMA-Factory 的 data 目录下。"instruction": "我能建两份菜单然后自行切换吗","output": "你好，暂不支持同时创建多个菜单。

亲测有效！Qwen3-1.7B轻松实现个性化AI

weixin_36059856的博客

01-25

350

本文介绍了如何在星图GPU平台上自动化部署Qwen3-1.7B镜像，快速构建个性化AI对话应用。依托平台预置环境，用户可零配置启动Jupyter沙盒，结合LoRA微调实现角色化表达，典型应用于客服人设定制、教育陪练及个人数字助手等场景，显著降低大模型落地门槛。

OpenClaw社区案例：Qwen2.5-VL-7B在个人项目中的10种创新用法

最新发布

weixin_33193177的博客

04-06

316

本文介绍了如何在星图GPU平台上自动化部署Qwen2.5-VL-7B-Instruct-GPTQ镜像，实现多模态AI应用的快速搭建。该镜像支持智能图片分类、手写笔记数字化等创新场景，例如通过自动化框架OpenClaw结合Qwen2.5-VL-7B，可高效完成证件照处理、植物健康监测等任务，显著提升个人项目效率。

Qwen2（Qwen1.5阿里）微调实战qwen1.5-7b

大漠帝国的博客

04-02

6930

Qwen1.5-SFT(阿里, Ali), Qwen_Qwen1.5-2B-Chat/Qwen_Qwen1.5-7B-Chat微调(transformers)/LORA(peft)/推理。

Qwen2.5-7B大模型微调记录

黄钢的博客

11-26

6261

研究需要，需要搞一个大模型出来，没有太多的时间自己训练，准备用现成的开源大模型，然后结合研究方向进行微调前前后后折腾大半个月，总算做完了第一个微调的大模型，模型基于阿里的千问2.5大模型，然后微调的训练集是一些法律相关的问题记录一下流程。

Qwen7b微调保姆级教程

Python_Ai_Road的博客

09-13

1万+

前方干货预警：这可能是你能够找到的，最容易理解，最容易跑通的，适用于各种开源LLM模型的，同时支持多轮和单轮对话数据集的大模型高效微调范例。我们构造了一个修改大模型自我认知的3轮对话的玩具数据集，使用QLoRA算法，只需要5分钟的训练时间，就可以完成微调，并成功修改了LLM模型的自我认知(以Qwen7b-Chat为例)。公众号算法美食屋后台回复关键词：torchkeras，可获取本文noteboo...

大模型【Qwen2-7B本地部署（WEB版）】（windows）

略知12的博客

07-11

7602

大模型是截止2024年上半年最强的AI，Qwen2是刚出来的号称国内最强开源大模型。这是大模型系列的第一篇文章，旨在快速部署看看最近出来的大模型效果怎么样，效果ok的话就微调自己的GPTs了。

Windows微调Qwen2-7B-Instruct-甄嬛

Fightever_的博客

08-23

1873

zip(model_inputs.input_ids,generated_ids)是将这两部分打包成元组列表，每个元组包含两个列表中对应位置的元素，这样，就可以在列表推导式中同时遍历输入令牌和生成的令牌。最后，output_ids[len(input_ids):] for input_ids,output_ids in zip(model_inputs.input_ids,generated_ids)是列表推导式，他提取outpu_ids中新生成的token，并将这些部分收集到新列表。

使用Qwen-7B微调，训练自己的数据集

AI小生~小陶的博客

02-21

1万+

使用Qwen-7B进行lora和qlora的微调训练

QLU-AI助手初次微调Qwen2-7B-Instruct总结

Fightever_的博客

08-29

1865

因此需要辅助RAG检索增强来提高模型效果，通过给Excel的每条数据集添加相应的标签来进一步提高检索速度及准确性，将Excel表转换成向量库，让模型能直接识别像向量库内容，从而在用户输入的时候，可以先让模型来生成与用户输入有关内容，再使模型检索向量库对应内容，将改内容作为输入送给模型，模型根据向量库内容和之前生成的回答来生成最终回答。我以为是因为"input"键的值一直设置为""导致的，所以先尝试修改数据集，将"input"的值全部设置为" "；根据上文，在微调命令中已经添加了数据集路径，但是仍然报错。

开源模型应用落地-qwen2-7b-instruct-LoRA微调-Axolotl-单机多卡-RTX 4090双卡（七）

以微薄之力，予他人些许温暖.

08-16

1万+

使用Axolotl高效微调qwen2-7b-instruct

阿里最强开源大模型本地部署、API调用和WebUI对话机器人

m0_63171455的博客

06-13

5344

老牛同学验证和对比，在文本推理上，Qwen2-7B确实比Llama3-8B要快很多。后续老牛同学中文文本推理相关的API接口，就主要采用更快Qwen2-7B大模型了~

阿里qwen微调

ShengFangZaiXiaMo的博客

04-22

2111

阿里qwen大模型微调

swift自定义数据集微调Qwen-7B大模型，转换模型后使用ollama跑起来

盛世芳华

08-27

9130

-model_name 阿盛 Master Coder \--model_author 盛世芳华 LLM_ROME \微调时，只需指定--dataset为本地csv文件路径即可，csv文件的格式如下：instruction是问题，input大概能理解为问题背景，output为答案，数据集准备好以后就可以直接进行训练。ms-swift/docs/source/LLM/自定义与拓展.md at main · modelscope/ms-swift (github.com)

【代码详解】大模型微调入门：SFT Qwen2-7B，基于 Hugging Face Transformers库

qq_43799400的博客

09-04

7066

【代码详解】大模型微调入门：SFT Qwen2-7B，基于 Hugging Face Transformers库