Huggingface微调数据集

1.垂直领域知识增强

1.1医疗领域 ✅

数据集名称Huggingface链接说明
shibing624/medicalhttps://huggingface.co/datasets/shibing624/medical240万条中文医疗数据集(含预训练、指令微调和奖励数据集)
shibing624/huatuo_medical_qa_sharegpthttps://huggingface.co/datasets/shibing624/huatuo_medical_qa_sharegpt22万条中文医疗对话数据集(华佗项目),ShareGPT格式

1.2金融领域 ✅

数据集名称Huggingface链接说明
BAAI/IndustryInstruction_Finance-Economicshttps://huggingface.co/datasets/BAAI/IndustryInstruction_Finance-Economics12.2万条金融经济领域指令数据,中文占比32.9%

1.3法律领域 ⚠️

未找到Huggingface上公开的法律微调指令数据集。欢迎补充。

2.特定交互风格与角色扮演 ✅

数据集名称Huggingface链接说明
shibing624/roleplay-zh-sharegpt-gpt4-datahttps://huggingface.co/datasets/shibing624/roleplay-zh-sharegpt-gpt4-data7千条中文角色扮演多轮对话数据集,ShareGPT-GPT4格式

3.复杂推理与结构化输出

3.1数学推理 ✅

数据集名称Huggingface链接说明
flagopen/InfinityMATHhttps://huggingface.co/datasets/flagopen/InfinityMATH程序化数学推理指令微调数据集,支持CoT/PoT方法,CIKM 2024论文

3.2代码辅助 ⚠️

未在huggingface找到专门的代码微调指令数据集。通用指令数据集中可能包含部分代码数据,但专门针对代码的微调数据集(如CodeAlpaca、Magicoder等)需要另行搜索。

4.对齐人类偏好与安全 ✅

数据集名称Huggingface链接说明
shibing624/DPO-En-Zh-20k-Preferencehttps://huggingface.co/datasets/shibing624/DPO-En-Zh-20k-Preference2万条中英文偏好数据集,适用于DPO/RLHF
liyucheng/zhihu_rlhf_3khttps://huggingface.co/datasets/liyucheng/zhihu_rlhf_3k3千条中文知乎问答偏好数据集
TRIDENT (GitHub发布,Huggingface待查)https://github.com/FishT0ucher/TRIDENT红队测试安全对齐数据集,含26k+18k条有害指令+道德响应

此外,还有大量英文偏好数据集:

Dahoas/full-hh-rlhf

Dahoas/static-hh

OpenAssistant/oasst1

tasksource/oasst1_pairwise_rlhf_reward

5.多语言与本地化适配 ⚠️

未在huggingface找到专门用于多语言微调的中小规模指令数据集。有Lucie项目发布了多语言预训练语料,但更偏向预训练而非微调阶段。

6.长文本与特定格式处理 ✅

数据集名称Huggingface链接说明
THUDM/LongCite-45khttps://huggingface.co/datasets/THUDM/LongCite-45k4.46万条长上下文QA实例(最长支持128k词),附带句子级引文,中英文双语

7.结构化抽取 ⚠️

未在huggingface中找到专门用于结构化抽取微调的公开数据集。华为云文档中提供了一个催收意图识别的场景数据样例,但该数据未开源,仅为业务场景示例。

8.总结汇总表

微调场景是否有Huggingface数据集推荐数据集
医疗领域shibing624/medical, shibing624/huatuo_medical_qa_sharegpt
金融领域BAAI/IndustryInstruction_Finance-Economics
法律领域⚠️未找到公开指令数据集
角色扮演shibing624/roleplay-zh-sharegpt-gpt4-data
数学推理flagopen/InfinityMATH
代码辅助⚠️未找到(需另行搜索)
安全对齐shibing624/DPO-En-Zh-20k-Preference, TRIDENT
多语言⚠️未找到专用微调数据集
长文本THUDM/LongCite-45k
结构化抽取⚠️未找到公开数据集
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值