【微调】一文读懂选择Qwen做RAG应用的全过程（3）

最新推荐文章于 2025-08-14 15:53:51 发布

原创最新推荐文章于 2025-08-14 15:53:51 发布 · 8k 阅读

·

18

·

标签

#大模型工程化

大模型应用实战专栏收录该内容

68 篇文章 ¥129.90 ¥299.90

订阅专栏

在 RAG 场景下，对嵌入模型进行调优可以带来巨大的收益。

为什么需要调优嵌入模型？

开源的通用嵌入模型，比如 BGE-M3，虽然在各种任务上表现都不错，但它毕竟是“通用”的。你的特定领域知识、专业术语或独特的文本结构，通用模型可能无法完全理解。

例如，在医疗领域，“ECG” 和 “EKG” 都是心电图，但通用模型可能认为它们是两个不相关的词。通过调优，你可以教模型理解这类同义词和专业术语，从而在检索时能更精确地匹配用户的问题。

如何调优嵌入模型？

调优嵌入模型的过程，和我们前面讨论的大模型微调有些类似，但数据和目标不同。

1. 数据准备：构建高质量的训练集

这是最关键的一步。你需要准备一个包含正样本和负样本的数据集。

正样本：一对语义相似的文本。例如，一个问题和它对应的标准答案。
负样本：一对语义不相似的文本。例如，一个问题和另一个完全不相关的答案。

数据的质量直接决定了调优后的模型效果。你可以从你的知识库中手动或半自动地构建这些数据。

2. 选择调优方法

有监督微调：这是最常见的方法。你可以使

了解本专栏

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

技术与健康 你的鼓励将是我最大的创作动力！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。