LLM:评估指标

1、BLEU指标:评估一种语言翻译成另一种语言质量的指标,他的质量好坏定义为与人类翻译的一致性程度,取值[0,1]越接近1越好

2、ROUGE

他是评判覆盖率,只有出现与原句子不同的词才是错误的

3、PPL

他是用来度量一个概率分布或者概率模型预测样本的好坏程度

概率值:给测试集赋予更高概率的语言模型更好,因为在测试集中句子都是正常句子的情况下,模型训练完之后,在测试集上概率越高越好

句子概率越高,模型越好,迷惑度越小

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值