1、BLEU指标:评估一种语言翻译成另一种语言质量的指标,他的质量好坏定义为与人类翻译的一致性程度,取值[0,1]越接近1越好


2、ROUGE
他是评判覆盖率,只有出现与原句子不同的词才是错误的

3、PPL
他是用来度量一个概率分布或者概率模型预测样本的好坏程度
概率值:给测试集赋予更高概率的语言模型更好,因为在测试集中句子都是正常句子的情况下,模型训练完之后,在测试集上概率越高越好

句子概率越高,模型越好,迷惑度越小
1、BLEU指标:评估一种语言翻译成另一种语言质量的指标,他的质量好坏定义为与人类翻译的一致性程度,取值[0,1]越接近1越好


2、ROUGE
他是评判覆盖率,只有出现与原句子不同的词才是错误的

3、PPL
他是用来度量一个概率分布或者概率模型预测样本的好坏程度
概率值:给测试集赋予更高概率的语言模型更好,因为在测试集中句子都是正常句子的情况下,模型训练完之后,在测试集上概率越高越好

句子概率越高,模型越好,迷惑度越小
2507
1023
514

被折叠的 条评论
为什么被折叠?
