LLM 幻觉抑制:API 调用场景下的创新方法
在仅能通过 API 调用 LLM(无法微调模型权重)的约束下,抑制幻觉的创新点主要集中在 输入侧(Prompt/Context 工程)、解码侧(采样/打分策略)、输出侧(验证与修正) 三个层面。
一、解码与采样层创新(API 可控参数)
1. Self-Consistency(自一致性投票)
做法:同一 prompt 用 temperature>0 采样 N 条答案,对最终答案做"多数投票"或"语义聚类"。
核心原理:
- 幻觉是"概率分布尾部"的随机事件,正确答案才是"高概率众数"。
- 对 N 条独立采样路径,正确答案在多次采样中重复出现的概率远高于错误答案——用蒙特卡洛的"多数稳定性"过滤随机性幻觉。
API 层实现:调用 N 次 completions(或一次 n=N),再做投票/聚类。
2. Chain-of-Verification (CoVe, Meta 2023)
做法:先生成

订阅专栏 解锁全文
395

被折叠的 条评论
为什么被折叠?



