当模型在“自我一致”的幻觉中越陷越深,推理延迟正在以你想象不到的方式暴涨。
引言:一个被忽视的悖论
大语言模型的自回归推理有一个根深蒂固的“信仰”:每一步生成都依赖于之前所有步骤的输出。这个设计哲学从GPT系列诞生之初就延续至今,几乎成为了语言模型的“第一性原理”。
但ICLR 2026上涌现的一批研究,正在对这个信仰发起前所未有的挑战。问题的核心指向一个概念——自一致性(Self-Consistency) 。
你可能熟悉自一致性作为提升推理准确率的方法:让模型生成多条推理路径,然后投票选出最一致的答案。但ICLR 2026的多项研究表明,当“自一致性”从推理策略异化为模型行为的内在约束时,它正在以前所未有的方式吞噬推理效率。
更直白地说:模型越“固执”地坚持自己过去生成的每一个token,它在面对复杂推理时就越慢、越笨重。
本文将从ICLR 2026最新论文出发,拆解自回归模型的“自一致性”如何从设计优势沦为效率陷阱,并梳理学术界和工业界给出的解决方案。
一、什么是自回归模型的“自一致性”?先搞清楚概念
1.1 自回归的“原罪”:开环推理
在深入讨论之前,我们需要厘清一个概念层级。
传统自回归模型的工作方式是开环(Open Loop) 的:每一个隐藏状态只
订阅专栏 解锁全文

455

被折叠的 条评论
为什么被折叠?



