文章主要内容和创新点总结
一、主要内容
该研究提出一种Spike-driven Transformer(脉冲驱动Transformer),旨在融合脉冲神经网络(SNNs)的低功耗优势与Transformer的高任务精度。核心是将脉冲驱动范式(事件驱动、二进制脉冲通信)全面融入Transformer架构,通过重新设计关键模块和调整网络连接方式,实现仅依赖稀疏加法运算的高效推理,同时保持优异的任务性能。
研究在静态数据集(ImageNet-1K、CIFAR-10/100)和神经形态数据集(CIFAR10-DVS、DVS128 Gesture)上进行了验证,在ImageNet-1K上实现77.1%的top-1准确率,达到SNN领域的当前最佳水平,且能量消耗远低于传统Transformer和现有脉冲Transformer。
二、核心创新点
- 全脉冲驱动架构设计:首次将脉冲驱动范式完整融入Transformer,网络全程仅涉及稀疏加法运算,无乘法操作,硬件友好,可高效部署于神经形态芯片(如TrueNorth、Loihi等)。
- 脉冲驱动自注意力机制(SDSA):替换传统自注意力中的矩阵乘法、softmax和缩放操作,采用掩码(Hadamard乘积)、列求和与脉冲神经元层实现注意力功能,在token和通道维度均具有线性复杂度,能量消耗较传统自注意力降低87.2倍。
- 膜电位残差连接(Membrane Shortcut):

订阅专栏 解锁全文

432

被折叠的 条评论
为什么被折叠?



