打赏

相关文章

扩散变换器中高效对数线性稀疏注意力机制解析

1. 高效扩散变换器的可训练对数线性稀疏注意力机制解析在视觉生成领域,扩散变换器(Diffusion Transformers, DiTs)已经成为当前最先进的骨干网络。然而,其自注意力机制固有的二次计算复杂度(O(N))从根本上限制了模型向长序列的扩展能力。传统解决方案如T…

手机版浏览

扫一扫体验

微信公众账号

微信扫一扫加关注

返回
顶部