1、整体思维导图

2、个人收获
这篇论文在理论上对于我来说可能就是让我大致了解了这个领域(因为我的研究方向不是这方面),看完以后也没有看得特别懂(说实话)。
更多的收获应该是在论文的写作思路上吧
3、下面欣赏论文中的图和表:
1)不同方法的性能对比

2)动态稀疏窗口注意力,每一个子集的格子数是相同的。

3)总体架构

4)表1

5)表2

6)表3

7)表4

8)表5消除了我们动态稀疏窗口注意力的建模能力和效率

9)表 6 中进一步消除了旋转集分区的有效性

10)表7显示了不同混合窗口形状的结果

11)表8所示,我们的池化操作优于所有其他基线

12)在表 9 中与其他最先进的方法在推理速度和性能准确性方面进行了比较




















