1. FasterNeT介绍
1.1 摘要: 为了设计快速神经网络,许多工作一直致力于减少浮点运算(FLOP)的数量。 然而,我们观察到,FLOP 的减少并不一定会导致延迟的类似程度的减少。 这主要源于每秒浮点运算 (FLOPS) 效率低下。 为了实现更快的网络,我们重新审视流行的算子,并证明如此低的 FLOPS 主要是由于算子的频繁内存访问,尤其是深度卷积。 因此,我们提出了一种新颖的部分卷积(PConv),通过同时减少冗余计算和内存访问,更有效地提取空间特征。 在我们的 PConv 的基础上,我们进一步提出了 FasterNet,这是一个新的神经网络系列,它在各种设备上比其他网络获得更高的运行速度,而不会影响各种视觉任务的准确性。 例如,在 ImageNet1k 上,我们的小型 FasterNet-T0 在 GPU、CPU 和 ARM 处理器上分别比 MobileViT-XXS 快 2.8 倍、3.3 倍和 2.4 倍,同时准确度提高 2.9%。 我们的大型 FasterNet-L 实现了令人印象深刻的 83.5% top-1 准确率,与新兴的 Swin-B 相当,同时 GPU 上的推理吞吐量提高了 36%,并节省了 37% 的 CPU 计算时间。
官方论文地址:https://arxiv.o