本文使用FasterNet的Block改进YoloV9,对FasterNet的Block做了适当的修改,使其能够适配YoloV9,可以替换YoloV9的Bottleneck模块。
论文翻译:《CVPR2023年最新的网络,基于部分卷积PConv,性能远超MobileNet,MobileVit
为了设计快速神经网络,许多工作都专注于减少浮点运算(FLOPs)的数量。然而,我们观察到这样的flop减少并不一定会导致类似水平的延迟减少。这主要源于低效的低浮点运算每秒(FLOPS)。为了实现更快的网络,我们重新考察了流行的运算符,并证明了这样低的FLOPS主要是由于运算符频繁的内存访问,特别是深度卷积。因此,我们提出了一种新的部分卷积(PConv),通过同时减少冗余计算和内存访问,更有效地提取空间特征。在PConv的基础上,我们进一步提出了fastternet,这是一种新的神经网络家族,它在各种设备上获得了比其他网络更高的运行速度,而不影响各种视觉任务的准确性。例如,在ImageNet- 1k上,我们的小型FasterNet-T0分别比GPU、CPU和ARM处理器上的MobileViT-XXS快3.1×、3.1×和2.5×,同时精度提高了2.9%。我们的大型fastnet-l达到了令人印象深刻的83.5%的top-1精度,与Swin-B相当,同时在GPU上具有49%的更高推断吞吐量,以及在CPU上节省42%的计算时间。代码可从https://github.com/JierunChen/FasterNe