目录
1 Shift-ConvNets模块原理
1.1 Decomposition and Combination of Convolution
1.2 Sparse Dependencies of Large Convolution Kernels
1.3 Intermodule Feature Manipulation
2 YOLOv5中加入Shift-ConvNets模块
2.1 common.py文件配置
2.2 yolo.py配置
2.3 创建添加优化点模块的yolov5x-C3-Shift-ConvNets.yaml
2.4 训练
参考文献
1 Shift-ConvNets模块原理
Shift-ConvNets: Small Convolutional Kernelwith Large Kernel Effectshttps://arxiv.org/pdf/2401.12736最近的研究表明,Vision transformers (ViTs)的卓越性能得益于大的感受野。因此,大型卷积核设计成为使卷积神经网络(CNNs)再次变得出色的理想解决方案。然而,典型的大的卷积核被证明是对硬件不友好的操作,导致与各种硬件平台的兼容性降低。因此,简单地增大卷积核的大小是不明智的。在本文中,我们揭示了小型卷积核和卷积操作可以实现大型内核大小的封闭效果。然后,我们提出了一种shift-wise操作,该操作借助稀疏机制确保CNN捕获长距离依赖关系,同时保持对硬件的友好性。