VGG-16
Vgg16是牛津大学VGG组提出来的,相比于AlexNet来说,AlexNet的一个改进是采用连续的几个4*3的卷积核来代替AlexNet中的较大的卷积核(11*11,5*5)。前面我们也说过了使用小卷积核是优于大的卷积核的,因为多层非线性层可以增加网络深度来保证学习到更加复杂的模式,而且代价还会更小,也就是参数会更少。
VGG-16 网络,VGG-16 网络没有那么多超参数(不是说训练参数,它的训练参数是1.38亿),这是一种只需要专注于构建卷积层的简单网络。
连续两个卷积层,都是 64 个 3×3 的过滤器对输入图像进行卷积,输出结果是224×224×64,因为使用了 same 卷积,通道数量也一样。就是说先用一个64 个 3×3 的过滤器对输入图像进行卷积,然后输出再用一个64 个 3×3 的过滤器对输入图像进行卷积。
接下来创建一个池化层,池化层将输入图像进行压缩,从 224×224×64 缩小到 112×112×64。然后又是若干个卷积层,使用 128 个过滤器,以及一些 same 卷积,然后进行池化,可以推导出池化后的结果是56×56×128,接着再用 256 个相同的过滤器进行三次卷积操作