VGG模型结构解析

基于VGG16网络的简单解构

参考链接

VGG16分为16层,我们主要讲前面的前几层(越详细越好吧,后面是一样的)

看懂一些式子表达:

Conv3-512 → 第三层卷积后维度变成512;

Conv3_2 s=2 → 第三层卷积层里面的第二子层,滑动步长等于2(每次移动两个格子)

好了,我们有了以上的知识可以考试剖析VGG16卷积神经网络了

1、从INPUT到Conv1

如图, 输入数据是224*224*3的RGB图像

Conv1_1的卷积核尺寸为3*3*3, 所以经过Conv1_1处理后, 输出数据是 222*222*1.
但是在卷积之前, 数据进行了padding处理, 保持了尺寸不变, 因此输出数据是 224*224*1. 3*3*1的卷积核有64个 所以输出数据是 224*224*64 maxpool的尺寸是2*2*64, 有224*(1/2)=112, 即第一次maxpool之后数据是 112*112*64

2、Conv1到Conv2

如上图所示, Conv2的有128个卷积核, 再经过maxpool, 最终的输出为 56*56*128

3、Conv3到Conv4

Conv3有256个卷积核, 经过maxpool, 最终输出为28*28*256

5、Conv4到Conv5

Conv4有512个卷积核, 经过maxpool, 最终输出为14*14*512


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!