GoogLeNet网络结构详解与模型的搭建[通俗易懂]

首先给出三个链接：

1. GoogLeNet网络结构详解视频

2. 使用pytorch搭建GoogLeNet网络并训练

3. 使用tensorflow搭建GoogLeNet网络并训练

GoogLeNet在2014年由Google团队提出（与VGG网络同年，注意GoogLeNet中的L大写是为了致敬LeNet），斩获当年ImageNet竞赛中Classification Task (分类任务) 第一名。原论文名称是《Going deeper with convolutions》，下面是该网络的缩略图，由于原论文提供的图太大，我将原图放在博文的最后。

GoogLeNet网络结构详解与模型的搭建[通俗易懂]

首先说说该网络中的亮点：

（1）引入了Inception结构（融合不同尺度的特征信息）

（2）使用1×1的卷积核进行降维以及映射处理（虽然VGG网络中也有，但该论文介绍的更详细）

（3）添加两个辅助分类器帮助训练

（4）丢弃全连接层，使用平均池化层（大大减少模型参数，除去两个辅助分类器，网络大小只有vgg的1/20）

接着我们来分析一下Inception结构：

GoogLeNet网络结构详解与模型的搭建[通俗易懂]

左图呢，是论文中提出的inception原始结构，右图是inception加上降维功能的结构。

先看左图，inception结构一共有4个分支，也就是说我们的输入的特征矩阵并行的通过这四个分支得到四个输出，然后在在将这四个输出在深度维度（channel维度）进行拼接得到我们的最终输出（注意，为了让四个分支的输出能够在深度方向进行拼接，必须保证四个分支输出的特征矩阵高度和宽度都相同）。

分支1是卷积核大小为1×1的卷积层，stride=1，

分支2是卷积核大小为3×3的卷积层，stride=1，padding=1（保证输出特征矩阵的高和宽和输入特征矩阵相等），

分支3是卷积核大小为5×5的卷积层，stride=1，padding=2（保证输出特征矩阵的高和宽和输入特征矩阵相等），

分支4是池化核大小为3×3的最大池化下采样，stride=1，padding=1（保证输出特征矩阵的高和宽和输入特征矩阵相等）。

再看右图，对比左图，就是在分支2，3，4上加入了卷积核大小为1×1的卷积层，目的是为了降维，减少模型训练参数，减少计算量，下面我们看看1×1的卷积核是如何减少训练模型参数的。同样是对一个深度为512的特征矩阵使用64个大小为5×5的卷积核进行卷积，不使用1×1卷积核进行降维话一共需要819200个参数，如果使用1×1卷积核进行降维一共需要50688个参数，明显少了很多。

GoogLeNet网络结构详解与模型的搭建[通俗易懂]

每个卷积层的卷积核个数如何确定呢，下面是原论文中给出的参数列表，对于我们搭建的Inception模块，所需要使用到参数有#1×1, #3x3reduce, #3×3, #5x5reduce, #5×5, poolproj，这6个参数，分别对应着所使用的卷积核个数。

GoogLeNet网络结构详解与模型的搭建[通俗易懂]

下面这幅图是我将Inception模块所使用到的参数信息标注在每个分支上，其中#1×1对应着分支1上1×1的卷积核个数，#3x3reduce对应着分支2上1×1的卷积核个数，#3×3对应着分支2上3×3的卷积核个数，#5x5reduce对应着分支3上1×1的卷积核个数，#5×5对应着分支3上5×5的卷积核个数，poolproj对应着分支4上1×1的卷积核个数。

GoogLeNet网络结构详解与模型的搭建[通俗易懂]

接着下来在看看辅助分类器结构，网络中的两个辅助分类器结构是一模一样的，如下图所示：

GoogLeNet网络结构详解与模型的搭建[通俗易懂]

着两个辅助分类器的输入分别来自Inception(4a)和Inception(4d)。

辅助分类器的第一层是一个平均池化下采样层，池化核大小为5×5，stride=3

第二层是卷积层，卷积核大小为1×1，stride=1，卷积核个数是128

第三层是全连接层，节点个数是1024

第四层是全连接层，节点个数是1000（对应分类的类别个数）

关于模型的搭建与训练代码放在我的github中，大家可自行下载使用：

https://github.com/WZMIAOMIAO/deep-learning-for-image-processing

pytorch版本在pytorch_learning文件夹中，tensorflow版本在tensorflow_learning文件夹中.

最后给出我标注了部分信息的GoogLeNet网络结构图：

GoogLeNet网络结构详解与模型的搭建[通俗易懂]

GoogLeNet网络结构详解与模型的搭建[通俗易懂]

什么是乾坤八卦

好想法是什么意思

最新文章

苹果 2024 款 14/16 英寸 M4 MacBook Pro 开启预购，12999 元起

Counterpoint：苹果 iPhone 16 系列在美国前 4 周销量比 15 系列低 1%

美国旧金山签订 2.12 亿美元合同，淘汰轨道交通使用 26 年软盘控制系统

索尼声称 Pro 机型早在 PS5 标准版游戏机发售前就已开始开发

酷比魔方掌玩 mini 2 4G 版平板电脑 256GB 储存空间版本开售，889 元

苹果2024年第四财季营收949.3亿美元 iPhone销量超预期

扶苏怎么死的（扶苏的真正死因）

直升机螺旋桨（为什么直升机有两个螺旋桨）

曹操用人之道(曹操用人之道的故事)

全运会的口号(口号充满霸气)

最新评论

标签

关注我们么么哒！

GoogLeNet网络结构详解与模型的搭建[通俗易懂]

什么是乾坤八卦

好想法是什么意思

最新文章

苹果 2024 款 14/16 英寸 M4 MacBook Pro 开启预购，12999 元起

最新评论

标签

关注我们 么么哒！

关注我们的公众号

关注我们么么哒！