基本介绍
- 核心特点:使用重复的3×3卷积核构建深层网络,显著提升图像分类性能
网络结构
核心配置
-
包含 16-19个权重层(VGG16/VGG19为典型代表)
-
仅使用3×3卷积核和2×2最大池化
-
卷积层深度逐步增加(64→128→256→512通道)
-
全连接层:3层(4096→4096→1000神经元)
设计特点
-
小卷积核堆叠:
多个3×3卷积替代大卷积核(等效5×5/7×7感受野),参数更少且引入更多非线性。 -
统一结构:
所有卷积层使用相同padding保持空间分辨率,池化层负责下采样。 -
全连接层简化:
最后3层全连接用于分类,输出层为ImageNet的1000类softmax。
优缺点
优点:
-
结构简单规整,易于复现。
-
预训练模型广泛用于迁移学习。
-
深层特征表达能力优异
缺点:
-
参数量大(VGG16约1.38亿参数),内存消耗大,并且容易造成过拟合。
-
全连接层计算成本高。