原理细节

  • 结构: 由输入层、隐藏层(可多层)和输出层组成,信息单向流动(无循环连接)。
  • 全连接: 每层神经元与下一层全部连接,权重矩阵 和偏置向量 描述第 层参数。
  • 激活函数: 引入非线性,常见函数包括:
    • ReLU:
    • Sigmoid:
    • Tanh:
  • 前向传播: 输入 逐层计算输出: 最终输出 为输出层)。

梯度计算与反向传播

  • 损失函数: 常用交叉熵(分类)或均方误差(回归),例如:

  • 反向传播:

    1. 计算输出层误差
    2. 反向传播至隐藏层:
    3. 计算梯度:
  • 参数更新: 使用优化算法(如SGD、Adam)更新参数:

典型前馈神经网络

多层感知机(Multilayer Perceptron, MLP)

  • 结构: 基础前馈网络,包含至少一个隐藏层,全连接结构。
  • 特点:
    • 使用Sigmoid/Tanh/ReLU等激活函数。
    • 适用于表格数据、简单分类/回归任务。
  • 典型应用: 信用卡欺诈检测、房价预测。

卷积神经网络(Convolutional Neural Network, CNN)

  • 核心结构:
    • 卷积层(局部连接+参数共享)
    • 池化层(降采样)
    • 末端全连接层
  • 创新点:
    • 空间特征自动提取
    • 显著降低参数量
  • 经典变体:
    • LeNet-5(手写数字识别)
    • AlexNet(ImageNet突破)
    • ResNet(残差连接解决梯度问题)

自动编码器(Autoencoder)

  • 结构特点:
    • 对称的编码器-解码器结构
    • 瓶颈层实现数据压缩
  • 变体类型:
    • 降噪自编码器(抗噪声)
    • 稀疏自编码器(特征选择)
    • 变分自编码器(VAE,生成模型)
  • 应用场景: 数据降维、异常检测、图像去噪

深度信念网络(Deep Belief Network, DBN)

  • 混合结构:
    • 底层使用受限玻尔兹曼机(RBM)
    • 顶层为前馈网络
  • 训练方式: 逐层贪婪预训练+微调
  • 优势: 解决深层网络初始化难题
  • 应用: 早期语音识别、推荐系统

径向基函数网络(Radial Basis Function Network, RBFN)

  • 特殊结构:
    • 隐藏层使用径向基函数(如高斯函数)
    • 输出层为线性组合
  • 数学表达:
  • 特点: 局部响应特性,适合函数逼近

前馈型生成模型

  • **生成对抗网络(GAN)**的前馈部分:
    • 生成器本质是深度前馈网络
    • 输入噪声向量,输出生成数据
  • 示例: DCGAN(深度卷积生成网络)

发展趋势

  1. 结构创新: 残差连接(ResNet)、密集连接(DenseNet)。
  2. 动态前馈: 条件计算(MoE混合专家系统)。
  3. 神经架构搜索: 自动优化网络结构。
  4. 脉冲神经网络: 引入生物神经元特性。