0%

BN 层有什么用?

现在 CNN 网络中,没有不加 BN 层,来优化网络的,但是一直不怎么清楚原理,所以,在这里探究一下。

虽然,这里主要针对的是 CNN 之后的 BN 层,但是,其中的部分原理,对于数据的预处理归一化或者标准化也适用。

毕竟

Normalization 是数据标准化(归一化,规范化),Batch 可以理解为批量,加起来就是批量标准化。


参考资料



论文



BN 要解决的事情


  • 梯度消失和梯度爆炸
  • 数据分布不均

梯度消失和梯度爆炸

请我喝杯咖啡吧~