ByteNoteByteNote

字节笔记本

2026年5月30日

CNN 不是过时了,它是理解现代深度学习的语法基础

API中转
¥120

卷积神经网络是深度学习最基础也最重要的架构之一。它影响了计算机视觉的整个发展历程,甚至 NLP 领域的很多创新也源于 CNN 的思想。

CNN 的核心操作只有两个:卷积和池化。

卷积的本质是特征提取。一个小矩阵(卷积核)在输入图像上滑动,每次计算局部区域的加权和。不同的卷积核提取不同类型的特征:边缘、纹理、颜色变化。浅层卷积核提取的是低级特征(线条、边缘),深层卷积核在低级特征的基础上组合出高级特征(眼睛、轮子、人脸)。这就是 CNN 的层级特征学习能力。

池化的本质是降维和信息压缩。最大池化取局部区域的最大值,平均池化取平均值。池化的作用是减少参数量、扩大感受野、引入平移不变性。一张 224x224 的图像经过几次池化后,尺寸大幅缩小,但关键特征得以保留。

卷积和池化的交替使用形成了 CNN 的标准结构:卷积层提取特征,池化层压缩信息,再卷积再池化,最后接入全连接层做分类或回归。

TextCNN 把这个思路用到了文本上。把句子看作一维图像,每行是一个词的词向量,卷积核在词向量的序列上滑动,提取 n-gram 级别的特征。池化层选出最重要的特征。TextCNN 结构简单、训练快,在很多文本分类任务上表现很好。

DPCNN(Deep Pyramid CNN)则解决了传统 CNN 堆叠深度时梯度消失的问题。它通过残差连接和固定特征图尺寸的策略,让 CNN 可以做到更深的层数而不退化。

理解 CNN 的意义不在于它是否还是当前最好的架构,而在于它是理解现代深度学习的基础。Transformer 中的自注意力机制、多尺度特征、残差连接,这些都能在 CNN 的发展史中找到影子。

分享: