数学基础
/
Feb 09, 2026
Step 6 06. 卷积运算:从信号处理到 CNN
<!-- Title: 06. 卷积运算:从信号处理到 CNN -->
<!-- Series: 深度学习数学基础 (ID: 10) -->
<!-- Author: admin -->
# 卷积运算:从信号处理到 CNN
## 1. 什么是卷积 (Convolution)?
在数学上,卷积是两个函数 $f$ 和 $g$ 之间的一种运算,记作 $f * g$。
$$ (f * g)(t) = \int f(\tau)g(t-\tau) d\tau $$
别被积分吓跑了。在图像处理(离散域)中,它非常直观:
**卷积 = 加权求和的滑动窗口。**
## 2. 图像中的卷积核 (Kernel)
想象你有一个 $3 \times 3$ 的小窗口(卷积核/过滤器)。
你拿着这个窗口在图片上滑动。
每到一个位置,就把窗口里的像素值,和卷积核里的权重相乘,然后加起来,得到一个新的像素点。
* **边缘检测**:如果卷积核左边是 -1,右边是 1。那么平坦区域(左右相同)结果为 0;边缘区域(左右不同)结果很大。这就是 Sobel 算子。
* **模糊**:如果卷积核全是 $1/9$,那就是取平均值,图片就变糊了。
## 3. CNN (卷积神经网络) 的核心思想
传统的全连接网络 (MLP) 面对图像时有两个大问题:
1. **参数爆炸**:1000x1000 的图,第一层如果有 100 个神经元,参数就是 1 亿个。
2. **位置敏感**:猫在左上角和在右下角,MLP 认为是完全不同的东西。
CNN 引入了两个归纳偏置 (Inductive Bias):
1. **局部连接 (Local Connectivity)**:每个神经元只看一小块区域(感受野)。
2. **权重共享 (Weight Sharing)**:不管在左上角还是右下角,我们用**同一个**卷积核(比如找猫耳朵的核)去扫描。
这大大减少了参数量,并且赋予了模型**平移不变性 (Translation Invariance)**。
## 4. 结语
卷积运算是 AI 视觉系统的“视网膜”。
它提取特征,从点线面到复杂的纹理,层层抽象,最终让机器看懂了世界。
P
潘卫
南京市沉思波网络科技有限责任公司创始人、CEO
您的观点 (可选)
🎁 注册账号,同步您的个性化学习路径