2020-7-28 吴恩达DL学习-C4 卷积神经网络-第一周 CNN(1.3 更多边缘检测内容-①正边/负边-边缘的过度②Sobel和Scharr过滤器③过滤器9个数字当做参数)

最新推荐文章于 2022-07-10 17:56:36 发布

没人不认识我

最新推荐文章于 2022-07-10 17:56:36 发布

阅读量540

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习 python IT 文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_42555985/article/details/107627501

IT 同时被 3 个专栏收录

389 篇文章

订阅专栏

深度学习

274 篇文章

订阅专栏

python

233 篇文章

订阅专栏

本文探讨了卷积运算在边缘检测中的应用，包括如何区分正边和负边，介绍了几种常用的边缘检测过滤器如Sobel和Scharr过滤器，并讨论了如何通过反向传播算法自动学习最优的过滤器参数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.视频网站：mooc慕课https://mooc.study.163.com/university/deeplearning_ai#/c
2.详细笔记网站(中文)：http://www.ai-start.com/dl2017/
3.github课件+作业+答案：https://github.com/stormstone/deeplearning.ai

1.3 更多边缘检测内容 More edge detection

上节课你已经见识到用卷积运算实现垂直边缘检测。

在本节课中，你将学习如何区分正边和负边，这实际就是由亮到暗与由暗到亮的区别，也就是边缘的过渡。你还能了解到其他类型的边缘检测以及如何去实现这些算法，而不要总想着去自己编写一个边缘检测程序，让我们开始吧。
在这里插入图片描述

上图还是上节课的例子。左边这张6×6的图片，左边较亮，而右边较暗，将它与中间的垂直边缘检测滤波器进行卷积，检测结果就显示在了右边这幅图的中间部分。

在这里插入图片描述

观察上图，现在这幅图有什么变化呢？
它的颜色被翻转了，变成了左边比较暗，而右边比较亮。现在亮度为10的点跑到了右边，为0的点则跑到了左边。如果你用它与相同的过滤器进行卷积，最后得到的图中间会是-30，而不是30。

如果你将矩阵转换为图片，就会是该矩阵下面图片的样子。现在中间的过渡部分被翻转了，之前的30翻转成了-30，表明是由暗向亮过渡，而不是由亮向暗过渡。

如果你不在乎这两者的区别，你可以取出右边矩阵的绝对值。但这个特定的过滤器确实可以为我们区分这两种明暗变化的区别。

再来看看更多的边缘检测的例子。
在这里插入图片描述

我们已经见过上图左边这个3×3的过滤器，它可以检测出垂直的边缘。所以，看到右边这个过滤器，我想你应该猜出来了，它能让你检测出水平的边缘。提醒一下，一个垂直边缘过滤器是一个3×3的区域，它的左边相对较亮，而右边相对较暗。相似的，右边这个水平边缘过滤器也是一个3×3的区域，它的上边相对较亮，而下方相对较暗。
在这里插入图片描述

观察上图，这里还有个更复杂的例子。左上方和右下方都是亮度为10的点。如果你将它绘成图片，右上角和左下角是比较暗的地方，这边都是亮度为0的点，我把这些比较暗的区域都加上阴影。而左上方和右下方都会相对较亮。如果你用这幅图与水平边缘过滤器卷积，就会得到右边这个矩阵。

再举个例子。
上图右边矩阵中绿色方框标记元素是30（第二行第一列），代表了左边这块3×3的区域（左边矩阵绿色方框标记部分 $\begin{bmatrix} 10 & 10 & 10\\ 10 & 10 & 10\\ 0 & 0 & 0\\ \end{bmatrix}$ ）。
在这里插入图片描述

这块区域(绿色框)确实是上边比较亮，而下边比较暗的，所以它在这里发现了一条正边缘。

而右边矩阵中紫色方框标记元素里的-30（第二行第四列），又代表了左边另一块区域（左边矩阵紫色方框标记部分 $\begin{bmatrix} 0 & 0 & 0\\ 0 & 0 & 0\\ 10 & 10 & 10\\ \end{bmatrix}$ ），这块区域确实是底部比较亮，而上边则比较暗，所以在这里它是一条负边。
在这里插入图片描述

再次强调，我们现在所使用的都是相对很小的图片，仅有6×6。但上图右边矩阵中间这些数值，比如说这个10（右边矩阵中黄色方框标记元素，第二行第二列），代表的是左边矩阵这块区域（左边6×6矩阵中黄色方框标记的部分 $\begin{bmatrix} 10 & 10 & 0\\ 10 & 10 & 0\\ 0 & 0 & 10\\ \end{bmatrix}$ ）。这块区域左边两列是正边，右边一列是负边，正边和负边的值加在一起得到了一个中间值。但假如这个一个非常大的1000×1000的类似这样棋盘风格的大图，就不会出现这些亮度为10的过渡带了，因为图片尺寸很大，这些中间值就会变得非常小。

总而言之，通过使用不同的过滤器，你可以找出垂直的或是水平的边缘。但事实上，对于这个3×3的过滤器来说，我们使用了其中的一种数字组合。
在这里插入图片描述

但在历史上，在计算机视觉的文献中，曾公平地争论过怎样的数字组合才是最好的，所以你还可以使用这种： $\begin{bmatrix} 1 & 0 & -1\\ 2 & 0 & -2\\ 1 & 0 & -1\\ \end{bmatrix}$ ，叫做Sobel的过滤器，它的优点在于增加了中间一行元素的权重，也就是处于图像中央的像素点，这使得结果的鲁棒性会更高一些。

计算机视觉的研究者们也会经常使用其他的数字组合，比如这种： $\begin{bmatrix} 3 & 0 & -3\\ 10 & 0 & -10\\ 3 & 0 & -3\\ \end{bmatrix}$ ，这叫做Scharr过滤器。它有着和之前完全不同的特性，实际上也是一种垂直边缘检测，如果你将其翻转90度，你就能得到对应水平边缘检测。