报价宝 > 科技 >

CNN中的一些高阶技术（空洞卷积/显著图/反折积）

消息来源:baojiabao.com 作者: 发布时间：2024-05-04

报价宝综合消息CNN中的一些高阶技术（空洞卷积/显著图/反折积）

卷积神经网络是影象识别领域最重要的深度学习技术。也可以说是是本轮深度学习浪潮开始点。本文总结了CNN的三种高阶技巧，分别是空洞卷积、显著图和反卷积技术。原文释出在Medium（翻译完发现网上也有了近似的版本，

不过他们全文翻译了，内容太多不相关的，我这里反正也翻译了，不发也浪费了。看过的客官也可以跳过了，手动[无奈]）。

一、CNN的概述二、感受野和空洞卷积（Receptive Field and Dilated Convolutions）三、显著图（Saliency Maps）四、反卷积（Transposed Convolution）

一、CNN的概述

CNN的独特方面如下：

引数（权重和偏差）比全连线网络少物件检测的不变性 - 它们不依赖于特征的位置可以容忍影象中的一些失真。能够泛化和学习特征。需要网格输入。卷积层由滤波器（filters），特征对映（feature maps）和启用函式（activation function）组成。

如果输入的维度已知，我们可以确定卷积块的输出的维度。这个计算方法可以参考《深度学习卷积操作的维度计算》。

池化层用于减少过拟合。全连线的层用于将空间和通道特征混合在一起。每个滤波层都和feature map抽取的影象对应，这就是提取特征的方式。

知道输入和输出层的数量很重要，因为这决定了构成神经网络引数的权重和偏差的数量。网络中的引数越多，需要训练的引数越多，导致训练时间越长。训练时间对于深度学习非常重要，因为它是一个限制因素，除非您可以访问强大的计算资源，如计算丛集。

下面是一个示例网络，我们将为其计算引数总数。

在这个网络中，我们在卷积滤波器上有250个权重和10个偏差项。我们在max-pooling层上没有权重。在最大池化层之后，我们有13×13×10 = 1,690个输出元素。我们有一个200节点的完全连线层，在完全连线层中总共产生1,690×200 = 338,000个权重和200个偏置项。因此，我们在网络中共有338,460个引数需要接受训练。我们可以看到大多数训练的引数出现在完全连线的输出层。

每个CNN层都学习越来越复杂的滤波器。第一层学习基本特征检测滤波器，例如边缘和角落。中间层学习检测物件部分的滤波器 - 对于面部，他们可能学会对眼睛和鼻子做出反应。最后的图层具有更高的表示形式：它们学习识别不同形状和位置的完整物件。

二、感受野和空洞卷积（Receptive Field and Dilated Convolutions）

感受野被定义为输入空间中特定CNN的特征正在观察（即受其影响）的区域。在5×5输入对映上应用核心大小为k = 3×3，填充大小为p = 1×1，步长s = 2×2的卷积C，我们将得到一个3×3输出特征对映（绿色对映）。

在3×3特征图之上应用相同的卷积，我们将得到2×2特征图（橙色图）。

让我们再次以一维方式看待感受野，没有填充，步长为1，核心大小为3×1。

我们可以跳过其中一些连线以建立空洞卷积（Dilated Convolutions），如下所示。

空洞卷积以与正常卷积类似的方式工作，主要区别在于感受野不再由连续画素组成，而是由其他画素分开的各个画素组成。扩散卷积层应用于影象的方式如下图所示。

下图显示了二维资料的空洞卷积。红点是过滤器的输入，其为3×3，绿色区域是由这些输入中的每一个捕获的感受野。感受野是每个输入（单位）到下一层的初始输入上捕获的隐含区域。

使用空洞卷积背后的动机是：

通过处理更高分辨率的输入来检测精细细节。更广泛的视角，用于捕获更多上下文资讯。执行时间更短，引数更少在下一节中，我们将讨论使用显著性对映来检查卷积网络的效能。

三、显著图（Saliency Maps）

显著图是资料科学家用于检查卷积网络的有用技术。它们可用于研究神经元的启用模式，以检视影象的哪些特定部分对于特定特征是重要的。

让我们想象一下，你会得到一张狗的影象并要求对它进行分类。这对于人类来说非常简单，但是，深度学习网络可能不像你那么聪明，而是可能将其归类为猫或狮子。为什么这样做？

网络可能错误分类影象的两个主要原因：

训练资料中的偏差没有正则化我们想要了解是什么让网络将某个类作为输出 - 这样做的一种方法是使用显著图。显著图是一种测量给定影象中特定类的空间支援的方法。

“当我通过我的网络传输影象时，找到负责C类分数S（C）的画素”。

我们怎么做？我们使用区别（differentiate）！对于任何函式f（x，y，z），我们可以通过在该点找到关于这些变数的偏导数，找到变数x，y，z对任何特定点（x 1，y 1，z 1）的影响。类似地，为了找到负责的画素，我们对C类取分数函式S，并对每个画素取偏导数。

这很难自己实现，但幸运的是，auto-grad可以做到这一点！该程式的工作原理如下：

正向通过网络传递影象。计算每个类的分数。对于除C类之外的所有类，在最后一层强制计算得分S的导数为0。对于C，将其设定为1。通过网络反向传播这个导数。渲染它们，你就有了显著图。注意：在步骤＃2中，我们将其转换为二进位制分类并使用概率，而不是执行softmax。

以下是显著性图的一些示例。

我们如何处理彩色影象？获取每个通道的显著图，并采用最大值，平均值或使用所有3个通道的方式显示。

概述显著图的功能的两篇好文章是：

Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps

Attention-based Extraction of Structured Information from Street View Imagery

有一个与本文相关的GitHub库，其中我将展示如何生成显著图（可以在此处找到库）。

四、反卷积（Transposed Convolution）

到目前为止，我们所看到的卷积要么保持其输入的大小，要么使其变小。我们可以使用相同的技术使输入张量更大。此过程称为upsampling。当我们在卷积步骤中进行时，它被称为反卷积（transposed convolution）或微步卷积（fractional striding）。

注意：有些作者在使用反卷积时会称之为upsampling，但该名称已经采用了以下文章中概述的不同概念：

https://arxiv.org/pdf/1311.2901.pdf

为了说明反卷积的工作原理，我们将看一些卷积的例子。

第一个是没有填充的典型卷积层的示例，作用于大小为5×5的影象。在卷积之后，我们最终得到3×3影象。

现在我们看一个填充为1的卷积层。原始影象是5×5，卷积后的输出影象也是5×5。

现在我们看一个填充为2的卷积层。原始影象是3×3，卷积后的输出影象也是5×5。

当在Keras中使用时，例如在变分自动编码器的开发中，这些是使用upsampling层实现的。

2019-10-31 05:55:00

文章标签: 报价宝降噪耳机价格耳机价格红米手机价格华为手机价格小米手机价格电视机价格笔记本电脑价格笔记本价格汽车价格报价宝手机价格汽车价格笔记本价格华为手机价格

相关文章

中兴受美国制裁事件被罚了20亿美元过程事件始末中兴被制裁后公司现状
2023-11-02 22:12:46
B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了？技术团队公开早先原因
2023-03-06 19:05:55
苹果iPhoneXS/XR手机电池容量续航最强？答案揭晓
2023-02-19 15:09:54
华为荣耀两款机型起内讧：荣耀Play官方价格同价同配该如何选？
2023-02-17 23:21:27
google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格：刘海屏设计顶配版曾卖6900元
2023-02-17 18:58:09
科大讯飞同传同声翻译软件造假浮夸不能只罚酒三杯
2023-02-17 18:46:15
华为mate20pro系列手机首发上市日期价格，屏幕和电池参数配置对比
2023-02-17 18:42:49
小米MAX4手机上市日期首发价格骁龙720打造大屏标准
2023-02-17 18:37:22
武汉弘芯遣散!结局是总投资1280亿项目烂尾光刻机抵押换钱
2023-02-16 15:53:18
谷歌GoogleDrive网云盘下载改名“GoogleOne” 容量提升价格优惠
2023-02-16 13:34:45
巴斯夫将裁员6000人众化工巨头裁员潮再度引发关注
2023-02-13 16:49:06
人手不足韵达快递客服回应大量包裹派送异常没有收到
2023-02-07 15:25:20
资本微念与李子柒销声匿迹谁赢？微念公司退出子柒文化股东
2023-02-02 09:24:38
三星GalaxyS8 S9 S10系统恢复出厂设置一直卡在正在检查更新怎么办
2023-01-24 10:10:02
华为Mate50 RS保时捷最新款顶级手机2022多少钱？1.2万元售价外观图片吊打iPhone14
2023-01-06 20:27:09
芯片常见的CPU芯片封装方式 QFP和QFN封装的区别？
2022-12-02 17:25:17
华为暂缓招聘停止社招了吗?官方回应来了
2022-11-19 11:53:50
热血江湖手游：长枪铁甲刚猛热血正派枪客全攻略技能介绍大全
2022-11-16 16:59:09
东京把玩了尼康微单相机Z7 尼康Z7现在卖多少钱?
2022-10-22 15:21:55
苹果iPhone手机灵动岛大热:安卓灵动岛App应用下载安装量超100万次
2022-10-03 22:13:45

最新资讯

YouTube更新违反规定政策，提升惩处透明度和一致性
2023-12-31 14:00:52
美国法院裁定阿里须为Squishmallows玩具侵权案答辩
2023-12-28 19:59:34
小米汽车传员工3700人雷军称小米汽车不可能卖9万9
2023-12-28 19:41:57
吉利飙逾6% 电动车品牌极氪新车款极氪007昨上市预售价格22.99万元
2023-12-28 19:30:28
日本丰田汽车厂11月全球产量创新高
2023-12-28 19:26:02

手机

中国11月手机出货量增34% 5G手机出货量2709.2万部
2023-12-28 19:27:57
荣耀发布新一代旗舰荣耀Magic5系列，新款上市价格分期0首付3999元起
2023-03-06 16:12:32
美国商务部指违禁，长江存储被美国拜登制裁名单面临停工裁员
2023-02-17 18:41:53
苹果Apple iOS车载系统CarPlay支持哪些更多汽车品牌
2023-02-02 17:33:27
香港去哪买三星手机回来吗？买香港便宜售价手机市场地点和网站
2023-02-02 11:03:11

数码

华为5G芯片正式亮相：预示华为将发首款5G手机
2023-08-31 13:22:33
腾讯传计划放弃虚拟现实VR硬件计划
2023-02-17 23:32:30
三星手机份额大跌！三星手机中国市场份额变化国内仅剩3%
2023-02-01 17:06:15
三星手机份额大跌在中国没市场了！国内市场占有率仅剩1%国外比苹果销量高
2023-02-01 16:59:53
vivo发布2022 vivoNEX手机极简易浏览器下载：简洁流畅无广告！
2022-12-02 17:29:30

科技

中兴受美国制裁事件被罚了20亿美元过程事件始末中兴被制裁后公司现状
2023-11-02 22:12:46
B站怎么炸崩了哔哩哔哩服务器今日怎么又炸挂了？技术团队公开早先原因
2023-03-06 19:05:55
苹果iPhoneXS/XR手机电池容量续航最强？答案揭晓
2023-02-19 15:09:54
华为荣耀两款机型起内讧：荣耀Play官方价格同价同配该如何选？
2023-02-17 23:21:27
google谷歌原生系统Pixel3 XL/4/5/6 pro手机价格：刘海屏设计顶配版曾卖6900元
2023-02-17 18:58:09

品牌选车

选择品牌

选择车系

选择车型