论文解读 | 解释和利用对抗性示例

原创 | 文 BFT机器人 

图片

摘要

ABSTRACT

这篇论文研究了神经网络和其他机器学习模型在错误分类对抗性示例方面的问题。对抗性示例是通过对数据中的示例应用微小但故意的扰动来生成的,导致模型输出错误答案。以往的解释主要集中在非线性和过拟合上,然而,本文提出了一种不同的观点,认为神经网络易受对抗性扰动影响的主要原因是其线性特性。这个观点得到了新的定量结果的支持,同时也首次解释了这种现象的跨架构和跨训练集泛化的特点。此外,研究者基于这个观点提出了一种简单而快速的生成对抗性示例的方法。通过将这种方法应用于对抗性训练,他们在MNIST数据集上的maxout网络测试中减少了测试集误差。

01

介绍

这节介绍了一个有趣的发现,即最先进的神经网络和其他机器学习模型,包括那些采用深度学习方法的,很容易受到对抗性示例的影响。对抗性示例是一种在输入数据中故意引入微小扰动,以使模型产生错误分类的现象。论文指出,这些机器学习模型在错误分类的对抗性示例与正确分类的原始示例之间的差异很小。即使是使用不同架构在不同子集上训练的模型也可能对相同的对抗性示例产生错误分类,这揭示了训练算法中的盲点。

研究者认为对抗性示例揭示了现有训练算法的局限性。虽然一些推测认为这可能是因为深度神经网络的极端非线性特性,或者模型平均和正则化等问题,但论文证明了这些假设是不必要的。事实上,高维空间中的线性行为就足以产生对抗性示例。基于这一观点,研究者提出了一种快速生成对抗性示例的方法,并且强调对抗性训练具有实用性。此外,他们指出,除了常用的正则化策略如dropout、预训练和模型平均外,对抗性训练可以提供额外的正则化好处。然而,常见的正则化方法并不能显著降低模型对对抗性示例的脆弱性,但将模型从非线性转变为类似RBF网络这样的非线性模型族可以实现这一点。

解释表明,在易于训练的线性模型与抵抗对抗性扰动的非线性模型之间存在一种紧张的平衡关系。最终,论文提出,通过设计更强大的优化方法,可以成功地训练更多的非线性模型,从而可能避免这种平衡。

02

相关工作

Szegedy等人演示了神经网络和相关模型的各种有趣的特性。与本文最相关的包括:

  • l 盒约束L-BFGS可以可靠地找到对抗性示例。

  • l 在一些数据集上,如ImageNet (Deng et al ., 2009),对抗性示例与原始示例非常接近,以至于人眼无法区分差异。

  • l 相同的对抗性示例经常被具有不同架构的各种分类器错误分类,或者在训练数据的不同子集上进行训练。

  • l 浅层softmax回归模型也容易受到对抗性示例的影响

  • l 对抗性示例的训练可以使模型正则化——然而,由于需要在内环中进行昂贵的约束优化,这在当时是不切实际的。

这些结果表明,现代机器学习技术所构建的分类器,即使在测试集上表现出色,仍然未能真正学习决定正确输出标签的潜在概念。相反,这些算法似乎建立在一个局限的范围内,可以有效处理自然数据,但在处理概率较低的数据空间点时表现不佳。这一点尤其令人失望,因为流行的计算机视觉方法使用卷积神经网络特征来近似感知距离,而如果拥有微小感知距离的图像对应于网络表示中完全不同的类别,那么这种相似性度量显然存在缺陷。

03

对抗性例子的线性解释

在许多问题中,单个输入特征的精度是有限的。例如,数字图像通常每像素只使用8位,因此它们丢弃动态范围1/255以下的所有信息。由于特征的精度是有限的,如果扰动η的每个元素都小于特征的精度,那么分类器对输入x的响应不同于对抗性输入˜x: = x + η是不合理的。形式上,对于类分离良好的问题,我们期望分类器将相同的类分配给x和,只要||η||∞小到足以被与我们的问题相关的传感器或数据存储设备丢弃。

考虑一个权向量w和一个对抗性例子˜x:之间的点积:

图片

对抗性扰动使活化增大

图片

这个解释表明,如果一个简单的线性模型的输入有足够的维数,它可以有对抗性的例子。先前对抗性例子的解释援引了神经网络的假设属性,例如它们假定的高度非线性性质。我们基于线性的假设更简单,也可以解释为什么softmax回归容易受到对抗性示例的影响。

04

非线性模型的线性扰动

 

设θ为模型的参数,x为模型的输入,y为与x相关的目标(对于有目标的机器学习任务),J(θ, x, y)为用于训练神经网络的成本。

我围绕θ的当前值线性化代价函数,得到最优的最大范数约束扰动

图片

图片

实验证明了作者假设的对抗样本的产生原因是由于模型的线性特性。同时,这种算法也可作为一种加速对抗训练的方法。

05

线性模型与权重衰减的对抗性训练

考虑的最简单的模型是逻辑回归。在这种情况下,快速梯度符号法是精确的。我们可以用这个例子来直观地了解如何在一个简单的设置中生成对抗性示例。图示见图2。

如果我们训练一个单一模型来识别标签y∈{−1,1},P (y = 1) = 

图片

其中σ(z)为logistics型函数,则训练由梯度下降组成

图片

图片

06

深度网络的对抗性训练

通过对抗性和干净样例的混合训练,神经网络可以在一定程度上进行正则化。对抗性示例的训练与其他数据增强方案有所不同;通常,使用转换(例如预期在测试集中实际发生的翻译)来增加数据。这种形式的数据增强使用不太可能自然发生的输入,但暴露了模型概念化其决策函数的方式中的缺陷。当时,这个程序从未被证明可以在最先进的基准上提高辍学率。然而,这部分是因为很难对基于L-BFGS的昂贵对抗性示例进行广泛的实验。

我们发现基于快速梯度符号方法的对抗性目标函数训练是一种有效的正则化器:

图片

图片

07

对抗样本泛化原因

图片

上图表明, 通过尝试不同的ϵ值,我们发现对抗性示例出现在由快速梯度符号方法定义的1-D子空间的连续区域中,而不是在局部极值附近。这解释了为什么对抗性示例如此普遍,以及为什么一个分类器错误分类的示例被另一个分类器错误分类的概率相当高。

为了解释多个分类器将相同类别分配给对抗性示例的现象,假设使用当前方法训练的神经网络类似于在相同训练集上训练的线性分类器。即使在不同子集上训练,这个基准分类器能够学习类似的分类权重,这是机器学习算法泛化的结果。这些底层分类权重的稳定性反过来导致对抗性示例的稳定性。

作者 | 不加糖

排版 | 春花

审核 | 柒柒

若您对该文章内容有任何疑问,请于我们联系,将及时回应。想了解更多第一资讯请关注微信公众号:智能机器人研究

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/86624.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

概念解析 | 稀疏正则化

稀疏正则化:从理论到实践的简要解析 注1:本文系“概念解析”系列之一,致力于简洁清晰地解释、辨析复杂而专业的概念。本次辨析的概念是:稀疏正则化。 Group-sparsity regularization enforcement: (a) the columns of the… | Dow…

STM32 CubeMX (第三步Freertos中断管理和软件定时)

STM32 CubeMX STM32 CubeMX (第三步Freertos中断管理和软件定时) STM32 CubeMX一、STM32 CubeMX设置时钟配置HAL时基选择TIM1(不要选择滴答定时器;滴答定时器留给OS系统做时基)使用STM32 CubeMX 库,配置Fre…

The last packet sent successfully to the server was 0 milliseconds ago.报错

报错图: 解决方法 多半是代码拼写错误,如localhost拼成local。 注意驱动版本应与mysql版本对应 maven包配置按照自己下的位置设置,最好不要默认

c++ day1

定义一个命名空间Myspace,包含以下函数:将一个字符串中的所有单词进行反转,并输出反转后的结果。例如,输入字符串为"Hello World",输出结果为"olleH dlroW",并在主函数内测试该函数。 …

【数据结构与算法】—— 手撕红黑树

目录 (一)红黑树的定义 1、红黑树的引入 2、红黑树的概念 3、红黑树的性质 (二)红黑树的操作 1、红黑树节点的定义 2、红黑树的插入操作 1️⃣ 思路 2️⃣ 代码实现 3、红黑树的删除操作(了解) …

ssm汽车养护管理系统源码和论文

ssm汽车养护管理系统038 开发工具:idea 数据库mysql5.7 数据库链接工具:navcat,小海豚等 技术:ssm 开题报告内容:(研究现状、目的意义;基本内容、研究方法、参考文献等。) 研究现状 国外…

【中危】Apache Ivy<2.5.2 存在XXE漏洞 (CVE-2022-46751)

漏洞描述 Apache Ivy 是一个管理基于 ANT 项目依赖关系的开源工具,文档类型定义(DTD)是一种文档类型定义语言,它用于定义XML文档中所包含的元素以及元素之间的关系。 Apache Ivy 2.5.2之前版本中,当解析自身配置、Ivy 文件或 Apache Maven 的 POM 文件…

IntelliJ IDEA 官方网站 idea官网 http://www.jetbrains.com/idea/

IntelliJ IDEA 官方网站 idea官网 http://www.jetbrains.com/idea/ Idea下载官网一键直达: 官网一键直达

【STM32】FreeRTOS软件定时器学习

软件定时器 FreeRTOS提供了现成的软件定时器功能,可以一定程度上替代硬件定时器,但精度不高。 实验:创建一个任务,两个定时器,按键开启定时器,一个500ms打印一次,一个1000ms打印一次。 实现&…

关于模板的大致认识【C++】

文章目录 函数模板函数模板的原理函数模板的实例化模板参数的匹配原则 类模板类模板的定义格式类模板的实例化 非类型模板参数typename 与class模板的特化函数模板特化类模板特化全特化偏特化 模板的分离编译 函数模板 函数模板的原理 template <typename T> //模板参数…

mongodb集群

端口192.168.115.3 192.168.115.4 1192.168.115.5 下载MongoDB软件包版本为4.2.14并安装 rpm -ih --force --nodeps *.rpm 2创建文件夹mkdir -p /opt/local/mongo-cluster/conf 3.在目录里创建配置文件cd /opt/local/mongo-cluster/conf …

3D数据转换工具HOOPS Exchange概览

HOOPS Exchange SDK是一组C软件库&#xff0c;使开发团队能够快速为其应用程序添加可靠的2D和3D CAD导入和导出功能。这允许访问广泛的数据&#xff0c;包括边界表示&#xff08;BREP&#xff09;、产品制造信息&#xff08;PMI&#xff09;、模型树、视图、持久ID、样式、构造…

低代码开发ERP:精打细算,聚焦核心投入

企业数字化转型已经成为现代商业环境中的一项关键任务。如今&#xff0c;企业面临着日益激烈的竞争和不断变化的市场需求。在这样的背景下&#xff0c;数字化转型不仅是企业生存的必然选择&#xff0c;也是取得竞争优势和实现可持续发展的关键因素。 在数字化转型的过程中&…

【Hello Network】数据链路层协议

本篇博客简介&#xff1a;介绍数据链路层的各协议 数据链路层 以太网协议认识以太网协议以太网帧格式局域网通信原理再理解 MTU认识MTUMTU对IP协议的影响MTU对UDP协议的影响MTU对于TCP协议的影响如何查看ip地址 mac地址 以及mtu ARP协议ARP协议的作用ARP协议在哪里ARP的工作过程…

解决charles无法抓取localhost数据包

我们有时候在本地调试的时候&#xff0c;使用charles抓取向本地服务发送的请求的&#xff0c;发现无法抓取。 charles官方也作了相应说明&#xff1a; 大概意思就是 某些系统使用的是硬编码不能使用localhost进行传输&#xff0c;所以当我们连接到 localhost的时候&#xff0c…

leetcode 188. 买卖股票的最佳时机 IV

2023.8.21 这道题是 买卖股票的最佳时机III 的升级版&#xff0c;即买卖次数限制为k次&#xff0c;做法和上一篇如法炮制&#xff0c;直接看代码&#xff1a; class Solution { public:int maxProfit(int k, vector<int>& prices) {vector<vector<int>>…

常用性能测试工具及其功能

在软件开发周期的不同阶段&#xff0c;性能测试工具被广泛用于评估系统的性能和发现潜在的性能瓶颈。本文介绍了几种常用的性能测试工具&#xff0c;包括负载测试工具、压力测试工具和基准测试工具&#xff0c;并详细描述了它们的功能和用法。 性能测试在软件开发的各个阶段都至…

Docker的数据管理及端口映射与容器互联(使用centos镜像)

目录 Docker数据管理 1&#xff0e;数据卷 2&#xff0e;数据卷容器 Docker端口映射 Docker容器互联 Docker数据管理 管理 Docker 容器中数据主要有两种方式&#xff1a;数据卷&#xff08;Data Volumes&#xff09;和数据卷容器&#xff08;DataVolumes Containers&…

Java接口详解

接口 接口的概念 在现实生活中&#xff0c;接口的例子比比皆是&#xff0c;比如&#xff1a;笔记本上的USB口&#xff0c;电源插座等。 电脑的USB口上&#xff0c;可以插&#xff1a;U盘&#xff0c;鼠标&#xff0c;键盘等所有符合USB协议的设备 电源插座插孔上&#xff0c;…

linux 上安装es

首先 到官网 https://www.elastic.co/cn/downloads/elasticsearch 下载对应的安装包&#xff0c;我这里下载的是 https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-8.9.1-linux-x86_64.tar.gz 然后讲该压缩包上传到 linux 的/usr/local 目录下执行 tar -z…