论文地址:https://arxiv.org/abs/2011.12807v1\
机器学习分类器极易受到对抗样本的攻击。所谓对抗样本,是指在数据集中通过故意添加细微的干扰所形成的输入样本,并导致模型给出一个高置信度的错误输出,同时在人类视觉感知上保持与原始样本的高度一致。在过去几年中,为了伪造对抗样本,黑盒攻击向目标分类器提交的查询数量显著减少,这方面研究的进展主要集中于基于分数的黑盒攻击,即攻击者通过获得的分类预测概率实现攻击,将其查询量从数百万次减少到不足一千次。
本文介绍的SurFree是一种基于几何原理的对抗攻击算法,可以在最苛刻的条件下,即基于黑盒决策的攻击,仅依赖最终的分类标签来大幅减少查询花销。在苛刻条件下实现优秀的对抗攻击,HSJA、QEBA 和 GeoDA 都执行了代价高昂的梯度代理估计,而SurFree避免了代价高昂的梯度代理估计,基于分类器决策边界的几何特性制导,专注于沿着不同方向的探索。在与其他最新的攻击算法进行正面比较之前,笔者对SurFree进行了实验,并重点关注查询量,SurFree在低查询量(几百到一千)的情况下表现出更快的失真衰减,而在更高的查询预算下保持更强竞争力。
图一
如下图所示,受watermark攻击的启发,边界面具有小曲率的凸曲面,从给定角度,距离为d的点开始,给出角度距离,在边界上以角度找到第三个点。当为0,/2和,通过二阶多项式插值从角度到距离并在以下位置找到其最小值:
图三
基本流程:首先构建超平面,通过旋转角度搜索更近的对抗样本,再通过二分法细化角度。如果第二步找不到更近的对抗样本,则重新采样方向构建另一个超平面去寻找。
1.初始化:该算法需要一个初始化的点,通过目标攻击或非目标攻击生成对抗样本点。
2.搜索新方向:第k次迭代中,原始样本和当前对抗样本连线向量,使用DCT基产生一个伪随机向量,将与和前次产生的方向做施密特正交化,正交后的方向向量为,即本次产生的新方向。
3.搜索:在当前方向和所构成的平面内,由当前给定的最大角度,乘以系数来试探点是否为对抗样本,一旦发现对抗样本图片搜索立即停止。否则缩小重新生成一个进行上述搜索。
4.二分法搜索:找到角度以及符号后,用二分法搜索在细化步,最后增大。
作者将成功率定义为在查询预算内获得低于目标数据的失真概率,具体的表达式为:
如下表所示,在最初的一千个查询中,全像素域的失真更大。对于相同的查询代价,将扰动约束在用全离散余弦变换定义的较小低频子空间中是更加有益的。
下表显示了三个被攻击图像的视觉展示,这三个被攻击图像分别是容易攻击、中等攻击和难以攻击。虽然这三种攻击对图像的影响不同,可以很明显的发现SurFree攻击生成的对抗样本非常有针对性,并且生成的对抗扰动不是漫无目的。
参考文献:
Maho T, Furon T, Le Merrer E. SurFree: a fast surrogate-free black-box attack[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021: 10430-10439.
注:本文图片图一至图七均来源于以上论文
往期回顾