一. 引言
在之前的文章[1]中,我们深入探讨了图像领域内可搜索加密技术的主流方法,并重点介绍了一系列以高效性著称的方案。然而,由于加密技术本身的固有限制,这些方法通常只能提取出图像的基本统计特征。在常规的小型测试集上,这类特征的精度往往不足80%,而在面对现实世界复杂多变的挑战时则更显不足。精度、时空效率、安全性往往不能兼得,本文着力于介绍一些牺牲了时空效率的高安全、高精度方案。
二. 明文图像检索技术
在介绍高精度的密文图像检索方案前,我们有必要回顾一下明文图像检索(CBIR)的发展历程:
图1:CBIR特征发展过程
全局特征阶段:在CBIR的早期(上世纪),研究主要集中在全局特征的提取上。全局特征是指从整个图像中提取的特征,如颜色直方图、纹理和形状等。这些特征简单、直观,容易提取,但由于缺乏对图像局部信息的关注,其检索效果在复杂图像上受到限制。
局部特征阶段:进入21世纪,尤其是2000年代初期至2010年代初期,局部特征的提取成为CBIR领域的研究热点。这个时期,技术如SIFT(尺度不变特征变换)和SURF(加速鲁棒特征)等应运而生,它们通过关注图像的特定区域或兴趣点来提高检索的准确性和稳定性。
深度特征阶段:近十年来,随着深度学习特别是卷积神经网络(CNN)的迅猛发展,CBIR技术在2010年代迎来了深度特征阶段。这个时期的研究主要集中在利用深度卷积神经网络提取更为复杂和抽象的图像特征,从而在更广泛的应用场景中实现高效的图像检索。
这里特别介绍下深度特征进行检索时的一些实现细节。图像检索通常是一个无监督的过程,同时对效率要求较高,因此通常会使用在大数据集上预训练完成的模型进行检索。此类方案通常基于成熟的预训练CNN模型(如VGG16)提取出卷积层特征(通常会舍弃最后用于分类的全连接层),然后使用主成分分析(PCA)或其它降维工具压缩卷积特征,并最终使用L1/L2距离等传统比较方法进行实际的距离度量。
三. 密文深度特征
如何在图像加密的基础上实现局部特征乃至深度特征的安全提取呢?事实上,这个问题本质上是一个更广泛的问题:如何在加密数据上执行通用计算过程并得到加密结果?对密码学熟悉的读者可能会想到,可以通过同态加密技术在加密图像上提取特征,这也正是一些早期文献中采用的方法。然而,同态加密除了效率极低外,还被后续研究指出存在安全隐患;相关研究表明,鉴于局部特征提取的复杂性(尤其是涉及大量图像结构信息),使用单服务器提供密文检索服务安全性是难以考虑周全的。
在深度特征逐渐流行的同时,多方安全计算(MPC),这一密码学中的经典技术,也因数据流转的重要性而受到空前关注。这为图像加密搜索提供了新的解决方案:某些深度卷积神经网络在结构上异常简单,仅涉及基本的加减乘运算和比较操作,且其结构信息在初始阶段即可确定。MPC,例如秘密共享技术,被认为能够支持各种加密数据上的运算。它提供了几乎与明文相当的加法运算效率和远高于同态加密的密文比较效率,且不存在噪声累积问题,能够适应各类深度学习模型。关于秘密共享的相关技术细节,读者不妨参考[2]。
因此,在近年的研究中,通常假设有两个不同的云服务提供商(它们之间不共谋)来共同提供图像加密搜索服务,有时还会引入一个轻量级的可信第三方[3]来降低离线阶段的成本(尽管这不是必须的)。一个典型的方案流程如图2所示,具体来说,该过程分为两个阶段:
图2:基于双服务器的图像可搜索加密方案
云服务器储备密文图像库:图像的拥有者首先在本地使用加法秘密共享方法将图像分割成两部分,即每个云服务器拥有一份图像的两个“份额”。由于每个份额中的RGB值都是随机的,这等同于对图像进行加密。然后,云服务器基于秘密共享的基本原语组合构建卷积神经网络的前向传播所需的计算步骤,并确保每个中间结果都符合秘密共享的要求,最终完成密态卷积特征的提取。此时云服务器拥有了图像库及图像特征的一个份额。
云服务器提供密文检索:当有密态查询图像传入时,云服务器将基于相同的流程提取查询图像的密态特征,并进行密态的距离度量,最后返回密态的检索结果。查询者最终可以在本地基于两份图像份额恢复出真实的检索图像。
从上述介绍中容易看出,该方案的效率主要受到所采用的卷积特征提取模型复杂度的影响。一些研究文献指出,即使是使用相对基础的卷积模型,如VGG13或VGG16,也可以在常见的小型测试集上实现超过95%的检索精度。而与此同时,所需的时间消耗仅为特定加密方案的3至5倍。因此,在那些对时间敏感性较低、而对精度要求较高的实际应用场景中,基于双服务器模型的图像可搜索加密方案展现出了显著的实用价值。
四. 总结
在本篇文章中,我们深入探讨了图像可搜索加密领域的一种重要方案。这种方法借鉴了明文内容基于图像检索(CBIR)的策略,从而在加密环境下显著提高了检索精度。结合多方安全计算(MPC)技术和深度学习的最新进展,我们能够简化原本复杂的问题,优化处理时间效率,逐步将曾被认为理论上不可行的方案转变为现实中可实施的解决方案。
在当今大模型大行其道的时代,图像检索已经步入了一个多模态和交互式的新领域;与此同时,隐私计算技术的空前重视也为密码学带来了加速的突破。这不仅是技术更迭的见证,也是我们如何以创新方式保护隐私和提高数据处理效率的典范。我们有理由相信,随着通用技术的持续进步,更多以安全为价值的应用能够加速从理论走向实践的落地。
参考文献
[1]: https://mp.weixin.qq.com/s/ICwRV6fjPqdlLboCzJM_pg
[2]: https://mp.weixin.qq.com/s/AAf7WuPo3R5kYCkI2b_8aw
[3]: Huang K, Liu X, Fu S, et al. A lightweight privacy-preserving CNN feature extraction framework for mobile sensing[J]. IEEE Transactions on Dependable and Secure Computing, 2019, 18(3): 1441-1455.
相关文章:
内容编辑:创新研究院 顾奇
责任编辑:创新研究院 陈佛忠
本公众号原创文章仅代表作者观点,不代表绿盟科技立场。所有原创内容版权均属绿盟科技研究通讯。未经授权,严禁任何媒体以及微信公众号复制、转载、摘编或以其他方式使用,转载须注明来自绿盟科技研究通讯并附上本文链接。
关于我们
绿盟科技研究通讯由绿盟科技创新研究院负责运营,绿盟科技创新研究院是绿盟科技的前沿技术研究部门,包括星云实验室、天枢实验室和孵化中心。团队成员由来自清华、北大、哈工大、中科院、北邮等多所重点院校的博士和硕士组成。
绿盟科技创新研究院作为“中关村科技园区海淀园博士后工作站分站”的重要培养单位之一,与清华大学进行博士后联合培养,科研成果已涵盖各类国家课题项目、国家专利、国家标准、高水平学术论文、出版专业书籍等。
我们持续探索信息安全领域的前沿学术方向,从实践出发,结合公司资源和先进技术,实现概念级的原型系统,进而交付产品线孵化产品并创造巨大的经济价值。
长按上方二维码,即可关注我