我们在群聊发送图片、平台上传视频的时候,通常会对图片和视频的敏感信息进行处理,最常见的几种方式有马赛克、模糊、涂抹、黑条等,其中马赛克可以说是最为常见的一种。然而我们经常可以看到有人求助复原马赛克,经马赛克处理的内容到底是否可以还原呢?
马赛克的原理,简单来说就是把多个像素合并然后取平均值。正常来说马赛克属于永久性的信息丢失,是不可完全还原的。正如你无法从平均数2 2 2,推断出它原数据是1 2 3还是0 0 6或是其他。
因此,经马赛克处理的内容,是无法真正意义上“还原”的——但却是可“匹配”的,很多时候,我们需要的并不是“还原”,而是获取其中隐藏的信息。事实上,现有的图像马赛克复原工具就是利用“匹配”的方式进行还原的。
利用同样的思路,GitHub上有一个名为Depix的项目,该项目采用暴力破解的方法来恢复原始文本。该项目以不同的组合将字符像素化,然后将其与原始的马赛克文本进行比较,持续筛选直到得出相符的结果。而在实际生活中,马赛克文本很少是单独出现的,我们通常能从完整的文件、视频中获取字体、字号等更多的信息,使得破解更为容易。
该项目在GitHub上收获了2.14万关注,无论是以前还是现在,一直都有人在进行改进和创新。Depix在去年向同好发出了一个马赛克文本复原的挑战,在今年2月16日,已由Bishop Fox的首席研究员Dan Petro破解成功,感兴趣的伙伴可由此链接观看报告:
https://bishopfox.com/blog/unredacter-tool-never-pixelation
虽然该项技术仍有诸多限制,但无疑会对互联网上现有的文档、图片和视频产生严重影响。马赛克文本复原工具的出现意味着那些已公开披露的文件都面临着信息泄露的风险,对于弱像素化及模糊的文件,恶意行为者甚至不需要什么学习成本,就可轻易地获取敏感信息。
因此,视频创作者等应意识到在视频、图片中给敏感信息打马赛克仍有暴露风险,马赛克尺寸/模糊半径越小风险越高。如果想尽可能保证信息安全,可使用不透明的黑条而不是马赛克或模糊。
推荐文章++++
球分享
球点赞
球在看