日前,Google公司正式发布了一款由AI驱动的文件类型识别系统——Magika,旨在更有效地检测二进制和文本文件格式的恶意软件。Google公司表示:Magika对各类型恶意文件的识别表现明显由于传统的检测手段,可以将整体检测效率提升30%,特别是在识别传统方法难以识别的VBScript、JavaScript和Power Shell等恶意代码方面,检出率和精确度能够显著提升95%以上。
据了解,Magika采用了Google公司自研且经过高度优化的深度学习模型,即使在使用普通CPU时,也能在毫秒级时间内准确地识别恶意文件,并且这种深度学习模型资源占用极低,只有1MB大小,使用Keras进行设计和训练。而在检测推理时,Magika使用了开放神经网络交换(Onnx)作为推理引擎,以确保在几毫秒内识别文件。
Google公司表示:本次发布的Magika工具是Google网络安全AI防御计划的关键组成部分之一。在Google内部,Magika已开始被应用于将Gmail、云端硬盘和安全浏览器中的文件,路由链接到适当的安全和内容政策扫描程序,从而增强了Google用户的应用安全性。
经过对包含100多种类型的文件样本进行基准性测试,研究人员初步发现,Magika的AI模型和大规模训练数据集使其在恶意软件检测性能方面比竞争对手的解决方案高出约30%,特别是在文本文件(如代码文件和配置文件)方面的优势更加明显。这种准确性的提高使得Magika能够使用专门的恶意AI文档扫描器扫描超过11%的文件,并将无法识别的文件数量降低到3%以下。
目前,Magika的代码和模型已在GitHub上以Apache2许可证的形式免费提供。如果想使用TFJS版本,Google公司还提供了一个实验性的npm包。未来,Magika还将与VirusTotal进行集成合作,以增强该平台的Code Insight功能,这种集成或将为全球网络安全生态系统构建带来更多价值。
参考链接:
https://cybersecuritynews.com/google-tool-magika/