原文标题:Price TAG: Towards Semi-Automatically Discovery Tactics, Techniques and Procedures OF E-Commerce Cyber Threat Intelligence
原文作者:Yiming Wu; Qianjun Liu; Xiaojing Liao; Shouling Ji; Peng Wang; Xiaofeng Wang; Chunming Wu; Zhao Li
原文链接:https://ieeexplore.ieee.org/abstract/document/9576636/
原文来源:TDSC'21
笔记作者:[email protected]
文章小编:[email protected]
电子商务中的网络安全威胁体现在欺诈行为、声誉操纵等方面,这些攻击行为会对用户数据的完整性造成破坏,例如销售量膨胀,商品排名升级,或操纵搜索引擎的结果以在短时间内获得流量。如常见的刷销量行为,就是通过虚假订单伪造出高销售量来提高人气,从而促销某种目标商品,也被称作”拍A发B“。由于电子商务威胁不同于拒绝服务、入侵攻击等传统网络安全威胁,之前的研究工作对于识别这类威胁行为并不适用。因此,作者设计了TAG(TTP Semi-Automatic Generator)的新方法,提取电子商务领域的TTP。
上图是TAG的总体结构图,主要包含四个部分:语料库收集器、文本预处理器、主题词标识器、TTP实体识别器。
作者分两个时期共收集了22380篇文章作为实验数据集,使用分层抽样从每个时期中抽取500篇文章人工标记,再进行五折交叉验证来评估模型,各个部分的实验结果如下:
从结果上看,这一算法可以达到较高的召回率,但代价则是准确率相对较低。
作者在自己收集的语料库中对比了几种方法的实验结果,如下图所示,作者的方法要优于其他一些主流的方法。
虽然作者的这一方法要比其他NLP方法有着更高的准确性和覆盖面,但攻击者也有可能通过省略某些词汇、调换黑话的顺序等方式来绕过模型的检测,同时对于人类理解而言不会有很大的影响,即模型的抗干扰能力还存在一定的改进空间。
安全学术圈招募队友-ing
有兴趣加入学术圈的请联系 secdr#qq.com