KHash重磅推出
KHash是一种由腾讯安全科恩实验室自研,用于二进制文件相似性比较的哈希。
KHash利用语义嵌入向量化算法,将文件转换成一种紧凑的表示方式,可以快速计算二进制文件之间的相似度,从而提供给用户更快速、准确的相似文件搜索能力。
值得一提的是,此前KHash已经于腾讯内部业务中稳定应用并取得了显著的效果。现科恩将KHash上线至二进制安全智能分析平台—BinaryAI(binaryai.cn),正式向外部用户提供体验试用,并开放SDK(详见后文)以供用户批量自动化获取二进制文件KHash。
KHash优势
KHash应用场景
KHash使用示例
a2ps-4.14_gcc-7.3.0_x86_32_O3_a2ps.elf
(https://www.binaryai.cn/analysis/2cd45c4025aa80c0ec282a7dbe17c586aecf8fe54e06ae0cdc7e243487de5a8d/similarity)
以下为当前与该文件相似度(相似度88.28%)最高的文件
a2ps-4.14_clang-5.0_mips_64_O2_a2ps.elf
(https://www.binaryai.cn/analysis/f8a442d89134ada6ad8090304905808f3eb16266dd39a8bb30b0ee26568dda58/similarity)
def khash_similarity(khash_a: str, khash_b: str):
from scipy.spatial import distance
khash_a, khash_b = list(bin(int(khash_a, 16))[2:]), list(bin(int(khash_b, 16))[2:])
return 1 - distance.hamming(khash_a, khash_b)
khash_similarity(khash_a, khash_b)
SDK批量获取文件KHash
用户可以通过SDK批量获得二进制文件的KHash,可在自定义的二进制文件范围内通过KHash计算二进制文件间相似度。
SDK地址:https://github.com/binaryai/sdk/releases/tag/v0.8.1
SDK/API相应的Token权限已通过BinaryAI科研合作计划向国内高校、科研院所等团队、个人开放。申请方式详见:携手共研|BinaryAI合作计划启动,面向广大学者开放底座能力
更多业务体验
BinaryAI的算法引擎核心能力已同步落地应用于腾讯安全多款产品,包括:
腾讯安全威胁情报TIX与攻击面管理ASM(tix.qq.com)
腾讯云二进制软件成分分析BSCA(限时流量赠送活动进行中:cloud.tencent.com/product/bsca)
腾讯主机安全云镜(腾讯主机安全(云镜)兵器库:斩杀挖矿木马的利剑-BinaryAI引擎)
此外,科恩实验室始终以积极的姿态探索软件安全领域和前沿AI结合的科研落地,推动成果转化以解决产业痛点问题。
欢迎访问 https://www.binaryai.cn 或 阅读原文 前往体验!
★
往期相关
★
• 腾讯安全科恩实验室推出首款免费在线SCA平台:BinaryAI
• BinaryAI全新代码匹配模型BAI-2.0上线, “大模型”时代的安全实践
• BinaryAI更新布告|二进制文件的交互式智能辅助分析
• BinaryAI更新布告|自定义对比功能灵活实现“异样”速判
• 携手共研|BinaryAI合作计划启动,面向广大学者开放底座能力