2024鹅厂游戏安全技术竞赛决赛题解-PC客户端
2024-5-1 17:24:21 Author: mp.weixin.qq.com(查看原文) 阅读量:9 收藏


Loader.sys分析

虚拟机系统环境:Windows 10 x64 1909 18363.418

调试环境:KDNET network kernel debugging(https://learn.microsoft.com/en-us/windows-hardware/drivers/debugger/setting-up-a-network-debugging-connection)

老规矩查壳:

很好,什么也看不出来;直接拖IDA看看。

导入表有个ExAllocatePoolWithTag,尝试Hook了不过并没有什么卵用,跑起来只会拷贝一个“2024.wo.shi.chu.ti.ren”的字符串上去......直接看Disassembly。

一眼VMP,等分析完成后Shift+F12看字符串。

“bad array new length”和“vector too long”明显来自stl库,应该是被std::string和std::vector的某个类成员函数所引用的。

struct std::string
{
char *data;
__int64 unknown;
__int64 length;
__int64 capacity;
};

跑一下Lumina私服能出一些符号,其中std::string成员函数:

挨个xref找访问,std::string::~string和std::string::find_last_of能追到同一个地方。

word_140675E20数组逐字与0xACE进行了异或,拷贝出代码来跑一下:

得到存放key的文件路径:

联想到key的格式“ACE-4051574845”,可以知道此处正在进行字符串分割。

其次,sub_140AFC7E2通过复制给chatgpt解析能大致得出其为字符串转整数的功能。

下断验证:

还原大致逻辑,sub_140009CBC是对用户名进行计算,得到一个输出值。算法如下:

整体逻辑:

用户名匹配时,函数返回1即true,失败返回false。

exp思路:修改用户名输出值与key的比较结果,使函数返回值恒为true即可。

具体方法:注册LoadImage回调,判断加载的映像是否为目标驱动,使判断函数尾部的xor al, al变成mov a1, 1。


shellcode分析

成功加载Loader驱动后,System进程的CPU占有直接飙升至99%。

说明Shellcode应当是启动了。而Loader想在内核跑shellcode必然要写到可执行内存并获得执行时机。可执行内存的获取方式一般为:

ExAllocatePool/ExAllocatePoolWithTag/MmAllocateIndenpendentPages/MmAllocateContiguousMemory....

执行时机:PsCreateSystemThread/WorkItem/APC/DPC/Timer/...

延续初赛的解题代码,直接用DetoursX挂钩PsCreateSystemThread、ExAllocatePoolWithTag

BSOD,看调用栈是PsCreateSystemThread后的双重错误。而ExAllocatePoolWithTag直接执行到了挂钩后面的int3上去了。

应该是程序自己构造函数序言部分,执行完成自行构造的序言部分后jmp到后面的代码验证构造call:

直接去挂钩更底层的PsCreateSystemThreadEx和ExAllocateHeapPool一劳永逸,可以成功让目标驱动走我们的钩子。

不过看到跳板push ret有种莫名熟悉的感觉(XXX-BASE),尝试在物理机用CE附加虚拟机进程即vmware-vmx.exe,搜索跳板特征。

ffff8003`b49f5456 48895c2418 mov qword ptr [rsp+18h],rbx
ffff8003`b49f545b 6825c5017f push 7F01C525h
ffff8003`b49f5460 c744240402f8ffff mov dword ptr [rsp+4],0FFFFF802h
ffff8003`b49f5468 c3 ret
0: kd> db ffff8003`b49f545b
ffff8003`b49f545b 68 25 c5 01 7f c7 44 24-04 02 f8 ff ff c3 31 04

68 ?? ?? ?? ?? C7 44 24 04 ?? ?? ?? ?? C3

94个结果,估计跳板格式是定死的。

编写CE lua脚本dump出所有的跳转函数,测试对跳板写入0xCC,windbg中可以接管到断点。

之后把dump出的函数列表去重后依次在windbg里面看符号地址,这样就能得出shellcode的所有导入函数了;依次下断分析,可以知道那些函数是正在被调用的。写个下断脚本一键下断。

最终得出正常运行时调用的系统函数大致如下:

程序会死循环遍历进程ID,并调用PsLookupProcessByProcessId获取进程对象。

for(auto pid=0x10ull; pid < 0x40000; pid+=4)
PsLookupProcessByProcessId(pid, &Process);

Hook更底层的PspReferenceCidTableEnty可以得出最大PID为0x40000找到shellcode调用地址,按4K对齐的方式找到一个大致的shellcode头。

之后dump shellcode到文件,拖到IDA一条龙服务。

编写一个简单的脚本去除shellcode中两处影响分析的控制流混淆指令,去掉混淆后只剩一个jmp指令,虽然还有很多混淆,但是基本不影响IDA创建函数分析控制流了。

仔细观察被混淆的指令:

找到规律:

call的传参指令及返回值寄存器操作,非易失寄存器读写,内存读写指令,堆栈操作指令,cmovcc指令,cmp/test+jcc指令,以及某些特定代码块结束的add rdx,[x+y] -> jmp rdx...

混淆的SSE/AVX指令穿插在这些正常指令之间,但是混淆指令的寄存器和算术逻辑运算结果并没有保留或被引用,因此笔者感觉可以使用活跃变量分析去除这些垃圾指令,但奈何比赛时间有限,笔者对以上代码熟练度并不高,故选择手动删除混淆代码(删除之后还有ollvm的控制流平坦化,但是不影响分析)。

去掉混淆之后,代码逻辑清晰可见,参数一传入了保存进程信息的结构体指针。

struct process_info_t
{
__int64 pid;
__int64 process;
bool flag;
};

分析用同等方式去掉混淆,总耗时5小时,耗能三个馒头。

第一个xref:

PsGetProcessExitStatus判断进程存在。

获取进程名称:

第二个xref:

与初赛如出一辙的字符串加密方式,在sub_FFFF8003BD0E543C下个断能拿到解密后的字符串 -> “GameSec.exe”。

然后随便搞个程序改名成GameSec.exe,丢到测试机里运行。再启动Loader跑起shellcode后直接蓝了。

调用栈看是MmCopyVirtualMemory里面炸的,说明shellcode是用这个系统函数读取的进程内存。同样用CE附加虚拟机外部写0xCC断点的方式,运行GameSec.exe让虚拟机断在跳板函数上。

NTSTATUS MmCopyVirtualMemory(PEPROCESS FromProcess, PVOID FromAddress, ...);
FromProcess -> Rcx
FromAddress -> Rdx

题目要求分析shellcode反复在读取哪个内存地址,找一下Rdx来源即可。观察发现rdx后缀是ACE,直接在shellcode里面搜索0xACE能得到两处指令。

依次对这两处地址下断,第二处地址可以断下来,拿到IDA里分析。

sub_FFFF8003BD0E0EA6返回了目标进程的PEB地址,故shellcode反复在读取GameSec.exe进程的PEB+0xACE处的内存,大小为1Byte。


解决方案

search程序搜索shellcode的思路:

1、将自身插入到shellcode执行的上下文环境(线程)中,采集调用堆栈并判断地址是否合法,可以通过Hook Shellcode调用的系统函数或者利用操作系统的某些机制实现,具体方式有EtwHook、HypervisorHook、DPC、APC、NMI、IPI等。

2、扫描内存(虚拟、物理内存),通过shellcode执行地址可以判断出其位于NonPagedPool上面,可以通过遍历BigPool找到目标内存的Tag进而判断内存特征是否为shellcode。也可以通过直接对物理内存进行扫描的方法判断内存特征。

笔者根据题目要求选择几种方式实现:

1.通过向全部核心插入异步执行的DPC例程打断执行中的代码并检查调用堆栈;

2.让全部核心同步执行DPC例程打断执行中的代码并检查调用堆栈;

3.通过注册NMI回调函数并向全部核心发送NMI打断执行中的代码并检查调用堆栈;

4.通过向全部核心发送IPI(处理器间中断)的方式打断执行中的代码并检查调用堆栈;

5.遍历内核Pool内存寻找shellcode特征以定位shellcode;

6.遍历系统进程页表,对比内存定位shellcode;

7.遍历系统所有物理内存,对比内存定位shellcode;

8.设置DPC定时器,在回调函数中栈回溯查找shellcode;

除上述方法以外还可以通过EtwHook、Hypervisor监控、PMI......实现,但是万变不离其宗,大道至简如是说。

实际效果如下。异步DPC:

同步DPC:

IPI(处理器间中断):

NMI:

补:在NMI里不要DbgPrint挂调试器会蓝的,只保留数据就好。

池内存扫描:

物理内存扫描:

页表扫描:

BigPool、页表扫描、物理内存扫描效果:

DPC定时器:

整体运行效果图:

项目地址(https://github.com/rogxo/search)

看雪ID:R0g

https://bbs.kanxue.com/user-home-910874.htm

*本文为看雪论坛精华文章,由 R0g 原创,转载请注明来自看雪社区

# 往期推荐

1、怎么让 IDA 的 F5 支持一种新指令集?
2、2024腾讯游戏安全大赛-安卓赛道决赛VM分析与还原
3、Windows主机入侵检测与防御内核技术深入解析
4、系统总结ARM基础
5、AliyunCTF 2024 - BadApple

球分享

球点赞

球在看

点击阅读原文查看更多


文章来源: https://mp.weixin.qq.com/s?__biz=MjM5NTc2MDYxMw==&mid=2458553428&idx=1&sn=19827007d760d6a001d6883bac5c5a83&chksm=b18dbcde86fa35c87c8cf4a5940b9d361332aa42e416daa39b12962e1d7a0ecf7ef95c362b53&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh