一文读懂PE文件签名并手工验证签名有效性
2022-5-27 18:8:49 Author: mp.weixin.qq.com(查看原文) 阅读量:91 收藏


本文为看雪论坛精华文章
看雪论坛作者ID:Hacksign

本文是 《一文读懂对称加密、非对称加密、哈希值、签名、证书、https之间的关系》 (https://debugwar.com/article/one-article-to-understand-the-relationship-between-encryption-certificate-signature-https)的姊妹篇(下文简称“姊妹篇”),在阅读本文之前,最好先阅读一下上一篇文章。
 
本文对日常工作中应用最广泛,也是大家最容易接触到的PE文件(也就是大家常说的exe/dll/sys文件)的签名进行了深入讲解,并一步一步讲解如何手工验证一个PE文件签名的有效性。


背景

近期工作中,有个自研驱动需要防止未授权R3程序调用,因此需要设计一个方案出来。笔者第一想到的是利用Windows的签名机制,固化签名的CommonName和受信任的父证书公钥到驱动程序中,然后分别校验驱动、调用发起者线程所在模块、调用发起者二进制程序的签名,来防止非法调用。
 
查了很多签名相关的资料发现都是R3下WinTrust API函数实现的,然而问题是R0下并没有这些API可以使用,看来要自己写代码实现一遍签名校验的逻辑了。
 
后来又经过一段时间探索, 发现现成的代码都是重度和某个平台或库绑定——例如Linux下的签名验证代码和linux的数据结构绑定、再比如其他几个开源的代码和openssl库绑定,而openssl库在R0下也是无法调用的,因为依赖了很多R0下没有的函数(例如_open等POSIX C函数)。
 
看来只能自己动手了,所以继续转向研究签名校验的底层原理。然而网上大部分关于签名的资料,全部都偏重于理论介绍,至少笔者没有搜到只使用哈希和RSA算法实操验证签名的例子——那没办法了,只好完全自己从头来验证一遍了。


几个概念

ASN.1

ASN.1本身只定义了表示信息的抽象句法,但是没有限定其编码的方法。摘自维基百科

DER编码

由于ASN.1并没有规定编码方式,因此在实际组织数据的时候,还需要一些编码方式,DER就是最常使用的一种,这种编码方式是大字节序的。

PKCS#7/PKCS#1/PKCS#9

这些为多种加密格式的预定义标准。

AuthentiCode签名

微软定义的(使用了PKCS#7等标准的)一种嵌入式签名格式,另外一种常见的为CAT签名(.cat文件)。
 
通俗一点理解上面的几个概念:ASN.1可以理解为单个的汉字,DER编码则是规定了使用哪些汉字组成一些常用的词组,PKCS#7等标准进一步规定了用哪些词组可以组成一些固定的句式,最后AuthentiCode则综使用这些固定句式写了一篇文章出来。


再谈证书

通过姊妹篇,我们已经大概了解了证书、签名的概念和作用。但是在姊妹篇中,只给出了一张证书的大概结构(下图),并没有对其进行详细解释。
 
 
本文由于要进行手工验证,因此有必要给出证书的详细结构:
Certificate ::= SEQUENCE {     tbsCertificate TBSCertificate,     signatureAlgorithm AlgorithmIdentifier,     signatureValue BIT STRING }
上述定义使用的是ASN1语法, 此处我们需要先了解如下信息:
  • tbsCertificate为上图中的蓝色部分

  • signatureValue为上图中的红色部分

  • signatureAlogrithm没有体现在上图中,此字段表示使用的是哪个哈希函数对tbsCertificate的数据进行的哈希计算

知道了上述结构,我们就可以搞清楚证书是如何验证的了:
  • 提取该证书的父证书(签发者或者叫Issuer)公钥

  • 使用公钥解密子证书中的signatureValue部分,然后根据PKCS#9的结构,提取出哈希值1,此处记为Hash1

  • 使用signatureAlgorithm中相同哈希算法对tbsCertificate数据做哈希,得到Hash2

  • 如果Hash1与Hash2相等,则证书有效

手工验证证书有效性

好了,枯燥的理论暂时告一段落,我们来看一个实际的例子。
 
我们以Windows版本的Python.exe文件为例, 依次查看其数字签名与证书信息如下:
 
可以发现Python.exe的数字签名使用的是sha256算法,证书链为:
DigiCert->DigiCert SHA2 Assured ID Code Singing CA->Python Software Foundation

通过姊妹篇我们知道,整个PKI体系,是建立在信任一些随操作系统或浏览器分发的证书体系之上的。为了方便本文描述,假设我们信任的是上述体系链中的 DigiCert SHA2 Assured ID Code Singing CA 这一张证书,我们选择“详细信息”下的“复制到文件”就可以导出该证书用于研究(记得导出的时候选择DER格式):
 
首先我们需要获得父证书的公钥,可以使用openssl命令获取,下面的命令将Python.exe的父证书(PythonParent.cer)公钥输出到了PythonParentPublicKey.pem文件中:
>> openssl x509 -inform DER -in PythonParent.cer -pubkey -noout > PythonParentPublicKey.pem>> cat PythonParentPublicKey.pem-----BEGIN PUBLIC KEY-----MIIBIjANBgkqhkiG9w0BAQEFAAOCAQ8AMIIBCgKCAQEA+NOzHH8OEa9ndwfTCzFJGc/Q+0WZsTrbRPV/5aid2zLXcep2nQUut4/6kkPApfmJ1DcZ17aq8JyGpdglrA55KDp+6dFn08b7KSfH03sjlOSRI5aQd4L5oYQjZhJUM1B0sSgmuyRpwsJS8hRniolF1C2ho+mILCCVrhxKhwjfDPXiTWAYvqrEsq5wMWYzcT6scKKrzn/pfMuSoeU7MRzP6vIK5Fe7SrXpdOYr/mzLfnQ5Ng2Q7+S1TqSp6moKq4TzrGdOtcT3jNEgJSPrCGQ+UpbB8g8S9MWOD8Gi6CxR93O8vYWxYoNzQYIH5DiLanMg0A9kczyen6Yzqf0Z3yWT0QIDAQAB-----END PUBLIC KEY-----
现在父证书公钥有了,接下来我们需要分离Python.exe证书的tbsCertificate和signatureValue部分。那么我们如何知道这两部分在证书中的偏移和长度呢?答案是:继续使用万能的openssl命令
 
首先来直观感受一下Pythone.exe的证书信息:
>> openssl x509 -inform DER -in ./Python.exe.cer -noout -text Certificate:     Data:         Version: 3 (0x2)         Serial Number:             03:3e:d5:ed:a0:65:d1:b8:c9:1d:fc:f9:2a:6c:9b:d8         Signature Algorithm: sha256WithRSAEncryption         Issuer: C = US, O = DigiCert Inc, OU = www.digicert.com, CN = DigiCert SHA2 Assured ID Code Signing CA         Validity             Not Before: Dec 18 00:00:00 2018 GMT             Not After : Dec 22 12:00:00 2021 GMT         Subject: C = US, ST = New Hampshire, L = Wolfeboro, O = Python Software Foundation, CN = Python Software Foundation         Subject Public Key Info:             Public Key Algorithm: rsaEncryption                 RSA Public-Key: (4096 bit)                 Modulus:                     00:aa:bd:a4:4b:b2:75:b9:6e:e8:25:1c:65:b1:da:                     c4:4c:08:ca:6a:b7:e8:1f:94:c8:f0:f5:92:4f:a6:                     1b:db:13:e8:a0:fe:ef:1d:3e:22:69:55:f2:2f:92:                     f3:7b:57:f9:dc:9c:3a:ed:2a:7e:bb:9d:b8:7c:95:                     df:df:4a:87:56:21:16:c6:e9:b2:d9:15:86:d2:77:                     22:53:67:7e:98:ca:b3:8e:56:80:59:26:4d:17:4b:                     b8:45:cb:f2:0c:9a:24:11:5d:11:50:ea:88:e4:21:                     b9:cc:f2:37:5b:db:90:e8:b8:94:93:71:c2:61:6e:                     a4:a4:7d:7b:ec:0e:53:de:9c:3f:3e:8f:0e:f0:a1:                     2b:24:69:f5:6a:76:aa:b4:82:02:ab:df:72:4b:1a:                     cc:69:df:f6:84:f3:01:45:fe:8d:75:a8:7b:7f:b1:                     cf:9f:58:24:49:24:c0:a1:e8:f2:ba:a1:79:87:e0:                     74:a8:8e:3e:24:ae:7e:54:bb:f3:eb:9f:55:4d:b0:                     16:26:c6:1a:92:4c:59:c5:55:98:a4:5b:f8:29:e4:                     12:4b:0a:28:d0:3c:cc:be:61:11:b1:3c:cd:bd:50:                     4c:5a:1b:bd:3a:b8:89:36:0f:90:7c:59:9f:f7:ac:                     d5:4e:ef:77:71:9f:ab:ef:13:29:6d:7c:9f:20:e1:                     8a:84:73:1a:46:e6:7c:8a:1b:96:23:1d:e0:23:d5:                     87:0c:55:fa:7c:12:91:f3:e1:e5:85:d9:1a:88:11:                     16:22:c5:d1:a3:2f:84:41:4c:8a:ef:35:2c:f8:5a:                     8e:a3:6b:11:62:db:5b:b3:c3:13:17:d6:03:28:56:                     70:c8:f8:e7:f5:69:fe:80:b1:9d:e4:d5:04:57:23:                     6f:0f:d4:15:18:11:2d:37:bb:f1:f3:b6:dd:b8:95:                     01:f0:5e:03:ca:51:2c:32:d6:53:7e:3c:3f:6a:ee:                     80:98:e9:e6:9d:e2:b9:51:ca:92:26:ec:11:c9:96:                     86:36:4e:f2:de:a8:f4:ea:eb:71:f8:74:d3:a8:78:                     22:f7:be:54:a7:17:f2:af:00:2a:92:8b:e8:64:45:                     81:55:2a:6f:92:ef:0f:56:19:01:5d:c2:e6:35:ee:                     8c:10:79:45:89:a3:28:88:00:c0:78:a9:97:e5:11:                     51:90:df:95:ae:66:06:4e:0e:33:6a:3c:5f:74:77:                     88:63:c4:ef:2d:fe:3c:b5:37:e6:9d:02:5d:f7:c8:                     1e:25:0b:ff:d3:53:54:cb:f1:71:bb:0a:80:b9:39:                     1a:7b:3e:4d:97:52:f1:3f:40:a9:4c:78:60:87:33:                     b8:15:10:f8:8a:d4:f6:c2:a4:e1:e2:3a:68:8f:0f:                     50:66:7b                 Exponent: 65537 (0x10001)         X509v3 extensions:             X509v3 Authority Key Identifier:                  keyid:5A:C4:B9:7B:2A:0A:A3:A5:EA:71:03:C0:60:F9:2D:F6:65:75:0E:58              X509v3 Subject Key Identifier:                  FC:2A:BF:7E:D4:BE:AC:F3:82:9C:A4:CF:7B:22:01:3B:B8:8F:07:F2             X509v3 Key Usage: critical                 Digital Signature             X509v3 Extended Key Usage:                  Code Signing             X509v3 CRL Distribution Points:                   Full Name:                   URI:http://crl3.digicert.com/sha2-assured-cs-g1.crl                  Full Name:                   URI:http://crl4.digicert.com/sha2-assured-cs-g1.crl              X509v3 Certificate Policies:                  Policy: 2.16.840.1.114412.3.1                   CPS: https://www.digicert.com/CPS                 Policy: 2.23.140.1.4.1              Authority Information Access:                  OCSP - URI:http://ocsp.digicert.com                 CA Issuers - URI:http://cacerts.digicert.com/DigiCertSHA2AssuredIDCodeSigningCA.crt              X509v3 Basic Constraints: critical                 CA:FALSE     Signature Algorithm: sha256WithRSAEncryption          4b:75:a1:2d:b5:5f:46:b1:89:a7:cf:8f:26:3e:be:56:2a:8d:          62:ae:52:ef:d8:16:e6:16:20:4a:ba:89:14:5a:15:a6:cd:0e:          18:fd:44:11:50:17:f6:89:88:4e:66:b2:b4:04:39:f0:03:eb:          fe:a0:55:21:fd:d6:56:56:06:a8:3a:34:47:86:f5:3f:52:5d:          b8:80:3e:f2:7d:08:45:85:b1:d9:17:52:b8:db:5a:1b:c2:9e:          e6:7b:92:a5:2e:53:90:40:ba:62:35:41:16:e9:62:06:4b:dd:          40:3e:89:95:e4:9a:36:c6:87:59:67:f2:b5:21:58:8c:5b:05:          82:f8:4a:0d:a7:aa:90:78:e2:9e:c2:50:56:24:3e:3f:cc:6f:          05:36:82:f0:55:da:95:e3:8f:95:9a:b2:4a:19:b6:c0:02:32:          fe:60:e3:60:4d:a1:52:e8:44:08:be:7a:fe:ac:d3:b3:ce:b7:          e2:6d:1d:12:26:f3:b9:53:ca:e7:3c:c2:1d:2c:c1:33:d4:c2:          4b:0a:6c:b5:35:65:d8:fd:0a:9a:ad:cd:79:ee:54:4d:30:e7:          47:b1:26:f4:52:2b:75:6d:e2:0f:b4:be:28:29:23:7a:8f:98:          37:69:91:ff:7e:e0:cb:f2:d1:73:0d:72:aa:ed:87:0d:b4:47:          e3:e4:22:53

上述 Signature Algorithm: sha256WithRSAEncryption 下面的即为 signatureValue 部分,把他复制到任意的二进制编辑器中,然后另存为 PythonExeSignatureValue.bin, 最后使用openssl解密这部分数据:
>> hexdump -C PythonExeSignatureValue.bin00000000 4b 75 a1 2d b5 5f 46 b1 89 a7 cf 8f 26 3e be 56 |Ku.-._F.....&>.V|00000010 2a 8d 62 ae 52 ef d8 16 e6 16 20 4a ba 89 14 5a |*.b.R..... J...Z|00000020 15 a6 cd 0e 18 fd 44 11 50 17 f6 89 88 4e 66 b2 |......D.P....Nf.|00000030 b4 04 39 f0 03 eb fe a0 55 21 fd d6 56 56 06 a8 |..9.....U!..VV..|00000040 3a 34 47 86 f5 3f 52 5d b8 80 3e f2 7d 08 45 85 |:4G..?R]..>.}.E.|00000050 b1 d9 17 52 b8 db 5a 1b c2 9e e6 7b 92 a5 2e 53 |...R..Z....{...S|00000060 90 40 ba 62 35 41 16 e9 62 06 4b dd 40 3e 89 95 |[email protected]@>..|00000070 e4 9a 36 c6 87 59 67 f2 b5 21 58 8c 5b 05 82 f8 |..6..Yg..!X.[...|00000080 4a 0d a7 aa 90 78 e2 9e c2 50 56 24 3e 3f cc 6f |J....x...PV$>?.o|00000090 05 36 82 f0 55 da 95 e3 8f 95 9a b2 4a 19 b6 c0 |.6..U.......J...|000000a0 02 32 fe 60 e3 60 4d a1 52 e8 44 08 be 7a fe ac |.2.`.`M.R.D..z..|000000b0 d3 b3 ce b7 e2 6d 1d 12 26 f3 b9 53 ca e7 3c c2 |.....m..&..S..<.|000000c0 1d 2c c1 33 d4 c2 4b 0a 6c b5 35 65 d8 fd 0a 9a |.,.3..K.l.5e....|000000d0 ad cd 79 ee 54 4d 30 e7 47 b1 26 f4 52 2b 75 6d |..y.TM0.G.&.R+um|000000e0 e2 0f b4 be 28 29 23 7a 8f 98 37 69 91 ff 7e e0 |....()#z..7i..~.|000000f0 cb f2 d1 73 0d 72 aa ed 87 0d b4 47 e3 e4 22 53 |...s.r.....G.."S|00000100

上面是提取的签名数据, 使用下面的命令解密, 解密后的文件保存到 PythonExeSignatureValueDecrypted.bin
>> openssl rsautl -inkey PythonParentPublicKey.pem -pubin -in PythonExeSignatureValue.bin >PythonExeSignatureValueDecrypted.bin>> hexdump -CPythonExeSignatureValueDecrypted.bin00000000 30 31 30 0d 06 09 60 86 48 01 65 03 04 02 01 05 |010...`.H.e.....|00000010 00 04 20 ca 1c 82 f3 fd 76 74 30 54 39 09 8d 87 |.. .....vt0T9...|00000020 95 4f e2 af b4 a0 64 24 bf 49 2f 27 34 61 46 2e |.O....d$.I/'4aF.|00000030 ea d7 33                                        |..3|00000033

上面解密后的“神秘数据”其实是DER编码的PKCS#9消息, 其依然使用ASN1语法规范, 因此可以继续使用openssl解析:
>> openssl asn1parse -i -inform DER -in PythonExeSignatureDecrypted.bin0:d=0  hl=2 l= 49 cons: SEQUENCE2:d=1  hl=2 l= 13 cons: SEQUENCE4:d=2  hl=2 l= 9  prim: OBJECT :sha25615:d=2 hl=2 l= 0  prim: NULL17:d=1 hl=2 l= 32 prim: OCTET STRING [HEX DUMP]:CA1C82F3FD7674305439098D87954FE2AFB4A06424BF492F273461462EEAD733

至此,我们得到了第一个哈希值, 该哈希值是一个SHA256值:
 
CA1C82F3FD7674305439098D87954FE2AFB4A06424BF492F273461462EEAD733
 
接下来我们需要提取Python.exe证书的tbsCertificate部分, 可以使用如下openssl命令先查看Python.exe证书的结构(为了描述直观,输出内容做了删减):
>> openssl asn1parse -i -inform DER -in Python.exe.cer0:d=0    hl=4 l=1607 cons: SEQUENCE4:d=1    hl=4 l=1327 cons: SEQUENCE.......1335:d=1 hl=2 l= 13  cons: SEQUENCE1337:d=2 hl=2 l= 9   prim: OBJECT :sha256WithRSAEncryption1348:d=2 hl=2 l= 0   prim: NULL1350:d=1 hl=4 l= 257 prim: BIT STRING
上述结果中,每一行冒号开始前的数字代表在数据中的偏移, hl代表头长度, l代表实际的数据长度。根据上文中证书的ASN1结构定义, 我们需要从offset 4开始提取4+1327=1331长度的数据, 此部分数据即为Python.exe证书的tbsCertificate部分, 使用如下命令提取:
>> dd if=./Python.exe.cer of=./PythonExetbsCertificate.bin skip=4 bs=1 count=1331输入了 1331+0 块记录输出了 1331+0 块记录1331 字节 (1.3 kB, 1.3 KiB) 已复制,0.018058 s,73.7 kB/s

然后, 我们对提取的这部分tbsCertificate数据做sha256:
>> sha256sum PythonExetbsCertificate.binca1c82f3fd7674305439098d87954fe2afb4a06424bf492f273461462eead733 PythonExetbsCertificate.bin

可以看到, 得到的第二个sha2256值“恰好”与上面的第一个sha256值相等。

证书验证小结

回顾一下上面我们干了什么。

  1. 从信任证书 DigiCert SHA2 Assured ID Code Singing CA 中提取了此证书的公钥

  2. 使用这个公钥解密了Python.exe证书中的signatureValue部分,得到第一个sha256值

  3. 提取Python.exe证书的tbsCertificate部分数据,并对提取的数据做sha256运算,得到第二个sha256值

  4. 第一个sha256值与第二个sha256相等

因此,得出结论,Python.exe使用的证书是合法有效且没有经过篡改的,因此这张证书中记录的数据,确切的说是这张证书tbsCertificate部分记录的数据,可以完全信任。那么tbsCertificate记录着什么重要数据需要这么“大费周章”的保护呢?答案是:Python.exe开发者的公钥!
 
众所周知,RSA作为非对称加密,公钥加密的数据只能由私钥解密(不知道的请去读姊妹篇),反之依然。也就是说,现在我们用Python.exe开发者的公钥去解密一段数据,只要解密成功了,这段数据就一定是开发者“发送”的,因为理论上, Python.exe开发者的私钥, 只有可能被开发者所持有。
 
那么,我们应该拿着Python.exe开发者的公钥去解密哪块数据呢?
 
让我们继续探索。


PE文件AuthentiCode

在继续之前,我们又需要补充一部分理论知识了。

一点PE文件结构的知识

估计各位对PE文件结构已经不陌生了,但是为了本文的完整性这里还是要简单说一下,熟悉的可以直接跳过。
 
这里借用一张PE文件结构的图 [参考5]:

我们可以由DOS Header入手, 找到PE Header, 然后是Optional Header中的IMAGE_DATA_DIRECTORY结构。PE签名涉及到的数据,在IMAGE_DATA_DIRECTORY的第5项(下标为4),这一项记录着SecurityDirectory的偏移和长度,使用PE文件结构分析工具,可以轻松定位这块数据:

从上图中可知,此段数据位于RawOffset 0x16E00处,大小为0x1A10,这段数据定义如下:
typedef struct _WIN_CERTIFICATE {     DWORD       dwLength;     WORD        wRevision;     WORD        wCertificateType;        BYTE        bCertificate[ANYSIZE_ARRAY]; } WIN_CERTIFICATE, *LPWIN_CERTIFICATE;

可见,从0x16E00处往后偏移2个DWORD才是真正的PKCS#7格式的数据。可以使用如下命令抽取SecurityDirectory中存储的PKCS#7数据:
>> dd if=./python.exe of=./PythonPkcs7Data.bin skip=93704 bs=1 count=6664输入了 6664+0 块记录输出了 6664+0 块记录6664 字节 (6.7 kB, 6.5 KiB) 已复制,0.0351038 s,190 kB/s

下文中分析的数据,均为此处提取的数据。
 
有了上面PE结构的基本知识,让我们来看一下更加有深度的内容,首先借用微软文档中的一张图:

上图中左半部分,基本为上文中提到的PE结构。右半部分,微软对PKCS#7格式的数字签名数据部分做了一个大概的结构介绍。实际上,这部分的数据结构要远比上图复杂,不过目前为止大概只需要知道个基本结构即可。
 
上图中的右半部分,实际的结构对应SignedData,展开看一下该结构。

微软对SignedData的定义

SignedData的定义

上面提到最终提取的数据,是SignedData格式,其实也是符合PKCS#7标准的数据,满足以下ASN.1描述的格式:
SignedData ::= SEQUENCE {   version Version,   digestAlgorithms DigestAlgorithmIdentifiers,   contentInfo ContentInfo,   certificates         [0] IMPLICIT ExtendedCertificatesAndCertificates        OPTIONAL,   Crls     [1] IMPLICIT CertificateRevocationLists OPTIONAL,   signerInfos SignerInfos  }  DigestAlgorithmIdentifiers ::=   SET OF DigestAlgorithmIdentifier  ContentInfo ::= SEQUENCE {   contentType ContentType,   content     [0] EXPLICIT ANY DEFINED BY contentType OPTIONAL  }  ContentType ::= OBJECT IDENTIFIER  SignerInfos ::= SET OF SignerInfo
其中contentInfo中会存放PE文件的AuthentiCode信息,这个结构中,我们需要关注content字段中存储的数据,详情请见下文。
 
certificates中会存放PE文件开发者的证书等信息,我们可以从这里面提取开发者的公钥。上文中已经对证书部分做过详细介绍了,此处不再赘述。
 
signerInfos中存放着使用PE文件开发者私钥加密的数据和一些用于验证其他信息用的数据(可选,不一定有)。

SignerInfo的定义

其ASN.1语法的定义如下:
SignerInfo ::= SEQUENCE {     version Version,     issuerAndSerialNumber IssuerAndSerialNumber,     digestAlgorithm DigestAlgorithmIdentifier,     authenticatedAttributes         [0] IMPLICIT Attributes OPTIONAL,     digestEncryptionAlgorithm     DigestEncryptionAlgorithmIdentifier,     encryptedDigest EncryptedDigest,     unauthenticatedAttributes         [1] IMPLICIT Attributes OPTIONAL } IssuerAndSerialNumber ::= SEQUENCE {     issuer Name,     serialNumber CertificateSerialNumber } EncryptedDigest ::= OCTET STRING
这个定义中,我们最为关注的是 encryptedDigest 字段,根据微软文档的定义,此字段记录了一段被软件签发者私钥加密的数据:

通过分析导出的PKCS#7二进制数据,最终定位到此数据的偏移为:0x15f6(需要跳过4字节头),大小为0x0200:

将此部分二进制数据复制出来之后,使用Python.exe证书中提取出来的公钥解密:
// 提取Python.exe公钥到PythonExePublicKey.pem文件中>> openssl x509 -in Python.exe.cer -inform DER -noout -pubkey > PythonExePublicKey.pem// Dump出来的SignedData.singerInfo.encryptDigest数据>> hexdump -C PythonPkcs7Encrypted.bin00000000 12 37 05 82 c9 7f 73 e9 fc ff d0 71 78 f8 50 04 |.7....s....qx.P.|00000010 18 c4 2d ae 0b 4f da 5f 6a db 88 79 44 bc 80 cd |..-..O._j..yD...|00000020 9d 8d 86 51 48 5d 83 38 d2 1f 5d 60 ed a6 09 6e |...QH].8..]`...n|00000030 61 1d 55 e6 0b df ab 34 01 21 e1 c3 17 5d 2f d7 |a.U....4.!...]/.|00000040 f6 e0 cd 18 1b 88 bb c9 f9 0f 2e b9 3b ea 34 28 |............;.4(|00000050 0e 4d 99 01 1b 33 66 59 d4 dd fa e0 4a 81 36 35 |.M...3fY....J.65|00000060 8f 6d b1 9e 76 f7 eb c9 5a 31 a4 0f 4f 32 28 be |.m..v...Z1..O2(.|00000070 a7 d9 7a 01 c9 d7 fa 22 06 10 76 06 55 57 42 ce |..z...."..v.UWB.|00000080 f5 9c 7e 36 ff 24 cc 0f 5d d1 b2 00 d2 e6 da 47 |..~6.$..]......G|00000090 03 c0 06 f1 41 cb 2a f3 7f cc 69 1c f1 ea 53 de |....A.*...i...S.|000000a0 ab ca 25 a3 db 53 6e 0e 06 ff 37 b6 71 a9 5b 6b |..%..Sn...7.q.[k|000000b0 85 d8 d7 b0 19 4e 1f 56 a2 5f b9 4c c4 4a 1b 18 |.....N.V._.L.J..|000000c0 4f 30 86 95 90 e6 b9 23 6d 74 9e 76 d3 7e 5f ad |O0.....#mt.v.~_.|000000d0 20 8e ae 02 d6 32 f3 a7 be ba 00 6a 30 90 8d e4 | ....2.....j0...|000000e0 83 d5 02 bb 19 e6 eb 62 a0 55 c9 4b 93 59 3b 12 |.......b.U.K.Y;.|000000f0 51 ef 7e 50 b3 f3 0b 50 3c e5 01 9a ef 6a 9a 9b |Q.~P...P<....j..|00000100 1a 2b a4 ef 79 47 09 1a d8 48 28 e8 2c 52 3e 29 |.+..yG...H(.,R>)|00000110 ad 31 05 2b 24 e6 11 e1 c0 bb 11 1d d0 0f e0 78 |.1.+$..........x|00000120 89 cf dc 85 e5 52 21 1c 43 69 b5 40 17 dc 08 98 |[email protected]|00000130 8e fe d6 36 d4 6b ce ef 24 06 34 09 eb 7f 1b 9d |...6.k..$.4.....|00000140 24 04 e2 e6 cb de b9 6d 14 70 3a b2 50 82 f9 83 |$......m.p:.P...|00000150 37 b8 b8 ee 70 08 ce 6e 94 53 0e c4 0a 8b 5b d9 |7...p..n.S....[.|00000160 98 b5 54 2f 94 bd 46 20 9f a7 38 02 86 ef d8 b5 |..T/..F ..8.....|00000170 64 a2 ea 2f 0b 79 fb d3 e0 5c a3 83 8f 94 54 56 |d../.y...\....TV|00000180 51 16 06 f7 fe ba 93 e2 b2 7d 08 74 08 a8 55 84 |Q........}.t..U.|00000190 11 09 7d 74 4b 6b 48 2f 4f 98 4b dd 19 5d f2 db |..}tKkH/O.K..]..|000001a0 18 40 d9 d1 a7 52 c3 35 7e 9a 5e d5 72 62 f2 64 |[email protected]~.^.rb.d|000001b0 f4 cd 3f 70 d6 de e8 27 a8 cd 06 30 40 58 80 31 |..?p...'[email protected]|000001c0 6a 44 7b 22 bd 4f 1b d0 1d 9e a5 b1 26 60 d5 e4 |jD{".O......&`..|000001d0 10 8e c5 67 4d 1d d2 51 b0 29 bb f5 f2 0f 24 e6 |...gM..Q.)....$.|000001e0 96 49 36 99 01 e2 56 aa 32 5f 13 c9 bd a0 2c dd |.I6...V.2_....,.|000001f0 06 db dc ae ee ca 28 9e 0c e8 98 68 2d e8 d0 a8 |......(....h-...|00000200// 使用PythonExePulbicKey.pem公钥解密PythonPkcs7Encrypted.bin数据到PythonPkcs7Decrypted.bin文件中>> openssl rsautl -inkey PythonExePublicKey.pem -pubin -in PythonPkcs7Encrypted.bin > PythonPkcs7Decrypted.bin// 解析解密后的PKCS#9数据(ASN1语法描述)>> openssl asn1parse -i -inform DER -in PythonPkcs7Decrypted.bin0:d=0  hl=2 l= 49 cons: SEQUENCE2:d=1  hl=2 l= 13 cons: SEQUENCE4:d=2  hl=2 l= 9  prim: OBJECT :sha25615:d=2 hl=2 l= 0  prim: NULL17:d=1 hl=2 l= 32 prim: OCTET STRING [HEX DUMP]:B300E437486CB53B647A9C1A84B2986502254681C688020158504646776C31E1
到这里,我们再次得到了一串神秘的sha256哈希值:B300E437486CB53B647A9C1A84B2986502254681C688020158504646776C31E1。那么问题来了,这段哈希值,是哪段数据的哈希值呢?
 
这里分两种情况:不存在SingedData.signerInfos.authenticatedAttributes字段和存在前述字段。
其中,第二种情况还有一个巨大的坑,至于是什么坑,下文会讲到。

不存在authenticatedAttributes字段

此种情况下,上述用公钥解密后的哈希值,应该等于ContentInfo字段用相同哈希算法计算后的值。
 
我们来实际操作一下。
 
首先是确定需要提取的二进制数据,偏移:0x3d(注意跳过2字节的头) 长度:0x4c,上图:
 
 
验证一下提取数据的哈希值:
>> hexdump -C PythonExeContentInfo.bin00000000 30 17 06 0a 2b 06 01 04 01 82 37 02 01 0f 30 09 |0...+.....7...0.|00000010 03 01 00 a0 04 a2 02 80 00 30 31 30 0d 06 09 60 |.........010...`|00000020 86 48 01 65 03 04 02 01 05 00 04 20 5a 3a d4 3d |.H.e....... Z:.=|00000030 81 d5 6a 86 d9 7b 24 b3 74 da 49 44 aa ee 94 c7 |..j..{$.t.ID....|00000040 10 e3 77 25 4c fe 8e cc 72 04 06 6a             |..w%L...r..j|0000004c>> sha256sum PythonExeContentInfo.binb5e4b32d6ebae47869646ccf93416b320a113b2d35d948e7e2a9122146cb9634 PythonContentInfo.bin
貌似……哈希值和上面解密出来的不一样啊……难道搞错了?其实不是的,这里的哈希值不正确是因为本例是第二种情况——其存在authenticatedAttributes字段,这里写出来只是为了作为一个例子,让各位在遇到无authenticatedAttributes字段时知道如何操作。
 
不过这个sha256值还是有用的, 需要大家留意一下,下文要用到。

存在authenticatedAttributes字段

看图, authenticatedAttributes字段位于偏移:0x1548处(这次不需要跳过头部两字节,坑1),长度:0x9a,把此部分数据dump出来,保存为PythonExeAttribute.bin。

注意:坑2来了,根据RFC规定, 需要将此部分数据的第一个字节,改成0x31, 即0xA1需要替换成0x31!这点一定要注意,不然会导致计算出来的哈希值不对!!
// 注意第一个字节已经被替换成0x31>> hexdump -C PythonExeAttrubite.bin00000000 31 81 98 30 19 06 09 2a 86 48 86 f7 0d 01 09 03 |1..0...*.H......|00000010 31 0c 06 0a 2b 06 01 04 01 82 37 02 01 04 30 1c |1...+.....7...0.|00000020 06 0a 2b 06 01 04 01 82 37 02 01 0b 31 0e 30 0c |..+.....7...1.0.|00000030 06 0a 2b 06 01 04 01 82 37 02 01 15 30 2c 06 0a |..+.....7...0,..|00000040 2b 06 01 04 01 82 37 02 01 0c 31 1e 30 1c a0 1a |+.....7...1.0...|00000050 80 18 00 50 00 79 00 74 00 68 00 6f 00 6e 00 20 |...P.y.t.h.o.n. |00000060 00 33 00 2e 00 38 00 2e 00 36 30 2f 06 09 2a 86 |.3...8...60/..*.|00000070 48 86 f7 0d 01 09 04 31 22 04 20 b5 e4 b3 2d 6e |H......1". ...-n|00000080 ba e4 78 69 64 6c cf 93 41 6b 32 0a 11 3b 2d 35 |..xidl..Ak2..;-5|00000090 d9 48 e7 e2 a9 12 21 46 cb 96 34                |.H....!F..4|0000009b[email protected] [11:02:59] : ~/Work/虚拟机共享目录/Certificate/python>> sha256sum PythonExeAttrubite.binb300e437486cb53b647a9c1a84b2986502254681c688020158504646776c31e1 PythonExeAttrubite.bin

现在计算出来的SHA256就可以和上面公钥解密的数据对上了, 说明Attribute这块数据的确是Python.exe的开发者“发送”的数据,里面的内容我们可以信任。那么……里面的内容又是什么呢?请看上图的红框部分数据,这部分数据是不是“正好”是 PythonExeContentInfo.bin 的SHA256值(请参考“不存在authenticAttributes”一节的最后)?
 
因此根据哈希值的唯一性,我们进而可以确认ContentInfo部分的数据,也是可信的。那呃ContentInfo部分又双叒存放什么数据呢?请注意下图红框中的内容:
我们得到了一个SHA256值:5A3AD43D81D56A86D97B24B374DA4944AAEE94C710E377254CFE8ECC7204066A,由上面的分析可知,此哈希值是可信的。
 
大家坚持一下,寻宝游戏快要结束了,因为我们即将迎来最重要的部分——AuthentiCode的计算。


AuthentiCode哈希

根据微软的文档,AuthenticCode的计算需要跳过CheckSum字段、SecurityDirectory字段以及最后的PKCS#7格式的证书数据部分。
 
然而本节并不打算过分深入的追究计算过程。因为——感谢伟大的开源精神——Github上有开源的计算工具,而且还很贴心的提供了编译好的二进制程序:
上图就是本文Python.exe程序的AuthentiCode计算结果。这个工具大家可以到 这个Git Repository 中下载。
 
注意上图的SHA256部分,是不是再次“恰好”和ContentInfo中存放的SHA256数据相等?

验证PE文件是否经过篡改

PKI体系的最基本思路:
  1. 验证数据真实有效

  2. 提取数据中的内容

  3. 回到第一步,直到验证结束

使用这个思路,梳理一下本文中做的事情和涉及到的哈希值:
  1. 首先用Python.exe父证书的公钥解密了Python.exe证书的signatureValue部分,得到了第一个哈希值:CA1C82F3FD7674305439098D87954FE2AFB4A06424BF492F273461462EEAD733,该值和Python.exe证书的tbsCertificate部分数据计算的sha256相等,因此tbsCertificate部分的消息未经篡改、可以信任。

  2. tbsCertificate部分的数据, 包含Python.exe开发者的公钥,然后我们使用Python.exe开发者公钥解密了SingedData.SingerInfo.encryptedDigest部分数据,此时得到了第二个哈希值:B300E437486CB53B647A9C1A84B2986502254681C688020158504646776C31E1

  3. 使用相同的哈喜算法,计算SignedData.SingerInfo.authenticatedAttributes字段的哈希值,发现此哈希值和第二步中得到的哈希值二相等。经过进一步查看authenticatedAttributes中的数据发现第三个哈希值:b5e4b32d6ebae47869646ccf93416b320a113b2d35d948e7e2a9122146cb9634

  4. 使用相同的算法计算SignedData.contentInfo.content哈希值,发现其和第三步之中的哈希三相等。查看SignedData.contentInfo.content的内容,发现第四个哈希值:5A3AD43D81D56A86D97B24B374DA4944AAEE94C710E377254CFE8ECC7204066A

  5. 使用微软描述的方法计算Python.exe的AuthentiCode,发现此值和上面第四步中的哈希相等。

查看上面5步的链路,发现其实是环环相扣的,都是用一个已经确认未经篡改的消息,去验证另外一个消息,如此循环往复。从信任的Python.exe父证书开始,到后面的每一步得出的数据都应该认为是受信任的,最终通过AuthentiCode,得出PE文件未经过篡改的结论。


伸手党福利

如果你只想白嫖现成的PE验证代码,那么可以参考下面这个Repo的代码,这个工程提供了c/c++/python的接口可以操作PE/ELF/MachO等格式的文件,且依赖很少可移植性较强:
 
https://github.com/lief-project/LIEF
 
同时,提供一个可移植性很强的ASN.1解析库,此库使用纯C语言编写:
 
https://gitlab.com/mtausig/tiny-asn1
 
最后,上文中提到过的AuthentiCode计算器,开源且提供GUI和命令行版本的二进制文件:
 
https://github.com/hfiref0x/AuthHashCalc
 
相信通过上面三个工程以及本文的实操,大家应该可以撸一套自己的完整性校验代码出来了。
 
最后愿大家的代码永远都不会被Patch~咱们下一篇文章再见 ;)
  1. ASN.1格式学习

  2. ASN.1维基百科

  3. ASN.1 DER 格式編碼與解碼

  4. PKCS#7

  5. PE文件结构

  6. Windows Authenticode Portable Executable Signature Format

  7. PE文件中的数字签名信息

  8. PE文件逆向之数字签名详细解析

  9. 开源的AuthentiCode计算器

  10. 手工验证一张数字证书的有效性

  11. Authenticode签名对未签名代码的应用

看雪ID:Hacksign

https://bbs.pediy.com/user-home-156241.htm

*本文由看雪论坛 Hacksign 原创,转载请注明来自看雪社区

# 往期推荐

1.海莲花glitch样本去混淆

2.反射式DLL注入实现

3.angr符号变量转LLVM IR

4.记录一次对某CMS漏洞挖掘

5.Android APP漏洞之战—验证码漏洞挖掘详解

6.CTF 中 glibc堆利用及 IO_FILE 总结

球分享

球点赞

球在看

点击“阅读原文”,了解更多!


文章来源: http://mp.weixin.qq.com/s?__biz=MjM5NTc2MDYxMw==&mid=2458449573&idx=1&sn=cfab5d8030041ed7d6d4ed0eb84619fc&chksm=b18fc62f86f84f3901d3bfa087c6b0ceb1882ad1682d155e01107cc4b0d09c8359445c624a84#rd
如有侵权请联系:admin#unsafe.sh