PHP反序列化漏洞的另类利用:从0CTF真题看where重复触发替换的妙用

news2026/3/13 18:42:16
PHP反序列化漏洞的另类利用从0CTF真题看where重复触发替换的妙用最近在复盘一些经典的CTF题目时我又重新审视了那道来自0CTF 2016的“piapiapia”。这道题之所以让人印象深刻不仅仅是因为它巧妙地结合了序列化与反序列化更在于它揭示了一种在代码审计中极易被忽略的“字符替换偏移”攻击手法。很多安全研究员在初次接触时可能会直奔主题去寻找反序列化POP链的构造但“piapiapia”却另辟蹊径它利用了一个看似无害的过滤函数通过精密的字符计算实现了对序列化字符串结构的精准“外科手术式”覆盖。这种思路跳出了常规的漏洞利用框架更像是一种对程序逻辑和数据处理流程的深度理解与博弈。今天我们就来深入拆解这种“where重复触发替换”的妙用看看如何将防御机制转化为攻击跳板。1. 场景还原从登录界面到源码泄露拿到一个Web题目第一步永远是信息收集。题目呈现一个标准的登录界面尝试基础的SQL注入无果后目录扫描成了突破口。使用dirsearch这类工具时在实战或某些在线靶场如BUUCTF中需要注意请求频率过快可能导致429状态码适当调整延迟参数-x是必要的。扫描结果通常会给出惊喜比如一个www.zip源码压缩包。解压后我们得到了一套完整的PHP应用源码通常包括index.php: 首页/登录页register.php: 用户注册update.php: 信息更新profile.php: 信息展示class.php: 核心类定义config.php: 配置文件通常藏有flag提示config.php中直接包含flag的设定在CTF中很常见这明确了我们的终极目标——读取这个文件的内容。审计流程通常从用户交互的功能点开始。注册一个账户登录后进入信息更新页面update.php这里收集用户的手机、邮箱、昵称和头像。提交后信息会在profile.php页面展示。功能链路清晰漏洞就隐藏在这看似平常的数据流处理中。2. 核心逻辑审计序列化与过滤的致命交汇漏洞的根源往往存在于数据的“输入-处理-存储-输出”链条中。我们重点分析update.php和class.php。在update.php中用户提交的数据经过一系列正则校验手机号必须为11位数字。邮箱符合简化格式校验。昵称只能包含字母、数字、下划线且长度不超过10。头像文件大小限制在5字节到1MB之间。校验通过后数据被组装成一个数组$profile然后调用$user-update_profile($username, serialize($profile))。这里用户控制的$profile数组被序列化成字符串并传入update_profile方法。update_profile方法位于class.php或其继承的类中是关键所在。它通常包含两个操作过滤Filter: 对传入的用户名和序列化后的字符串进行过滤。更新数据库Update: 将过滤后的值更新到数据库中。我们来看一个典型的、存在问题的filter函数实现public function filter($string) { $escape array(\, \\\\); $escape / . implode(|, $escape) . /; $string preg_replace($escape, _, $string); $safe array(select, insert, update, delete, where); $safe / . implode(|, $safe) . /i; return preg_replace($safe, hacker, $string); }这个函数做了两件事将单引号和反斜杠替换为下划线防SQL注入。将一些SQL关键字select,insert,update,delete,where不区分大小写地替换为字符串hacker。而update函数则是简单地拼接SQL语句并执行。在profile.php中流程反向进行从数据库取出序列化字符串直接进行unserialize()操作然后将数组中的photo字段值作为文件路径用file_get_contents读取并base64编码输出。至此攻击面变得清晰我们能否构造一个特殊的序列化字符串经过filter函数“处理”后在反序列化时改变其结构使得photo字段指向config.php3. 漏洞原理字符替换引发的“溢出”常规的反序列化漏洞利用侧重于寻找类中的魔术方法如__wakeup,__destruct并构造POP链。但本题的类非常简单没有这些魔术方法。我们需要换一种思路利用序列化字符串本身的格式特性。一个序列化数组的格式是严格定义的例如a:4:{i:0;s:3:123;i:1;s:3:abc;i:2;s:4:4567;i:3;s:4:defg;}其中s:4:defg表示一个长度为4的字符串defg。反序列化器会严格按照这个格式和指定的长度来解析数据。如果我们能篡改序列化字符串中表示长度的数字或者让解析器错误地识别字段边界就能实现越权读取。本题的突破点在于filter函数中的preg_replace。preg_replace在进行字符串替换时如果匹配到的子串长度与被替换成的字符串长度不同就会导致整个字符串的长度发生变化。例如将where5个字符替换为hacker6个字符字符串总长度增加1。假设我们构造的昵称nickname在序列化后是s:10:xxxxxxxxxx。如果xxxxxxxxxx内部包含一个where经过filter后变成hacker那么实际存储的字符串变成了s:10:xxxhackerxxx假设替换发生在中间。但注意序列化字符串中记录的长度s:10并没有改变当profile.php从数据库取出这个字符串进行反序列化时解析器仍然认为nickname字段是一个长度为10的字符串。它会从s:10:后面的双引号开始读取10个字符作为值。如果因为替换导致有效内容变长那么多出来的字符以及其后的字符就会被“挤”到下一个字段的解析空间中从而可能破坏整个序列化结构实现字段值的覆盖。这就是“字符替换偏移”攻击的核心通过精心控制输入使过滤操作引入确定的长度变化从而精准地偏移后续数据的解析起点达到篡改反序列化对象结构的目的。4. 利用链构造精确计算与“where”的狂欢理论有了如何实践目标是让photo字段的值在反序列化后变成config.php。原始序列化字符串结构大致如下a:4:{s:5:phone;s:11:13800138000;s:5:email;s:15:testexample.com;s:8:nickname;s:10:your_nick;s:5:photo;s:22:upload/md5_filename.jpg;}我们需要在nickname字段的值部分做文章使其经过filter替换后尾部溢出的字符恰好能闭合当前对象并重新定义photo字段。由于nickname有长度限制strlen($_POST[nickname]) 10直接传入很长的恶意字符串是不行的。但这里存在一个常见绕过strlen()对数组返回的是元素个数而非字符串长度。如果以数组形式提交nickname例如nickname[]payloadstrlen()检查会失效。序列化一个数组和序列化一个字符串格式不同这需要我们调整payload结构。更关键的是长度计算。我们需要让nickname字段原始序列化后的值部分即双引号内的内容在经过filter把其中所有where替换为hacker后整体长度增加的量刚好等于我们想要“注入”的恶意payload的长度。设N 我们需要注入的payload长度例如闭合结构并定义新photo的字符串长度。R 每出现一次where被替换为hacker所增加的长度6 - 5 1。那么我们需要在nickname的值中重复写入where的次数X ≈ N / R。例如我们的恶意payload可能是;}s:5:photo;s:10:config.php;}计算这个字符串的长度注意引号和分号都是字符 1; 1} 1s:5:photo; 12s:10:config.php; 17} 1 总长度 11112171 33。注意由于我们将nickname作为数组提交序列化格式不同可能需要在payload前额外添加一个}来闭合外层的数组结构因此实际payload可能为}s:5:photo;s:10:config.php;}长度需要重新计算。假设最终计算出的所需增长长度为34。那么我们需要在nickname数组的某个元素值中填入34个where因为每替换一个增加1个字符长度紧接着就是我们的payload。像这样wherewherewherewhere...34个where;}s:5:photo;s:10:config.php;}当这个字符串被序列化作为数组的一个元素值并经过filter时34个where被替换为34个hacker导致该部分字符串总长度增加34。反序列化器在解析时仍按照原来的较短的长度去读取nickname的值结果就把后面多出来的34个字符即我们的payload当作后续的序列化数据解析了从而成功将photo字段覆盖为config.php。5. 实战演练与脚本化理解了原理手动构造和测试依然繁琐尤其是需要精确计算偏移量时。编写一个简单的Python或PHP脚本来自动化这个过程会高效很多。脚本的核心任务是生成包含精确数量where和恶意payload的原始字符串。模拟filter函数的替换逻辑计算替换后的字符串。生成最终用于提交的HTTP请求数据包。下面是一个概念性的Python脚本示例用于辅助计算和生成攻击载荷#!/usr/bin/env python3 import re def simulate_filter(input_str): 模拟PHP中filter函数的替换逻辑 # 替换单引号和反斜杠本例中可能不影响长度计算但需知晓 # 重点替换SQL关键字 safe_keywords [select, insert, update, delete, where] pattern re.compile(|.join(safe_keywords), re.IGNORECASE) # 注意preg_replace会替换所有非重叠匹配 # 我们模拟将匹配到的词替换为hacker result pattern.sub(hacker, input_str) return result def calculate_required_where_count(payload_len): 计算需要多少个where来产生足够的长度增长 # 每个where(5) - hacker(6)增长1 growth_per_where len(hacker) - len(where) # 需要的增长量应至少等于payload_len # 因为payload是紧跟在where串后面的增长量就是where串整体增长的长度 required_count payload_len // growth_per_where # 确保增长量大于等于payload长度 if (required_count * growth_per_where) payload_len: required_count 1 return required_count # 假设我们最终的恶意payload考虑数组序列化格式后的 # 实际构造时需要根据目标源码的序列化格式微调 malicious_payload ;}s:5:photo;s:10:config.php;} payload_length len(malicious_payload) print(f恶意payload长度: {payload_length}) where_count calculate_required_where_count(payload_length) print(f需要连续写入 where 的次数: {where_count}) # 构造原始字符串 original_value where * where_count malicious_payload print(f\n原始字符串 (替换前):) print(original_value) print(f原始长度: {len(original_value)}) # 模拟过滤后 filtered_value simulate_filter(original_value) print(f\n过滤后字符串:) print(filtered_value) print(f过滤后长度: {len(filtered_value)}) length_increase len(filtered_value) - len(original_value) print(f\n长度增加量: {length_increase}) print(f预期payload起始偏移: {len(where * where_count) length_increase}) # 提示在实际攻击中需要将original_value作为nickname[]数组参数提交在实际操作中我们通过Burp Suite拦截注册或更新信息的请求将nickname参数修改为数组形式nickname[]...并将上述计算出的original_value作为其值。提交后访问profile.php查看页面中头像图片对应的base64数据解码即可得到config.php的内容从而获得flag。6. 防御思考与进阶利用这种漏洞的根源在于对序列化数据进行了不安全的“净化”处理。序列化字符串是一个结构化的数据格式任何在序列化之后、反序列化之前对其内容进行的修改尤其是可能改变长度的替换操作都可能破坏其结构引发不可预料的后果。有效的防御措施包括在序列化前过滤而非序列化后对用户输入的每个字段值进行严格的校验和过滤然后再组装成数组进行序列化。确保进入序列化流程的数据已经是“干净”的。使用安全的序列化格式考虑使用json_encode/json_decode代替serialize/unserialize。JSON格式同样可读且没有PHP序列化格式的复杂特性受这类替换操作影响的风险较低。签名或加密序列化数据对序列化后的字符串进行HMAC签名或加密。在反序列化前验证签名或解密。任何对序列化字符串的篡改都会导致验证失败。避免将用户可控数据直接反序列化如果可能使用数据库字段单独存储各个用户属性而不是存储整个序列化字符串。对“替换”操作保持警惕在安全过滤函数中如果必须进行字符串替换尽量确保替换前后字符串长度一致或者充分评估长度变化对后续处理逻辑尤其是格式解析逻辑的影响。进阶利用思路“where重复触发替换”只是这类漏洞的一个具体表现。其本质是“字符串操作导致的解析歧义”。在其他场景中也可能出现str_replace的多次替换如果替换是递归或多次进行的计算会变得更复杂。字符编码转换例如某些过滤或处理过程中发生的字符集转换可能使多字节字符长度发生变化。其他结构化数据的解析如XML、YAML、特定格式的日志文件等如果解析前进行了字符串替换也可能引发类似问题。审计时需要关注任何先序列化或格式化后处理再反序列化或解析的数据流。重点检查处理函数是否可能改变数据的长度或结构。7. 工具与资源延伸对于希望深入研究此类漏洞和CTF Web题目的朋友除了手动审计和编写PoC还可以利用一些优秀的工具和资源工具/资源名称类型主要用途/特点PHPGGC漏洞利用框架生成PHP反序列化漏洞的POP链利用载荷适用于存在魔术方法利用的场景。Burp Suite 插件渗透测试工具链Burp Suite用于拦截、重放、测试HTTP请求。搭配PHP Object Injection Check等插件辅助检测。dirsearch / gobuster目录扫描工具快速发现源码泄露、备份文件、隐藏目录等是Web渗透的信息收集第一步。SecLists字典集合包含大量的路径、文件名、参数名字典用于FUZZ和扫描。在线PHP代码执行环境测试平台在隔离环境里快速测试PHP代码片段、序列化/反序列化结果验证思路。理解漏洞原理始终是关键。工具能提高效率但无法替代对代码逻辑的深入分析。像“piapiapia”这道题考验的正是审计者能否跳出常规思维发现数据在流动过程中那些微妙的、会产生累积效应的变化点。这种利用过滤函数自身特性来“锻造”攻击载荷的手法充满了技巧性和艺术性也再次印证了安全领域那句老话有时最坚固的防线其弱点恰恰在于它自身。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2408488.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…