【汇编逆向系列】四、函数调用包含单个参数之Double类型-mmword,movsd,mulsd,addsd指令,总结汇编的数据类型

news2025/7/27 13:08:03

一、汇编代码

上一节开始,讲到了很多debug编译独有的汇编方式,为了更好的区分release的编译器优化和debug的区别,从本章节开始将会提供debug和release的汇编用作对比

Debugb编译

single_double_param:
  00000000000000A0: F2 0F 11 44 24 08  movsd       mmword ptr [rsp+8],xmm0
  00000000000000A6: 57                 push        rdi
  00000000000000A7: 48 83 EC 10        sub         rsp,10h
  00000000000000AB: 48 8B FC           mov         rdi,rsp
  00000000000000AE: B9 04 00 00 00     mov         ecx,4
  00000000000000B3: B8 CC CC CC CC     mov         eax,0CCCCCCCCh
  00000000000000B8: F3 AB              rep stos    dword ptr [rdi]
  00000000000000BA: F2 0F 10 44 24 20  movsd       xmm0,mmword ptr [rsp+20h]
  00000000000000C0: F2 0F 59 05 00 00  mulsd       xmm0,mmword ptr [__real@4004000000000000]
                    00 00
  00000000000000C8: F2 0F 58 05 00 00  addsd       xmm0,mmword ptr [__real@3ff4000000000000]
                    00 00
  00000000000000D0: 48 83 C4 10        add         rsp,10h
  00000000000000D4: 5F                 pop         rdi
  00000000000000D5: C3                 ret

Release编译

single_double_param:
  0000000000000000: F2 0F 59 05 00 00  mulsd       xmm0,mmword ptr [__real@4004000000000000]
                    00 00
  0000000000000008: F2 0F 58 05 00 00  addsd       xmm0,mmword ptr [__real@3ff4000000000000]
                    00 00
  0000000000000010: C3                 ret

二、汇编分析

1. 栈区空间

和浮点类型类似的同样需要申请16个字节的安全空间,使用的方法也是一样的,同时在release编译中也优化掉了这一部分。详细介绍请看上一章节

sub rsp, 10h                    ; 分配16字节栈空间
mov rdi, rsp                    ; rdi指向栈顶
mov ecx, 4                      ; 循环4次
mov eax, 0CCCCCCCCh             ; 初始化值0xCC(调试模式填充)
rep stos dword ptr [rdi]        ; 用0xCC填充栈空间(调试用)

2. Double类型在内存空间的表示

在计算机编程中,double类型(双精度浮点数)的内存空间占用和结构遵循IEEE 754标准,无论系统架构(32位或64位)或编译器类型,double类型始终占用 ​​8字节(64位)内存空间​​,这是IEEE 754标准对双精度浮点数的统一规定,与单精度浮点数(float,4字节)和长双精度(long double,通常16字节)形成对比。

double类型的64位内存空间划分为三个部分:

a.符号位(Sign)​​:1位

0表示正数,1表示负数

b. 指数位(Exponent)​​:11位

采用偏移表示法(偏移量1023),实际指数范围为 ​​-1022 到 1023​​,支持表示极大或极小的数值(如±10⁻³⁰⁸ 到 ±10³⁰⁸)

c. 尾数位(Mantissa)​​:52位

存储小数部分,隐含整数位1(规格化数),实际精度为 ​​53位二进制有效数字​​,等效约 ​​15–17位十进制有效数字

这部分的计算方式完全和float类型一致,只是不同类型的位数不同

3. mmword

MMWORD 是 ​​x86/x64 汇编语言​​中的一种数据类型标识符,主要用于处理 ​​64 位多媒体操作数​​,尤其在 MMX(MultiMedia eXtensions)和 SSE(Streaming SIMD Extensions)指令集中。以下是其核心要点:

a. 数据类型标识

  • MMWORD 在汇编中表示一个 ​​64 位(8 字节)的多媒体数据单元​​,与 __m64(C/C++ 中的 MMX 数据类型)等价
  • 用于明确操作数的位宽和语义,避免与普通整型混淆(如 QWORD 虽同为 64 位,但表示无符号整数)

b. 指令操作对象

常见于 MMX/SSE 指令的操作数中,例如:

movq mm0, mmword ptr [ebx]   ; 将内存中 64 位数据加载到 MMX 寄存器 mm0

mmword ptr 修饰内存地址,指明操作数大小为 64 位

拓展:

windows x64汇编中常见的数据单位总结

一、 基础存储单位

单位​位宽​​字节数​​定义​典型应用​
​bit1位1/8字节最小二进制单元(0或1)布尔运算、硬件标志位
Byte6位1字节由8个bit组成,存储基本单元字符编码(ASCII)、内存寻址最小单位
Word​16位2字节早期CPU一次处理的数据长度16位系统整数运算(如8086)
​DWord​32位4字节双字(Double Word),由2个Word组成32位系统整数/指针操作
QWord​64位8字节四字(Quad Word),由4个Word或2个DWord组成64位系统长整型、双精度浮点数

💡 ​​关键说明​​:

  • ​Word长度可变性​​:在32位系统中,Word可能被定义为32位(如x86架构)
  • ​字节固定性​​:1 Byte恒等于8 bit,不受架构影响

二、 多媒体拓展单位(SIMD指令集专用)

单位​位宽​字节数​​对应指令集​​典型应用​
MMWord​64位8字节MMX早期图像/音频处理(如像素块操作)
XMMWord​128位16字节SSE/AVX向量化浮点运算(如4×32位浮点并行)

🔬 ​​技术演进​​:

  • ​MMWord​​:复用FPU寄存器,操作64位整数
  • ​XMMWord​​:SSE引入独立128位寄存器,支持浮点与整型并行计算

4. 逻辑运算指令

该示例中用到了movsd,mulsd,addsd三种64位的浮点数运算

​指令​​操作数格式​​功能​详细介绍适用场景​
MOVSDxmm_dest, src复制浮点数将 ​​64 位双精度浮点数​​ 从源操作数(内存或 XMM 寄存器)复制到目标操作数(XMM 寄存器)加载/存储浮点数据
MULSDxmm_dest, src浮点数乘法将目标 XMM 寄存器中的双精度浮点数 ​​乘以​​ 源操作数(内存或 XMM 寄存器),结果存回目标寄存器标量乘法运算
ADDSDxmm_dest, src浮点数加法将目标 XMM 寄存器中的双精度浮点数 ​​加上​​ 源操作数(内存或 XMM 寄存器),结果存回目标寄存器标量加法运算

三、 汇编转化

movsd mmword ptr [rsp+8], xmm0  ; 将浮点参数保存到栈[rsp+8]
push rdi                        ; 保存rdi寄存器(被调用者保存)
sub rsp, 10h                    ; 分配16字节栈空间
mov rdi, rsp                    ; rdi指向栈顶
mov ecx, 4                      ; 循环4次
mov eax, 0CCCCCCCCh             ; 初始化值0xCC(调试模式填充)
rep stos dword ptr [rdi]        ; 用0xCC填充栈空间(调试用)
movsd xmm0, mmword ptr [rsp+20h]  ; 从栈[rsp+0x20]加载参数到xmm0
mulsd xmm0, mmword ptr [__real@4004000000000000]  ; 乘以常量2.5(0x400400...)
addsd xmm0, mmword ptr [__real@3ff4000000000000]  ; 加上常量1.25(0x3ff400...)

转化成C语言

double single_double_param(double param) {
    // 调试模式下的栈初始化(对应 rep stos 指令),release则会优化掉这部分
    volatile char debug_fill[16]; // 0xCC填充的栈空间

    // 核心计算逻辑(对应 mulsd/addsd)
    return param * 2.5 + 1.25;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2406111.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【AI学习】wirelessGPT多任务无线基础模型摘要

收看了关于WirelessGPT多任务无线基础模型的演讲视频,边做一个记录。 应该说,在无线通信大模型的探索方面,有一个非常有益的尝试。 在沈学明院士带领下开展 https://www.chaspark.com/#/live/1125484184592834560

docker 部署redis集群 配置

docker的网络模式 网桥模式每次重启容器都有可能导致容器ip地址变化,需要固定ip的自己自定义网络,这里介绍的是默认网络模式 docker创建容器 docker run --name redis6379 -p 6379:6379 -p 16379:16379 -v /etc/redis/redis6379:/etc/redis -d --r…

Ansys Maxwell:线圈和磁体的静磁 3D 分析

本博客展示了如何在 Ansys Maxwell 中执行静磁 3D 分析,以计算载流线圈和永磁体之间相互作用产生的扭矩。在这个例子中,线圈中的电流产生一个沿 Y 轴指向的磁场,而永磁体沿 X 轴被磁化。这种配置导致围绕 Z 轴的扭矩。分步工作流程包括构建几…

【计算机网络】SDN

SDN这种新型网络体系结构的核心思想:把网络的控制层面与数据层面分离,而让控制层面利用软件来控制数据层面中的许多设备。 OpenFlow协议可以被看成是SDN体系结构中控制层面与数据层面之间的通信接口。 在SDN中取代传统路由器中转发表的是“流表”&…

成工fpga(知识星球号)——精品来袭

(如需要相关的工程文件请关注知识星球:成工fpga,https://t.zsxq.com/DMeqH,关注即送200GB学习资料,链接已置顶!) 《孩子都能学会的FPGA》系列是成工完成的第一个系列,也有一年多的时…

spring中的@KafkaListener 注解详解

KafkaListener 是 Spring Kafka 提供的一个核心注解,用于标记一个方法作为 Kafka 消息的消费者。下面是对该注解的详细解析: 基本用法 KafkaListener(topics "myTopic", groupId "myGroup") public void listen(String message)…

NoSQL——Redis配置与优化

目录 关系型&非关系型数据库 一、核心原理对比‌ ‌二、核心特性对比‌ ‌三、关键区别剖析‌ ‌四、典型产品示例‌ ‌总结‌ Redis Redis核心原理 核心特性 技术意义 配置文件解析 1. 基础配置 2. 持久化配置 3. 内存管理 4. 高可用配置 5. 性能调优 6.…

CKA考试知识点分享(2)---ingress

CKA 版本:1.32 第二题是涉及ingress相关。本文不是题目,只是为了学习相关知识点做的实验。 1. 环境准备 需要准备一套K8S集群。 1.1 安装ingress-nginx 下载deploy文件: wget -O controller-v1.12.2.yaml https://raw.githubusercontent…

动态生成element-plus的scss变量;SCSS中实现动态颜色变体生成

文章目录 一、动态css变量1.生成内容2.动态生成css变量2.1新增_color-utils.scss(不推荐)2.2新增_color-utils.scss(推荐)2.3theme.scss引入使用 一、动态css变量 1.生成内容 在我们修改element-plus主题色时候,会自…

Linux 内核内存管理子系统全面解析与体系构建

一、前言: 为什么内存管理是核心知识 内存管理是 Linux 内核最核心也最复杂的子系统之一,其作用包括: 为软件提供独立的虚拟内存空间,实现安全隔离分配/回收物理内存资源,维持系统稳定支持不同类型的内存分配器,最优…

Tableau for mac 驱动

Tableau 驱动程序安装指南 对于希望在 Mac OS 上使用 Tableau 进行数据分析的用户来说,确保正确安装相应的驱动程序至关重要。Tableau 支持多种数据库连接方式,并提供官方文档指导如何设置这些连接。 安装适用于 Mac 的 JDBC 或 ODBC 驱动程序 为了使…

fast-reid部署

配置设置: 官方库链接: https://github.com/JDAI-CV/fast-reid# git clone https://github.com/JDAI-CV/fast-reid.git 安装依赖: pip install -r docs/requirements.txt 编译:切换到fastreid/evaluation/rank_cylib目录下&a…

大陆4D毫米波雷达ARS548调试

本文介绍了大陆ARS548毫米波雷达的调试与测试流程,主要包括以下内容: 设备参数:最大检测距离301m(可调93-1514m),支持gPTP时间同步。 接线调试: Windows需使用USB-RJ45转换器 Linux可直接连接网…

大语言模型解析

1. Input Embedding embedding:将自然语言翻译成index 每个index对应一个embedding,embedding需要训练,embedding是一个数组

Java在word中指定位置插入图片。

Java使用(Poi-tl) 在word(docx)中指定位置插入图片 Poi-tl 简介Maven 依赖配置Poi-tl 实现原理与步骤1. 模板标签规范2.完整实现代码3.效果展示 Poi-tl 简介 Poi-tl 是基于 Apache POI 的 Java 开源文档处理库,专注于…

可视化图解算法48:有效括号序列

牛客网 面试笔试 TOP101 | LeetCode 20. 有效的括号 1. 题目 描述 给出一个仅包含字符(,),{,},[和],的字符串,判断给出的字符串是否是合法的括号序列 括号必须以正确的顺序关闭,"()"和"()[]{}"都是合法的括号序列&…

Continue 开源 AI 编程助手框架深度分析

Continue 开源 AI 编程助手框架深度分析 一、项目简介 Continue 是一个模块化、可配置、跨平台的开源 AI 编程助手框架,目标是让开发者能在本地或云端环境中,快速集成和使用自定义的 LLM 编程辅助工具。它通过支持 VS Code 与 JetBrains 等主流 IDE 插件…

MySQL技术内幕1:内容介绍+MySQL编译使用介绍

文章目录 1.整体内容介绍2.下载编译流程2.1 安装编译工具和依赖库2.2 下载编译 3.配置MySQL3.1 数据库初始化3.2 编辑配置文件3.3 启动停止MySQL3.4 登录并修改密码 1.整体内容介绍 MySQL技术系列文章将从MySQL下载编译,使用到MySQL各组件使用原理源码分析&#xf…

网络安全问题及对策研究

摘 要 网络安全问题一直是近年来社会乃至全世界十分关注的重要性问题,网络关乎着我们的生活,政治,经济等多个方面,致力解决网络安全问题以及给出行之有效的安全策略是网络安全领域的一大目标。 本论文简述了课题的开发背景&…

【计算机网络】NAT、代理服务器、内网穿透、内网打洞、局域网中交换机

🔥个人主页🔥:孤寂大仙V 🌈收录专栏🌈:计算机网络 🌹往期回顾🌹:【计算机网络】数据链路层——ARP协议 🔖流水不争,争的是滔滔不息 一、网络地址转…