浮点数寄存器与指令

最新推荐文章于 2026-04-13 17:53:37 发布

原创最新推荐文章于 2026-04-13 17:53:37 发布 · 1w 阅读

12 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#汇编

汇编专栏收录该内容

6 篇文章

订阅专栏

本文介绍了AVX浮点体系结构中的16个YMM寄存器，用于存储浮点数据。讨论了浮点传送和转换操作，包括浮点数在内存和寄存器间的传递，以及不同精度之间的转换。还提到了运算操作，如标量AVX2浮点指令，以及位级操作和比较操作，其中比较操作的源操作数可能来自XMM寄存器或内存。

寄存器

AVX浮点体系结构允许数据存储在16个YMM寄存器中

255	127	0
%ymm0	%xmm0	1st FP arg.返回值
%ymm1	%xmm1	2nd FP参数
%ymm2	%xmm2	3rd FP参数
%ymm3	%xmm3	4th FP参数
%ymm4	%xmm4	5th FP参数
%ymm5	%xmm5	6th FP参数
%ymm6	%xmm6	7th FP参数
%ymm7	%xmm7	8th FP参数
%ymm8	%xmm8	调用者保存
%ymm9	%xmm9	调用者保存
%ymm10	%xmm10	调用者保存
%ymm11	%xmm11	调用者保存
%ymm12	%xmm12	调用者保存
%ymm13	%xmm13	调用者保存
%ymm14	%xmm14	调用者保存
%ymm15	%xmm15	调用者保存

媒体寄存器。这些寄存器用于存放浮点数据。每个YMM寄存器保存32个字节。低16字节可以作为XMM寄存器来访问

浮点传送和转换操作

指令	源	目的	描述
vmovss	M32	X	传送单精度数
vmovss	X	M32	传送单精度数
vmovsd	M64	X	传送双精度数
vmovsd	X	M64	传送双精度数
vmovaps	X	X	传送对齐的封装好的单精度数
vmovapd	X	X	传送对齐的封装好的双精度数

浮点传送指令。这些操作在内存和寄存器之间以及一对寄存器之间传送值(X:XMM寄存器(例如%xmm3)；M32:32位内存范围;M64:64位内存范围)

指令	源	目的	描述
vcvttss2si	X/M32	R32	用截断的方法把单精度数转换成整数
vcvttsd2si	X/M64	R32	用截断的方法把双精度数转换成整数
vcvttss2siq	X/M32	R64	用截断的方法把单精度数转换成四字整数
vcvttsd2siq	X/M64	R64	用截断的方法把双精度数转换成四字整数

双操作数浮点转换指令。这些操作将浮点数转换成整数(X:XMM寄存器(例如%xmm3)； R32:32位通用寄存器(例如%eax)；R64:64位通用寄存器(例如%rax)；M32:32位内存范围；M64:64位内存范围)

指令	源1	源2	目的	描述
vcvtsi2ss	M32/R32	X	X	把整数转换成单精度数
vcvtsi2sd	M32/R32	X	X	把整数转换成双精度数
vcvtsi2ssq	M64/R64	X	X	把四字整数转换成单精度数
vcvtsi2sdq	M64/R64	X	X	把四字整数转换成双精度数

三操作数浮点转换指令。这些操作将第一个源的数据类型转换成目的数据类型。第二个源值对结果的低位字节没有影响(X:XMM寄存器(例如%xmm3)；M32:32位内存范围；M64:64位内存范围)

gcc实现单精度与双精度的转换需要单独说明(就不具体解释了)

Conversion from single to double precision
vunpcklps %xmm0, %xmm0, %xmm0   Replicate first vector element
vcvtps2pd %xmm0, %xmm0          Convert two vector elements to double

Conversion from double to single precision
vmovddup %xmm0, %xmm0            Replicate first vector element
vcvtpd2psx %xmm0, %xmm0          Convert two vector elements to single

运算操作

标量avx2浮点指令。每条指令有一个(S1)或两个(S1,S2)源操作数，和一个目的操作数。第一个源操作数S1可以是一个XMM寄存器或一个内存位置。第二个源操作数和目的操作数都必须是XMM寄存器。每个操作都有一条针对单精度的指令和一条针对双精度的指令。结果存放在目的寄存器中。

单精度	双精度	效果	描述
vaddss	vaddsd	D<—S2+S1	浮点数加
vsubss	vsubsd	D<—S2-S1	浮点数减
vmulss	vmulsd	D<—S2xS1	浮点数乘
vdivss	vdivsd	D<—S2/S1	浮点数除
vmaxss	vmaxsd	D<—max(S2,S1)	浮点数最大值
vminss	vminsd	D<—min(S2,S1)	浮点数最小值
sqrtss	sqrtsd	D<— $\sqrt{2}$	浮点数平方根