您的位置 首页 系统

ARMCC和GCC编译ARM代码的软浮点和硬浮点问题

本文介绍了ARM代码编译时的软浮点(soft-float)和硬浮点(hard-float)的编译以及链接实现时的不同。从VFP浮点单元的引入到软浮点(soft-float)…

本文介绍了ARM代码编译时的软浮点(soft-float)和硬浮点(hard-float)的编译以及链接完成时的不同。从VFP浮点单元的引进到软浮点(soft-float)和硬浮点(hard-float)的概念,然后是在GCC和ARMCC RVCT东西链下的详细编译参数。

VFP (vector floating-point)

从ARMv5开端,就有可选的Vector Floating Point (VFP)模块,当然最新的如Cortex-A8,Cortex-A9和Cortex-A5能够装备成不带VFP的形式供芯片厂商挑选。VFP经过若干年的开展,有VFPv2 (一些ARM9/ARM11)、VFPv3-D16(只运用16个浮点寄存器,默以为32个)和VFPv3+NEON (如大多数的Cortex-A8芯片)。关于包括NEON的ARM芯片,NEON一般和VFP共用寄存器。

硬浮点Hard-float

编译器将代码直接编译成发射给硬件浮点协处理器(浮点运算单元FPU)去履行。FPU一般有一套额定的寄存器来完结浮点参数传递和运算。运用实践的硬件浮点运算单元FPU当然会带来功能的提高。由于往往一个浮点的函数调用需求几个或许几十个时钟周期。

软浮点 Soft-float

编译器把浮点运算转化成浮点运算的函数调用和库函数调用,没有FPU的指令调用,也没有浮点寄存器的参数传递。浮点参数的传递也是经过ARM寄存器或许仓库完结。现在的Linux体系默许编译挑选运用hard-float,即便体系没有任何浮点处理器单元,这就会发生不合法指令和反常。因而一般的体系镜像都选用软浮点以兼容没有VFP的处理器。

armel和armhf ABI
在armel中,关于浮点数核算的约好有三种。以gcc为例,对应的-mfloat-abi参数值有三个:soft,softfp,hard。soft是指一切浮点运算悉数在软件层完成,功率当然不高,会存在不必要的浮点到整数、整数到浮点的转化,只适合于前期没有浮点核算单元的ARM处理器;softfp是现在armel的默许设置,它将浮点核算交给FPU处理,但函数参数的传递运用通用的整型寄存器而不是FPU寄存器;hard则运用FPU浮点寄存器将函数参数传递给FPU处理。需求留意的是,在兼容性上,soft与后两者是兼容的,但softfp和hard两种形式不兼容。默许情况下,armel运用softfp,因而将hard形式的armel独自作为一个abi,称之为armhf。而运用hard形式,在每次浮点相关函数调用时,平均能节约20个CPU周期。对ARM这样每个周期都很重要的体系结构来说,这样的提高无疑是巨大的。在彻底不改动源码和装备的情况下,在一些运用程序上,运用armhf能得到20%——25%的功能提高。对一些严峻依赖于浮点运算的程序,更是能够到达300%的功能提高。

Soft-float和hard-float的编译选项

在CodeSourcery gcc的编译参数上,运用-mfloat-abi=name来指定浮点运算处理方式。-mfpu=name来指定浮点协处理的类型。可选类型如fpa,fpe2,fpe3,maverick,vfp,vfpv3,vfpv3-fp16,vfpv3-d16,vfpv3-d16-fp16,vfpv3xd,vfpv3xd-fp16,neon,neon-fp16,vfpv4,vfpv4-d16,fpv4-sp-d16,neon-vfpv4等。运用-mfloat-abi=hard (等价于-mhard-float)-mfpu=vfp来挑选编译成硬浮点。运用-mfloat-abi=softfp就能兼容带VFP的硬件以及soft-float的软件完成,运行时的连接器ld.so会在履行浮点运算时关于运算单元的挑选,是直接的硬件调用仍是库函数调用,是履行/lib仍是/lib/vfp下的libm。-mfloat-abi=soft (等价于-msoft-float)直接调用软浮点完成库。

在ARM RVCT东西链下,界说fpu形式:

? –fpu softvfp
? –fpu softvfp+vfpv2
? –fpu softvfp+vfpv3
? –fpu softvfp+vfpv_fp16
? –fpu softvfp+vfpv_d16
? –fpu softvfp+vfpv_d16_fp16.

界说浮点运算类型

–fpmode ieee_full :一切单精度float和双精度double的精度都要和IEEE规范共同,详细的形式能够在运行时动态指定;

–fpmode ieee_fixed:舍入到最接近的完成的IEEE规范,不带不精确的反常;

–fpmode ieee_no_fenv:舍入到最接近的完成的IEEE规范,不带反常;

–fpmode std:非规范数flush到0、舍入到最接近的完成的IEEE规范,不带反常;

–fpmode fast:更活跃的优化,或许会有一点精度丢失。

一个浮点软链接完成的汇编比如

IMPORT __softfp_cos

BL __softfp_cos

ARMCC fplib浮点运算库

__aeabi_dadd 浮点double类型数据的加法,__aeabi_fdiv 单精度浮点除法。

附录:常见的芯片和VFP装备

Partial reference of SoC and supported ISAs

Manufacturerhttp://houh-1984.blog.163.com/

SoC

architecture

VFP

SIMD

Notes

Freescale

iMX5x

armv7

VFPv3

NEON

Cortex-A8;NEONonly reliable in Tape-Out 3 or above

Nvidia

Tegra2

armv7

VFPv3 D16

none

Marvell

Dove

armv7

VFPv3 D16

iwMMXt

Texas Instruments

OMAP3xxx

armv7

VFPv3

NEON

Cortex-A8

Texas Instruments

OMAP4xxx

armv7

VFPv3

NEON

Cortex-A9

Texas Instruments

OMAP5xxx

armv7

VFPv4

NEON

Cortex-A15(ARMv7-A) +Cortex-M4(ARMv7-ME)

Qualcomm

Snapdragon

armv7

VFPv3

NEON[1]

Qualcomm “Scorpion” core

Samsung

S5PC100

armv7

VFPv3

NEON

Cortex-A8

Allwinner

A1x

armv7

VFPv3

NEON

Cortex-A8

本文介绍了ARM代码编译时的软浮点(soft-float)和硬浮点(hard-float)的编译以及链接完成时的不同。从VFP浮点单元的引进到软浮点(soft-float)和硬浮点(hard-float)的概念,然后是在GCC和ARMCC RVCT东西链下的详细编译参数。

声明:本文内容来自网络转载或用户投稿,文章版权归原作者和原出处所有。文中观点,不代表本站立场。若有侵权请联系本站删除(kf@86ic.com)https://www.86ic.net/qianrushi/xitong/276078.html

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱: kf@86ic.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部