一,表示形式
从表面上看,浮点数也是一串0和1构成的位序列。IEEE标准从逻辑上用三元组{S,E,M}表示一个数N,如下图所示:
N的实际值n由下列式子表示:
其中:
★ n,s,e,m分别为N,S,E,M对应的实际数值,而N,S,E,M仅仅是一串二进制位。
★ S(sign)表示N的符号位。对应值s满足:n>0时,s=0; n<0时,s=1。
★ E(exponent)表示N的指数位,位于S和M之间的若干位。对应值e值也可正可负。
★ M(mantissa)表示N的尾数位,恰好,它位于N末尾。M也叫有效数字位(sinificand)、系数位(coefficient), 甚至被称作“小数”。
二,浮点数格式
IEEE标准754规定了三种浮点数格式:单精度、双精度、扩展精度。前两者正好对应C语言里头的float、double或者FORTRAN里头的real、double精度类型。限于篇幅,本文仅介绍单精度、双精度浮点格式。
★ 单精度:N共32位,其中S占1位,E占8位,M占23位。
★ 双精度:N共64位,其中S占1位,E占11位,M占52位。