浮点数表示方法的分析研究 - 微控网

主题：浮点数表示方法的分析研究
暂无回复

1

复制本帖地址

debug

2006-07-18 14:08:50
阅读：15471次
回复
只看此人

楼主

门派

职务论坛版主
积分55
经验17687
文章198
注册2006-03-07

浮点数表示方法的分析研究

　摘要：在《计算机组成原理》课程的教学中，浮点数的表示与运算是一个重点，也是难点。本文对浮点数的一般表示及标准表示的方法、范围、存储格式等进行了比较深入地比较、分析和研究，力求给读者一个清晰的概述。
关键词：浮点数，表示方法，符号，尾数，阶码，范围
　《计算机组成原理》课程是计算机科学与技术专业的一门必修专业基础课，主要是讲述计算机系统几大硬件的组成结构和工作原理。在其核心部件——运算器(Arithmetician)的运算机制中，浮点数（Floating-point）的表示与运算方法是一个重点，也是难点，笔者在查阅了大量中外文文献的基础上，根据多年的教学实践经验，对浮点数的表示方法、规格化处理方法、表示范围进行了比较详细地分析研究，以方便学生的学习，共同行们参考。
1、浮点数的一般表示方法
　　在数学中，表示一个浮点数需要三要素：尾数（mantissa）、指数（exponent，又称阶码）和基数（base），都用其第一个字母来表示的话，那么任意一个浮点数N可以表示成下列形式：N=M×BE，例如N1=1.234×10-6， N2= -0.001011×2011等，同样的数字对于不同的基数是不相同的，移动小数点的位置，其指数相应地跟着变化。在计算机中，表示一个浮点数，同样需要以上三要素，只是阶码与尾数一同存储，基数常有2、8、16等数值，下面的讨论以2为基数进行。
　　将浮点数放在计算机中存储时，尾数M用定点（Fixed-point）小数的形式，阶码E用有符号整数形式，改变M中小数点的位置，同时需要修改E的值，可以给出有效数字（significant number）的位数，因此M和E决定了浮点数的精度（precision），E指明小数点在B进制数据中的位置，因而E和B决定了浮点数的表示范围（range），浮点数的符号（Sign）是单独考虑，设阶码有m+1位，尾数有n+1位，则一般浮点数的表示方法如图1所示，其中，下标s代表符号位，下标数字代表数字所处的位数，尾数的小数点默认最高数字位M1之前。图（b）是将尾数的符号位提在最前面，其它部分与图（a）一样，是目前常用的一种表示形式。

图1 浮点数的一般表示形式
　　在这种表示方法中，阶码的二进制编码（binary code）一般是原码（sign magnitude）、补码（twos complement）或移码（bias），尾数的编码一般是原码或补码。
2、浮点数的规格化处理
　　在浮点数系统中，小数点的浮动使数值的表示不能惟一，从而给数据处理带来困难，因此有必要使浮点数的表示与存储有一定的标准，考虑到阶码、尾数之间的关系，常将尾数的最高数字位是有效值的数值称为规格化（normalization），由于尾数可以是原码或补码，所以有两种规格化的形式，如表1所示。

表1 规格化数据的形式
尾数编码    尾数代码形式    说    明
正数    负数
原码    0.1×××    1.1×××    最高数治槐匦胛?
补码    0.1×××    1.0×××    符号位与最高数字位必须相反
对于二进制尾数，规格化限制了其范围是：1/2≤|M|＜1，通过左右移动小数点，增减阶码的值来进行规格化处理。
在浮点数中，零的表示比较特殊。一个是零浮点数，一般地，对于规格化的浮点数来说，无论阶码为任何值，尾数为零就认为该浮点数是零，但这实际上是由尾数的舍入而近似的值，要让总体浮点数趋近于零，其阶码必须是一个不超出表示范围的最大的负数才行。设阶码含符号为n位，则整数阶码所表示的范围是：至或至，即是或。
　　另一个问题产生于零的唯一表达问题，为了实现用指令测试零，约定在定点数和浮点数格式中零具有相同的表达式，将浮点数的阶码值进行余编码，就像BCD码中余3码加3一样，阶码被描述为E加上，这个就叫偏移（bias），由上面分析可知的取值有两种，浮点数的标准表示形式（IEEE754标准）所采用的是偏移值。

3 浮点数的表示范围
　　浮点数的表示有一定的范围，超出范围时会产生溢出（flow），一般称大于绝对值最大的数据为上溢（overflow），小于绝对值最小的数据为下溢（underflow）。浮点数表示范围一般分以下几种情况考虑，设浮点数的阶码和尾数均用补码表示（原码表示比较简单），阶码为m+1位（其中1位是符号），尾数为n+1（其中1位是符号），则浮点数的典型范围值如表2所示。

表2 浮点数的典型范围值
典型范围    浮点数代码    真值
数符(Ms)    阶码(E)    尾数(M)
最大正数
最小正数
规格化的最小正数
绝对值最大的负数
绝对值最小的负数
规格化的绝对值最小负数    0
0
0
1
1
1    011…11
100…00
100…00
011…11
100…00
100…00    11………11
00………01
10………00
00………00
11………11
01………11

　　4、标准表示法
　　为便于软件的移植，浮点数的表示格式应该有统一标准。1985年IEEE（Institute of Electrical and Electronics Engineers）提出了IEEE754标准。该标准规定基数为2，阶码E用移码表示，尾数M用原码表示，根据原码的规格化方法，最高数字位总是1，该标准将这个1缺省存储，使得尾数表示范围比实际存储的一位。实数的IEEE754标准的浮点数格式为：

具体有三种形式：
表3 IEEE754三种浮点数的格式参数
浮点数
类型    存储位数    偏移值( )
阶码E的取值范围    真值表达式
数符(s)    阶码(E)    尾数(M)    总位数    十六进制    十进制
短实数    1    8    23    32    7FH    127    1~254

长实数    1    11    52    64 3FFH 1023 1~2046

临时实数 1    15    64    80 3FFFH 16383 1~32766

对于阶码为0或为255（2047）的情况，IEEE有特殊的规定，由于篇幅有限，在此不讨论。
在浮点数总位数不变的情况下，其精度值与范围值是矛盾的，因此一般的机器都提供有单、双精度两种格式。表4中列出了IEEE754单精度浮点数的表示范围，对于双精度只需要修改一下偏移值和尾数位数即可。
表4 IEEE754单精度、双精度浮点数范围
典型范围    浮点数代码    真值
数符(Ms)    阶码(E)    尾数(M)
最大正数
最小正数
绝对值最大的负数
绝对值最小的负数    0
0
1
1    11111110
00000001
11111110
00000001    11………11
00………00
11………11
00………00

　　标准浮点数的存储格式与图1（b）相似，只是在尾数中隐含存储着一个1，因此在计算尾数的真值时比一般形式要多一个整数1。对于阶码E的存储形式因为是127的偏移，所以在计算其移码时与人们熟悉的128偏移不一样，正数的值比用128偏移求得的少1，负数的值多1，为避免计算错误，方便理解，常将E当成二进制真值进行存储。例如：将数值-0.5按IEEE754单精度格式存储，先将-0.5换成二进制并写成标准形式：-0.510=-0.12=-1.0×2-12，这里s=1，M为全0，E-127=-1，E=12610=011111102，则存储形式为：
1 01111110 000000000000000000000000=BE00000016
这里不同的下标代表不同的进制。
　　综上所述，笔者通过多年的教学实践，对学生特别容易迷惑的地方进行了分析研究，并给出了结论性的总结，弥补了大多数教课书中讲不明白的问题。

[ 此帖最后由DC在2012-11-8 0:47:16从电子通识转移过来 ]

微控网感谢您的参与

1