浮点数的秘密

母夜叉
• 阅读 384

1 前言

我们在学习 C 语言时,通常认为浮点数和小数是等价的,并没有严格区分它们的概念,这也并没有影响到我们的学习,原因就是浮点数和小数是绑定在一起的,只有小数才使用浮点格式来存储。

其实,整数和小数可以都使用定点格式来存储,也可以都使用浮点格式来存储,但实际情况却是,C 语言使用定点格式存储整数,使用浮点格式存储小数,这是在 “数值范围” 和 “数值精度” 两项重要指标之间追求平衡的结果。

2 什么是浮点数?

浮点型简单讲就是实数的意思。浮点数在计算机中用以近似表示任意某个实数。具体的说,这个实数由一个整数或定点数(即尾数)乘以某个基数(计算机中通常是 2)的整数次幂得到,这种表示方法类似于基数为 10 的科学记数法。

3 浮点数在内存中的存储

首先明确一点,无论是整型、浮点型还是字符等等数据类型在计算机底层都是以二进制的方式存储的。

浮点数在内存中的存储和整数不同,因为整数都可以转换为一一对应的二进制数据。而浮点数的存储是由符号位 (sign) + 指数位 (exponent) + 小数位 (fraction) 组成。

浮点数的秘密

int 和 float 同样占据四个字节的内存,但是 float 所能表示的最大值比 int 大得多,其根本原因是浮点数在内存中是以指数的方式存储

浮点数转换到内存中存储的步骤分为如下三步:

  • 将浮点数转换成二进制
  • 用科学计数法表示二进制浮点数
  • 计算指数偏移后的值

对于第3点:计算指数时需要加上偏移量(后面有介绍为什么使用偏移量),而偏移量的值与浮点数的类型有关( float 偏移量值为 127 ,double 偏移量值为 1023)。比方对于指数 6,float 与 double 类型偏移后的值分别为:

  • float : 127 + 6 = 133
  • double:1023 + 6 = 1029

4 实例

浮点数19.625用float是如何存储的:

  • 将浮点数转换成二进制:10011.101(将 19.625 整数部分采用除 2 取余,小数部分采用乘 2 取整法);
  • 用科学计数法表示二进制浮点数:1.0011101*2^4
  • 计算指数偏移后的值:127 + 4 = 131  (10000011);
  • 拼接综上所述,float 类型的 19.625 在内存中的值为:0 - 10000011 - 001 1101 0000 0000 0000 0000。

5 float与double范围和精度

范围

floatdouble的范围是由指数的位数来决定的。(因为表示的时候都是1.x * 2^Y的形式,所以忽略了1.x的效果,直接取指数表示浮点数的范围)

  • float:

1bit(符号位) 8bits(指数位) 23bits(尾数位)

  • double:

1bit(符号位) 11bits(指数位) 52bits(尾数位)

于是,float的指数范围为-127~+128,而double的指数范围为-1023~+1024,并且指数位是按补码的形式来划分的。

其中负指数决定了浮点数所能表达的绝对值最小的非零数;而正指数决定了浮点数所能表达的绝对值最大的数,也即决定了浮点数的取值范围。

float的范围为-2^128 ~ +2^128,也即-3.40E+38 ~ +3.40E+38

double的范围为-2^1024 ~ +2^1024,也即-1.79E+308 ~ +1.79E+308

精度

floatdouble的精度是由尾数的位数来决定的,尾数越多能表示的小数点后面有效数字就越多,因此精度就越高。浮点数在内存中是按科学计数法来存储的,其整数部分始终是一个隐含着的“1”,由于它是不变的,故不能对精度造成影响。

float:2^23 = 8388608,一共七位,这意味着最多能有 7 位有效数字,但绝对能保证的为 6 位,也即float的精度为 6~7 位有效数字;

double:2^52 = 4503599627370496,一共 16 位,同理,double的精度为 15~16 位。

6 解剖:为什么要用偏移量的方式来计算指数?

如果不采用偏移量的方式:

8 位 2 进制数表示的有符号数范围有两个区间:0000 0000~0111 11111000 0000~1111 1111,分别为0~+127-127~0

大家看到这里的问题了吧,有两个 0 ,一个正 0 和一个负 0。

如果采用偏移量的方式:

127 转化为二进制是:0111 1111

那么

  • 当我们要表示 -127,则有127-1270111 1111 - 0111 1111 = 0000 0000
  • 当我们要表示 -126,则有127-1260111 1111 - 0111 1110 = 0000 0001
  • 当我们要表示 -2,则有127-20111 1111 - 0000 0010 = 0111 1101
  • 当我们要表示 -1,则有127-10111 1111 - 0000 0001 = 0111 1110
  • 当我们要表示 0,则有0+1270000 0000 + 0111 1111 = 0111 1111
  • 当我们要表示 1,则有1+1270000 0001 + 0111 1111 = 1000 0000
  • 当我们要表示 2,则有1+1270000 0010 + 0111 1111 = 1000 0001

当我们要表示128,则有128+127即1000 0000 + 0111 1111 = 1111 1111

由上面的例子,我们可以得出规律,采用移位存储技术,我们可以使用 8 位二进制来表示从-127~+128共计 127 个负数+零(0)+ 128 个正数总共 256 个数,看来使用移位存储既没有 +0 和 -0 的问题,又能充分使用新生成的8位二进制数最大限度的表示单精度浮点数的幂指数,是非常合理的。

点赞
收藏
评论区
推荐文章
blmius blmius
4年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Easter79 Easter79
4年前
typeScript数据类型
//布尔类型letisDone:booleanfalse;//数字类型所有数字都是浮点数numberletdecLiteral:number6;lethexLiteral:number0xf00d;letbinaryLiteral:number0b101
Wesley13 Wesley13
4年前
Java 的BigDecimal
原文:http://blog.csdn.net/diyu122222/article/details/76887382decimaldecimal(18,0)18是定点精度,0是小数位数。decimal(a,b)a指定指定小数点左边和右边可以存储的十进制数字的最大个数,最大精度38。b指定小数点右边可以存储的十
Wesley13 Wesley13
4年前
Java语言中:float数据类型在内存中是怎么存储的?
\java语言中,float类型数字在计算机中用4个字节来存储。遵循IEEE754格式标准:即:一个浮点数有2部分组成:底数m和指数e\
Wesley13 Wesley13
4年前
Java 基础语法
常量:在程序运行期间,固定不变的量常量的分类:1.字符串常量:凡是用双引号引起来的部分,叫做字符串常量,例如:"abc","hello","123"2.整数常量:直接写上的数字,没有小数点,例如:100,200,0,2503.浮点数常量:直接写上的数字,有小数点,
小万哥 小万哥
2年前
掌握 C# 变量:在代码中声明、初始化和使用不同类型的综合指南
C变量变量是用于存储数据值的容器。在C中,有不同类型的变量(用不同的关键字定义),例如:int存储整数(没有小数点的整数),如123或123double存储浮点数,有小数点,如19.99或19.99char存储单个字符,如'a'或'B'。Char值用单引号
小万哥 小万哥
2年前
深入理解 Java 变量类型、声明及应用
Java变量变量是用于存储数据值的容器。在Java中,有不同类型的变量,例如:String存储文本,例如"你好"。字符串值用双引号引起来。int存储整数(全数字),没有小数,例如123或123。float存储浮点数,带有小数,例如19.99或19.99。c
小万哥 小万哥
1年前
学会在 C++ 中使用变量:从定义到实践
C变量变量是用于存储数据值的容器。在C中,有不同类型的变量(使用不同的关键字定义),例如:int存储整数(没有小数点),例如123或123double存储浮点数,带有小数点,例如19.99或19.99char存储单个字符,例如'a'或'B'。字符值
小万哥 小万哥
2年前
C 语言教程:数据类型和格式说明符
C语言中的数据类型C中的变量必须是指定的数据类型,并且您必须在printf()函数中使用格式说明符来显示它:c//创建变量intmyNum5;//整数(没有小数点)floatmyFloatNum5.99;//浮点数charmyLetter'D';//字符/