聊一聊定点数和浮点数的存储方式

2020-10-11 941

点击蓝字 关注我们

定点数和浮点数

本文中所提到的都是基于intel x86Cpu，开发环境是基于windows 10 + vs2019。本片博客需要读者自己明白十进制、十六进制、二进制之间的转换，文中不会介绍转换过程，需要了解详细过程的情查找相关资料

首先我们简单的介绍一下计算机中数据存储的基础知识，具体内容在大学课程《计算机组成原理》中有详细的介绍。计算机中对数据的存储是有两种形式，一种是以定点数方式存储即C/C++中的char、short、int、long、longlong，另一种就是以浮点数的方式存储即C/C++中的float、double。

定点数中char、short、int、long、longlong存储原理都是一样的，只是长度不同，所以我们选取int型详细介绍，浮点数中float、double原理也是一样的.

其中，定点数和浮点数都是最高位表示符号位（0表示正数1表示负数）其余位表示数值，字节是倒叙存数(小端模式)的也就是说高字节在左边低字节在右边。

定点数

定点数比较简单，计算机中存储的是真实值，计算机采用4字节（32位）存储int变量，例如：int value = 1 ; 则value转化成二进制0000 0000 0000 0000 0000 0000 0000 0001为了书写方便我们写成16进制形式为00 00 00 01。由于计算机是倒叙存储所以计算机中存储为01 00 00 00。

浮点数

下面介绍一下浮点数float存储，C/C++中float存储标准是基于IEEE754，具体内容是一个数值，可以使用科学计数法方式表示，即可以写成：

A * 2^n

其中A为尾数，2为底数，n为指数。

由于底数为2所以所有A都是大于1小于2，也就是都可以写成1.xxxx*2的n次方，所以计算机为了节省空间，可以不存储整数部分的1，因为所有的浮点数都有那个1我们转换的时候把那个1算进去就可以了。n可以是正数也可以是负数（float需要加上127,double加上1023）。

浮点数的存储是由符号位 (sign) + 指数位 (exponent) + 小数位 (fraction) 组成。

类型	符号位	指数	尾数
Float	1位（第31位）	8位（第23~30位）	23位（第0~22位）
Double	1位（第63位）	11位（第52~62位）	52位（第0~51位）

例如：float value = 12.5 ; 那么

小数转二进制方法：整数部分采用除 2 取余，小数部分采用乘 2 取整法

float计算机存储(小端模式)即00 00 48 41

double计算机存储(小端模式)即 00 00 00 00 00 00 29 40

查看内存验证结果

#include<stdio.h>
int main()
{
	float a = 12.5;
	float* p = &a;

	double b = 12.5;
	double* pb = &b;

	printf("%d\n", a);
	printf("%d\n", (int)a);
	printf("%d\n", *(int*)&a);
	return 0;
}

通过断点查看变量a,b的地址，通过地址用内存查看器查看对应的内存来验证

VS2019运行至断点时，菜单调试->窗口->内存->内存1

内存是不会骗人的，所以结果验证无误

大端小端

大端模式：指数据的高字节保存在内存的高地址

例如：12345( 0x3039 ) 的存储顺序是 0x30、0x39

小端模式：指数据的高字节保存在内存的低地址

例如：12345( 0x3039 ) 的存储顺序是 0x39、0x30

判断大小端

方法一：

#include<stdio.h>
int main(int argc, char *argv[])
{
	int i = 0x12345678;
	char c = i;
	if (c == 0x78)
	{
		printf("小端\n");
	}
	else
	{
		printf("大端\n");
	}
	return 0;
}

方法二：

#include<stdio.h>
int main(void)
{
	int  a = 0x12345678;
	char *p = (char *)&a;
	if (0x78 == *p)
	{
		printf("小端\n");
	}
	else
	{
		printf("大端\n");
	}
	return 0;
}

方法三：

#include<stdio.h>
typedef union NODE
{
	int i;
	char c;
}Node;
int main(int argc, char *argv[])
{
	Node node;
	node.i = 0x12345678;
	if (0x78 == node.c)
	{
		printf("小端\n");
	}
	else
	{
		printf("大端\n");
	}
	return 0;
}

上期第四题

#include<stdio.h>
int main()
{
	float a = 12.5;
	printf("%d\n", a);
	printf("%d\n", (int)a);
	printf("%d\n", *(int*)&a);
	return 0;
}

printf("%d\n", a);

printf由于类型不匹配，所以，会把float直接转成double,double 8字节，12.5f转成十六进制：0x4029 0000 000 00000

计算机(小端模式下)存储的值为:00 00 00 00 00 00 29 40

而我们的%d要求是一个4字节的int，对于double的内存布局，我们可以看到前四个字节是00，所以输出自然是0了。

printf("%d\n", (int)a);

float强转成int，省略掉小数部分，所有为12

printf("%d\n", (int)&a);

float 4个字节，12.5f转成二进制是：0100 0001 0100 1000 0000 0000 0000 0000，十六进制是：0x41480000，十进制是：1095237632。

上期第10题

题目回顾：

#include<stdio.h>
int main()
{
	int a = 3, b = 5;
	printf(&a["Ya!Hello! how is this? %s\n"], &b["junk/super"]);
	//等价printf("Hello! how is this? %s\n", "super");
	printf(&a["WHAT%c%c%c %c%c %c !\n"], 1["this"], 2["beauty"], 0["tool"], 0["is"], 3["sensitive"], 4["CCCCCC"]);
	return0;
}

指针的另类用法：

char arr[20] = "hello world";
printf("%s\n", arr);		//从&arr[0]地址处开始读取字符串到'\n'结束	输出hello world
printf("%s\n", &arr[6]);	//从&arr[6]地址处开始读取字符串到'\n'结束	输出world
printf("%s\n", &6[arr]);	//从&arr[6]地址处开始读取字符串到'\n'结束	输出world

arr[i] 其实就是 *(arr+i)也就是 *(i+arr)，这个属于语法规则，只是用的少。

printf(&a["Ya!Hello! how is this? %s\n"], &b["junk/super"]);
//等价printf("Hello! how is this? %s\n", "super");

在这里的"Ya!Hello! how is this? %s\n"是一个存储在常量区的字符串

char* p = "Ya!Hello! how is this? %s\n";
char* p1 = "junk/super";
printf(&a[p], &b[p1]);
printf(&p[3], &p1[5]);

这里的数字3,5就是地址的偏移量

关键字【内存指针】

End

作者：梦凡

你们的在看就是对我最大的肯定，

点个在看好吗~

编程学习基地

常回基地看看

本文分享自微信公众号 - 编程学习基地（LearnBase）。
如有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

微信关注我们

原文链接：https://my.oschina.net/u/4579558/blog/4669703

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Transformer的潜在竞争对手QRNN论文解读，训练更快的RNN

使用递归神经网络（RNN）序列建模业务已有很长时间了。但是RNN很慢因为他们一次处理一个令牌无法并行化处理。此外，循环体系结构增加了完整序列的固定长度编码向量的限制。为了克服这些问题，诸如CNN-LSTM，Transformer，QRNNs之类的架构蓬勃发展。在本文中，我们将讨论论文“拟递归神经网络”（https://arxiv.org/abs/1611.01576）中提出的QRNN模型。从本质上讲，这是一种将卷积添加到递归和将递归添加到卷积的方法。 LSTM LSTM是RNN最著名的变体。红色块是线性函数或矩阵乘法，蓝色块是无参数元素级块。LSTM单元应用门控功能（输入，遗忘，输出）以获得输出和称为隐藏状态的存储元素。此隐藏状态包含整个序列的上下文信息。由于单个向量编码完整序列，因此LSTM无法记住长期依赖性。而且，每个时间步长的计算取决于前一个时间步长的隐藏状态，即LSTM一次计算一个时间步长。因此，计算不能并行进行。 CNN CNN可以捕获空间特征（主要用于图像）。红色块是卷积运算，蓝色块是无参数池化运算。CNN使用内核（或过滤器）通过滑动窗口捕获要素之间的对应关系。这克服了固...

2020-10-12

539

前言代码写了那么多，你知道 a = 1 + 2 这条代码是怎么被 CPU 执行的吗？软件用了那么多，你知道软件的 32 位和 64 位之间的区别吗？再来 32 位的操作系统可以运行在 64 位的电脑上吗？64 位的操作系统可以运行在 32 位的电脑上吗？如果不行，原因是什么？ CPU 看了那么多，我们都知道 CPU 通常分为 32 位和 64 位，你知道 64 位相比 32 位 CPU 的优势在哪吗？64 位 CPU 的计算性能一定比 32 位 CPU 高很多吗？不知道也不用慌张，接下来就循序渐进的、一层一层的攻破这些问题。正文图灵机的工作方式要想知道程序执行的原理，我们可以先从「图灵机」说起，图灵的基本思想是用机器来模拟人们用纸笔进行数学运算的过程，而且还定义了计算机由哪些部分组成，程序又是如何执行的。图灵机长什么样子呢？你从下图可以看到图灵机的实际样子：图来源自：http://www.kristergustafsson.me/turing-machine/ 图灵机的基本组成如下：有一条「纸带」，纸带由一个个连续的格子组成，每个格子可以写入字符，纸带就好比内存，而纸...

2020-10-10

521

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。