内存分页不就够了？为什么还要分段？-低调大师

内存分页不就够了？为什么还要分段？

2021-01-04 483

微信搜「yes的练级攻略」干货满满，不然来掐我，回复【123】一份20W字的算法刷题笔记等你来领。个人文章汇总：https://github.com/yessimida/yes 欢迎 star !

你好，我是 yes。

关于内存访问你可能听过分段，分页，还有段页式。

但是为什么要分段？又为什么要分页？

有了分页为什么还要分段？

这就需要看一看历史的发展，知晓历史之后就知道这一切其实都是自然而然的。

这些概念也不是硬塞出来的。

正文

1971 年 11 月 15 日，Intel 推出世界第一块个人微型处理器 4004（4位处理器）。

随后又推出了 8080（8 位处理器）。

那时候访问内存就只有直白自然的想法，用具体物理地址。

所有的内存访问就是通过绝对物理地址去访问的，那时候还没有段的概念。

段的概念是起源于 8086，这个 16 位处理器。

限于当时的技术背景和经济，寄存器只有 16 位，而地址总线是 20 位。

那 16 的位的寄存器如何能访问 20 位的地址？

2 的16 次方如果直着来如何能访问到 2 的 20 次方所表达的数？

直着来是不可能的，因此就需要操作一下。

也就是引入段的概念，让 CPU 通过「段基地址+段内偏移」来访问内存。

有人可能就问你这都只有 16 位，两个 16 位加起来最多只能表示 17 位呀。

你说的没错。

所以再具体一点的计算规则其实是：段基地址左移 4 位（就是乘16）再加上段内偏移，这样得到的就是 20 位的地址。

比如现在的要访问的内存地址是0x05808，那么段基地址可以是 0x0580，偏移量就是 0x0008。

这样内存的寻址空间就扩大到 20 位了。

至于为什么称之为段，其实就是因为寄存器只有 16 位一段只能访问 64 KB，所以需要移动基地址，一段一段的去访问所有的内存空间。

对了，专门为分段而生的寄存器为段寄存器，当时里面直接存放段基地址。

不过渐渐地人们就考虑到安全问题，因为在这个时候程序之间的地址没有隔离，我的程序可以访问你的程序地址，这就很不安全。

于是在 1982 年 80286 推出时，就有了保护模式。

其实就是 CPU 在访问地址的时候做了约束，会判断地址是否在允许的范围内，会判断当前的程序对目的地址是否有访问权限。

搞了个 GDT （全局描述符表）存放所有段描述符。

段寄存器里面也不是直接放段基地址了，而是放了一个叫选择子的东西。

大致可以认为就是段描述符的索引，也就是通过这个索引去找到段描述符，所以叫选择子。

这个选择子里面还有一点属性。

这个 T1 就是标明要去哪个表找，而 RPL 就是特权级了，一共分为四层，0 为最高特权级，3 为最低特权级。

当地址访问时，如果 RPL 的权限低于目标特权级（DPL）时，就会拒绝访问，于是就起到了保护的作用。

所以称之为保护模式，之前的那种没有判断权限的称之为实模式。

当时 80286 的地址总线已经是 24 位，但是用于寻址的通用寄存器还是 16 位，虽然段基地址的位数已经足够访问到 24 位（因为已经放到 GDT 中，且有 24位）。

但是因每次一段只有 64 KB，这样访问就很不方便，需要不断的更换段基地址，于是 80286 很快就被淘汰，换上了 80386。

这是 Intel 第一代 32 位处理器。

除了段寄存器还是 16 位之外，地址总线和寄存器都是 32 位，这就意味着以前为了寻址搞的段机制其实没用了。

因为单单段内偏移就可以访问到 4GB 空间，但是为了向前兼容段机制还是保留了下来，段寄存器还是 16 位是因为够用了，所以没必要扩充。

不过上有政策，下有对策。

虽说段机制保留了，但是咱可以“忽悠”着用，把段基值都设置为 0 ，就用段内偏移地址来访问内存空间就好了。

这其实就意味着每个段的起始地址都是一样的，那就等于不分段了，这就叫平坦模式。

Linux 就是这样实现的。

那为什么要分页？

因为分段粒度太粗了，导致内存碎片大，不利于管理。

当时加载到内存等于一个段都得搞到内存中，而段的范围过大，举个例子。

假设此时你有 200M 内存，此时有 3 个应用在运行，分别是 LOL、chrome、微信。

此时内存中明明有 30MB 的空闲，但是网易云加载不进来，这内存碎片就有点大了。

然后就得把 chrome 先换到磁盘中，然后再让 chrome 加载进来到微信的后面，这样空闲的 30MB 就连续了，于是网易云就能加载到内存中了。

但是这样等于要把 50MB 的内存来个反复横跳，磁盘的访问太慢了，所以效率就很低。

总体而言可以认为分段内存的管理粒度太粗了，所以随着 80386 就出来了个分页管理，一个更加精细化的内存管理方式。

简单地说就是把内存等分成一页一页，每页 4KB 大小，按页为单位来管理内存。

你看按一页一页来管理这样就不用把一段程序都加载进内存，只需要将用到的页加载进内存。

这样内存的利用率就更高了，能同时运行的程序就更多了。

并且由于一页就 4KB，所以内存交换的性能问题得以缓解，毕竟只要换一定的页，而不需要整个段都换到磁盘中。

对应的还有个虚拟内存的概念。

分页机制构造了一个虚拟内存空间，让每个进程误以为自己掌控所有的内存。

再具体一点就是每个进程都有一个页表，页表中有物理页号和属性，这样寻址的时候通过页表就能利用虚拟地址找到对应的物理地址。

属性用来做权限的一些管理。

就理解为进程想要内存中的任意一个地址都行，没问题，反正背地里偷偷的会换成可以用的物理内存地址。

如果物理内存满了也没事，把不常用的内存页先换到磁盘中，即 swap，腾出空间来就好了，到时候要用再换到内存中。

上面提到的虚拟地址也叫线性地址，简单地说就是通过绕不开的段机制得到线性地址，然后再通过分页机制转化得到物理地址。

最后

至此我们已经知晓了为什么有分段，又有分页，还有段页式。

一开始限于技术和成本所以寄存器的位数不够，因此为了扩大寻址范围搞了个分段访问内存。

而随后技术起来了，位数都扩充了，寄存器其实已经可以访问全部内存空间了，所以分段已经没用了。

但是为了向前兼容还是保留着分段访问的形式，并且随着软件的发展，同时运行各种进程的需求越发强烈。

为了更好的管理内存，提高内存的利用率和内存交互性能引入了分页管理。

所以就变成了先分段，然后再分页的段页式。

当然也可以和 Linux 那样让每一段的基地址都设为 0 ，这样就等于“绕开”了段机制。

至此今天的内容就差不多了，这篇文章没有深入具体的分段和分页的细节，之后再作一篇文章来阐述细节。

欢迎关注我的公众号【yes的练级攻略】，更多硬核文章等你来读。

更多文章可看我的文章汇总：https://github.com/yessimida/yes 欢迎 star !

我是 yes，从一点点到亿点点，欢迎在看、转发、留言，我们下篇见。

本文分享自微信公众号 - yes的练级攻略（yes_java）。
如有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

微信关注我们

原文链接：https://my.oschina.net/u/3944379/blog/4875890

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

五分钟爆改，把你的JSON/CSV文件打造成MySQL数据库

生活中，你我一定都看到过这种「xx元爆改出租屋」，「爆改小汽车」之类的文章，做为IT人，折腾的劲头一点也不差。软件开发过程中，你是否有时候，会拿着业务提供的一个个CSV或者JSON的数据文件，写个解析程序，把它们存到数据库里，再在自己的程序里通过数据库读出来？其实不用这么麻烦，还绕了一个大圈。今天，我们一起来「爆改」JSON/CSV这类文件，把它们打造成 MySQL一样的关系型数据库，一套SQL查询走天下。:-) 第一步：代码里加入Maven依赖 ‍ <dependency> <groupId>org.apache.calcite</groupId> <artifactId>calcite-file</artifactId> <version>1.21.0</version> </dependency> 通过这一步，你大概就看出来，咱们今天的爆改，主要依赖 Calcite，这个Apache的顶级项目。来张官网截图感受下：简单介绍的话，它是个数据库查询和优化的引擎，不负责具体的存储。...

2021-01-03

654

开往虚拟机的车已经出发，关注上车那些回收 JVM 垃圾的家伙 ❝ 虚拟机的垃圾回收器，没有哪一个是绝对好的，只有比较好的。 ❞ 今天的这篇文章，我要与你分享虚拟机的那些垃圾回收器们。内容不多，可以耐心看完。垃圾收集器之前我们已经了解过具体的 GC 涉及的细节知识点，现在我们站在更高的角度，来看看各种垃圾收集器，以及其中两个的工作过程（CMS 和 G1）。我们知道，虚拟机将保存对象实例的区域分为了两个叫做「新生代」和「老年代」的地方，为此虚拟机针对不同的内存区域利用不同的算法设计了不同的垃圾收集器。了解垃圾收集器之前，我觉得还是有必要在复习一下「Stop The World」，其用来形容在安全点用户线程暂停的这种状态的一个叫法。关于这个垃圾收集器工作的时候为什么要 Stop The World 还有一个比较有意思的事，“你妈妈在给你打扫房间的时候，肯定也会让你老老实实地在椅子上或者房间外待着，如果她一边打扫，你一边乱扔纸屑，这房间还能打扫完？ ”这是虚拟机团队对 Stop The World 的说明，嗯，很有道理，哈哈哈。那些回收 JVM 垃圾的家伙 ...

2021-01-01

575

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。