详解JVM内存管理与垃圾回收机制3 - JVM中对象的内存布局-低调大师

详解JVM内存管理与垃圾回收机制3 - JVM中对象的内存布局

2018-09-10 680

在Java语言层面，可以通过Class类来描述普通的Java类，当JVM创建对象的同时，会生成对应的Class对象，用来描述此对象的大致模型，这也是反射的基础。那么在JVM的内部是如何描述一个普通的对象？我们先从一个简单的示例着手，这有一个Child类：

public class Child extends Person implements Action {
    // 小孩上几年级
    public int grade;

    // Action接口就一个动作：walk
    @Override
    public void walk() {
    }
}

通过Child child = new Child()来创建对象时，JVM在堆中开辟空间存放对象实例数据的同时，会在栈中创建该对象的引用，用于存放child对象在堆内存中的首地址，大致的示意图如下所示。

新创建对象内存占用示意图

现在请大家思考：站在JVM的角度，要完整地描述运行时的child对象，需要记录哪些信息？

脑袋里可能马上就会跳出来这些信息：

对象所属类的相关信息：类(包含父类)的名称、实现了哪些接口、是否有注解、方法列表、属性列表、常量等
实例数据：对象存储的有效信息，比如对象各个属性存储的具体内容

除了这些呢？其实还有一些运行时的数据，比如：锁信息、线程ID、GC标记等。

JVM是如何记录这些信息的呢？HotSpot VM采用OOP-Klass的模型来描述Java对象实例。

Klass

Klass系对象 (instanceKlass、arrayKlass等) 用于描述对象的元数据，其中instanceKlass可以认为是java.lang.Class的VM级别的表示，但它们并不等价，instanceKlass主要作用于整个程序运行过程中，而Class类只用于Java的反射API，接下来将以instanceKlass为例来介绍Klass，其它对象与之类似。

Klass类定义了所有Klass类型共有的数据结构和行为，比如类型名称、与其它类之间的关系、访问标识符等等，具体可参看：

// 代码来自于hotspot/src/share/vm/oops/klass.hpp
class Klass : public Metadata {
    // 反映对象整体布局的描述符，在32位系统中占用4个字节
    // 如果值为正数，表示对象大小，如果值为负数，表示数组
  jint              _layout_helper;
    // 类名称，比如："java/lang/String"表示String对象
    // 而[Ljava/lang/String描述String类型的一维数组
  Symbol*           _name;
    // 对应的Java语言层面的Class对象实例
  oop                   _java_mirror;
    // 父类，指针指向其父类的首地址
  Klass*            _super;
    // 第一个子类
  Klass*            _subklass;
    // subklass指向第一个子类，如果有多个子类
    // 那么可以通过_subklass->next_sibling()找到下一个子类
  Klass*            _next_sibling;

    // Java 中类名和类加载器唯一标识了一个类
    // 由同一个类加载器加载的类通过 _next_link 连接起来
  Klass*            _next_link;
  ClassLoaderData*  _class_loader_data;

    // 访问标识符，Java层面通过 Class.getModifiers()获取
    // 比如：1表示public
  jint              _modifier_flags; 

    // 类或者接口的访问修饰符
  AccessFlags       _access_flags;
  // ......

HotSpot中为每一个已加载的Java类创建一个instanceKlass对象，用于在JVM层面表示Java类，它包含了虚拟机内部运行一个类所需要的全部信息，这些成员变量在类的解析阶段 (主要是将常量池中的符号引用转换为直接引用，即运行时实际内存地址) 完成赋值：

// 代码来自于hotspot/src/share/vm/oops/instanceKlass.hpp
class InstanceKlass: public Klass {
  // 注解
  Annotations*    _annotations;
  // 常量
  ConstantPool*     _constants;
    // 方法列表
  Array<Method*>* _methods;
    // 方法顺序
  Array<int>*     _method_ordering;
  Array<Method*>* _default_methods;
    // 实现的接口
  Array<Klass*>*    _local_interfaces;
    // 继承来的接口
  Array<Klass*>*    _transitive_interfaces;
    // 静态变量的数量
  u2              _static_oop_field_count;
    // 成员变量的数量
  u2              _java_fields_count;
  // ......

接下来以文章开头的Child对象为例，观察程序运行过程中Child类型的Klass信息，以加深大家的理解。

Child类继承Person类并实现的Action的所有接口，通过HSDB来探测Klass对象信息，如下图所示，首先通过HSDB的Class Browser工具列出所有的类，找到我们定义的类，比如Person类实例的内存地址为：0x00000007c0060210，然后使用这个内存地址到Inspector中搜索，即可得到Person类在HotSpot内部instanceKlass类型的全貌，如下图所示。

HSDB

从图中可以得到，Person类的其中一个子类的Klass对象内存地址_subklass:Klass @ 0x00000007c0060408，通过这个地址可以在Code Browser中很方便的查找到其对应的类是：Child。除此之外，还可以找到一些非常熟悉的属性：

_super: Klass @ 0x00000007c0000f28 Person类的父类是Object类
_mofifier_flags: 1 表示 public
_name: Symbol @ 0x00007ff686715e00 类名称，String对象的内存地址
_layout_helper: 24 值为正数，表示对象的大小
_methods: Array<Method> @ 0x00000001171558f0* 方法列表
……
属性太多，这里无法一一列举，鼓励大家自己尝试，随便也学习一下怎么使用HSDB来分析JVM内部的数据结构和状态，但不鼓励钻牛角尖似的非要弄清楚每个属性的含义和作用，至少在当前是不需要的。

再回到instanceKlass.hpp里面，对象的注解、常量以及方法，在VM中分别使用Annotations、ConstantPool、Method来描述，它们同Klass一样，均继承自Metadata或者MetaspaceObj类。

在 HotSpot JVM 中，永久代中用于存放类和方法的元数据以及常量池，比如Class和Method。每当一个类初次被加载的时候，它的元数据都会放到永久代中。

需要注意的是，在JDK1.8中已经引入Metaspace (元空间)来替换原来的永久代PermGen，因此，JDK1.8里的对象模型实现与1.7有很大的不同。通过上文的分析，希望能够加深你对这句话的理解。

OOP

OOP用来描述对象的实例信息，在Java程序运行过程中，每创建一个Java对象，在JVM内部也会相应的创建一个OOP对象来表示Java对象。oop的定义oopDesc如下 (oop相关类的定义均会在名称后面添加后缀Desc，比如：instanceOopDesc)：

class oopDesc {
 private:
    // Mark Word
  volatile markOop  _mark;
    // 元数据
    // 使用了union来声明metadata是为了在64位机器上对对象指针进行压缩
  union _metadata {
    Klass*      _klass;
    narrowKlass _compressed_klass;
  } _metadata;

整个oopDesc定义了如下信息：

_mark (Mark Word)：，哈希码，GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳
_metadata (元数据指针)：指向描述类型的Klass对象指针，Klass对象包含了实例对象所属类型的元数据

在_metadata中包含一个压缩指针，在32位系统中，对象的指针长度是32位，而在64位系统中，指针长度为64位。在64位系统刚刚兴起的年代，对于那些从32位系统迁移到64位系统的引用来说，平白无故的多了差不多50%的内存占用 (主要是指指针占用的内存，非整个应用的内存占用)，基于节约内存的考量，可以在64位系统上对指针占用的内存进行压缩，更多的内容可以参考：-XX:+UseCompressedOops参数。

Mark Word存储对象自身的运行时数据，其被设计成一个非固定的数据结构，可在极小的空间内存储尽量多的信息，它会根据自己的状态复用自己的存储空间。比如，在32位系统中，如果对象处于无锁状态，那么Mark Word的32bit空间中的25个bit用于存储对象的hash值，4bit用于存储对象的分代年龄，2bit用于存储锁标志位，1bit用于存储锁的类型；而当对象处于有锁状态下，根据锁的类型不同，存储的数据又不同，具体的示意图如下：

Mark Word

关于表格中涉及到关于锁的信息仅做如下说明，更多相关内容可以关注后面的文章：

重量级锁采用互斥量来控制对互斥资源的访问，而轻量级锁通过CAS机制来实现，因此，两种锁的重要区别是：拿到“锁”时，是否存在线程调度和切换上下文的开销。
在拿到“锁”这样的描述中，“锁”所指的内容并不一致，重量级锁只要拿到互斥信号，即拿到锁，而CAS操作通过compare是否成功来判断是否拿到锁，因而我们常说的锁，其本质上是是否满足某种条件。因此，注意表格中关于指向指针的描述。
几种锁竞争情况由弱到强分别是：无锁 -> 偏向锁 -> 轻量级锁 -> 重量级锁。
Mark Word中如果记录了线程ID，则认为该线程获得了锁，如果将线程ID清空，则认为自己释放了锁，当然还伴随着锁标志位的改变。线程将自己的ID与Mark Word中的线程ID对比，就知道自己是否拿到当前访问对象的锁。
如果当前对象被锁住，那么该MarkWord中保存着对应线程的ID，通过锁标志位、是否偏向锁、线程ID等几个值可以区分当前对象是否被锁以及被谁锁住。你可能会有个疑问，轻量级锁和重量级锁的MarkWord中并没有线程ID，那么怎么区分是被哪个线程锁住的呢？其实在轻量级锁加锁的过程中，会拷贝MarkWord到锁记录中去，因此只要知道指向锁记录的指针，也就知道锁的线程ID。那重量级锁呢？由于重量级锁是通过获取互斥信号量的方式，那么这个互斥信号量是否属于当前的线程，其实当前线程是能够判断的，这时候，线程ID就变得没有太大的意义了。

总结

在HotSpot虚拟机中，对象在内存中的布局主要分为3个部分：对象头、实例数据、对齐填充，其示意图如下：

对象内存结构示意图

其中，对象头主要存储对象的状态信息以及类的元数据指针，虚拟机可以通过这个指针访问到这个类对应的所有类型信息；而实例数据则是对象真正存储的有效性信息，即在程序代码中锁定义的各种类型的字段内容；对其填充不是一定存在的，也没有特殊的含义，仅仅起到占位的作用：HotSpot要求对象起始地址必须是8字节的整数倍，也就是说对象的大小必须是8的整数倍，因此，当实例数据部分大小不满足8的整数倍时，就需要通过占位符来填充。

最后需要关注的一点是，数组实例相对于对象实例，多了一个数组长度。

引用 (Reference) 将内存中的一个又一个对象连接起来，那何为引用？请继续关注下一个小节。

参考资料

微信关注我们

原文链接：https://yq.aliyun.com/articles/663717

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Java微信订单查询

版权声明：本文首发 http://asing1elife.com ，转载请注明出处。 https://blog.csdn.net/asing1elife/article/details/82620040 Java微信订单查询 Java 通过统一下单 API 进行订单支付后，除等待微信通过 notify_url 进行回调通知外，还可以主动查询订单状态更多精彩更多技术博客，请移步 asing1elife’s blog 前置条件可参考 Java 微信扫码支付如果实现微信支付官网【微信支付】扫码支付开发者文档定义请求参数对象订单查询请求参数（必填） public class QueryOrderRequest { // 公众账号id private String appid; // 商户号 private String mch_id; // 商户订单号，32位以内，不重复 private String out_trade_no; // 随机字符串，32位以内 private String nonce_str; // 签名，遵循签名算法 private String sign; ...

2018-09-10

652

秋招这个时候已经开始了，正所谓知己知彼方能百战不殆，今天就从招聘网站下手分析一波机械的就业前景。这次获取数据的网站是前程无忧，之所以选择前程无忧，是因为数据获取没有什么难度，再者前程无忧提供的岗位信息比智联招聘，拉勾提供的数据都多。看了一下，前程无忧提供了 2000页/50条数据，考虑到数据可能有些重复，这里获取 48569 条数据。数据获取用到的爬虫框架是 scrapy 解析库 xpath、re、pymongo 保存数据用 mongodb 数据处理用 pyecharts。打开 https://www.51job.com/ 在搜索框输入机械，跳转到的网页是这个样子的：这里面的字段还不足以满足我们的需求，还想获取职位描述，和公司的类型，例如国企还是民营等这些数据。于是我们点开看看每一条数据的字段。具体字段框起来的就是我们要获取的内容。接下来上代码，使用scrapy 提供的默认模板创建爬虫项目。 class A51jobSpider(scrapy.Spider): name = '51job' allowed_domains = ['51job.com'] keywor...

2018-09-10

778

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。