认识Class -- 终于不在怂
引子
本是新年,怎奈新冠肆掠,路上行人,男女老少几乎是全副口罩,形色匆匆;偶尔有一两个裸露口鼻的,估计都是没囤到口罩的,这几天药店几乎都是贴上大字:口罩没货。看着网络上病毒消息满天飞,我也响应在家做贡献的号召。上班时,都是早出晚归,几乎只有早上能看到娃,出门时,娃每次都说:see you tomorrow 。赶上疫情,天天在家带娃,终于可以多多陪伴了;别说,带娃还真比上班费神。想着小时候,特别想有一个玩具小船,动手给娃做了一个,附图一张。把娃带好了,也得思考下学习的事儿。学习java有段时间了,想起之前学习java时,看着Class<?> 这样的符号就怵,不明白其表示的含义,又重读《java编程思想》第14章, 趁着这样的时间好好整理了一下,直面当时的怵。
Class对象
Class<?> - 类的类型,是运行时类型信息,也就是 RTTI - RTTI - RunTime Type Infomation;所谓一切皆对象,类也是一个对象,而类的类型信息,就叫做Class对象。RTTI使得我们可以在运行时发现和使用类型信息。以前觉得RTTI离我很远(java菜鸟),其实多态机制正是因为类对象携带了类的类型信息,在类型转化时可以识别到对象的类型。举个栗子,如下, ChildClassTest向上转型为 SuperClassTest时,丢失了子类类型信息,而运行时,向下转型时,又使用RTTI 获取了实际类型,从而可以正常打印出 ChildClassTest。但是,为什么向上转型丢失类型信息,再向下转型时,可以获取到实际的类型,这要从RTTI 的工作原理说起了。
public class SuperClassTest { } public class ChildClassTest extends SuperClassTest { }
SuperClassTest superClassTest = new ChildClassTest(); PrintTool.print(superClassTest);
#打印 com.hj.tool.klass.ChildClassTest@685f4c2e
RTTI的工作原理
前面的例子中,这种在运行时,确定类的实际类型是虚拟机的动态分派机制。 为啥对象可以找到类型信息呢,因为普通对象是被Class对象创建的,而Class对象包含了类的有关信息。下图为Class对象的加载过程,当我们在创建普通对象时,会先判断此类的Class对象是否加载(每个类都有一个Class对象),如果已经加载,就使用Class对象生成普通对象;如果未加载,就需要通过字节码创建Class对象,再生成普通对象。在虚拟机层面,则是运行时,把变量 new ChildClassTest()的引用存放于 LocalVariableTable 的 slot中,执行print时(其实就是执行toString()方法),实际是执行invokevirtual 指令,找到方法的实际接收者,再执行toString()。而 invokevirtual 解析的过程,根据《深入理解java虚拟机》中的描述过程如下:
1)找到操作数栈顶的第一个元素所指向的对象的实际类型,记作C。 2)如果在类型C中找到与常量中的描述符和简单名称都相符的方法,则进行访问权限校验,如果通过则返回这个方法的直接引用,查找过程结束;如果不通过,则返回java.lang.IllegalAccessError异常。 3)否则,按照继承关系从下往上依次对C的各个父类进行第2步的搜索和验证过程。 4)如果始终没有找到合适的方法,则抛出java.lang.AbstractMethodError异常。 由于invokevirtual指令执行的第一步就是在运行期确定接收者的实际类型,所以两次调用中的invokevirtual指令把常量池中的类方法符号引用解析到了不同的直接引用上, 这个过程就是Java语言中方法重写的本质。我们把这种在运行期根据实际类型确定方法执行版本的分派过程称为动态分派。
Class文件结构
既然Class对象来源于字节码,那就来分析下.class文件的内容,引用《java虚拟机规范》中关于classFile的格式如下:“每个class文件都由字节流组成,每个字节含有8个二进制位。所有16位,32位,64位长度的数据将通过构造成2个,4个,8个连续的8位字节来表示。”规范中定义了每个项的字节长度,以及结构,分析的过程还是挺有意思的:原来我们写的代码都被编译成那样的格式。说来也惭愧,java用了这么久,连一个简单的.class文件都没有分析过。
每个class文件都对应如下结构(JDK 8,不同版本结构不是完全一样),其中包括两类数据类型:u(1/2/4), _info; u 后面的数字表示n个字节,而 每个_info 又有特定的格式。 具体可以参看《java虚拟机规范 se 8》第4章内容。
我们来看下具体的一个类,
package com.hj.tool.klass; /** * @Description TODO * @Author jijunjian * @Date 2020-01-27 20:47 * @Version 1.0 */ public class ByteCodeTest { private int m ; public int inc(){ return m+1; } }
使用xxd ByteCodeTest.class 查看编译后的.class文件(16进制),得到如下内容。乍一看,是不是完全看不到,我们的类是如何组织的哇。等我们按class文件的格式整理后,情况就完全不一样了。
cafe babe 0000 0034 0016 0a00 0400 1209 0003 0013 0700 1407 0015 0100 016d 0100 0149 0100 063c 696e 6974 3e01 0003 2829 5601 0004 436f 6465 0100 0f4c 696e 654e 756d 6265 7254 6162 6c65 0100 124c 6f63 616c 5661 7269 6162 6c65 5461 626c 6501 0004 7468 6973 0100 204c 636f 6d2f 686a 2f74 6f6f 6c2f 6b6c 6173 732f 4279 7465 436f 6465 5465 7374 3b01 0003 696e 6301 0003 2829 4901 000a 536f 7572 6365 4669 6c65 0100 1142 7974 6543 6f64 6554 6573 742e 6a61 7661 0c00 0700 080c 0005 0006 0100 1e63 6f6d 2f68 6a2f 746f 6f6c 2f6b 6c61 7373 2f42 7974 6543 6f64 6554 6573 7401 0010 6a61 7661 2f6c 616e 672f 4f62 6a65 6374 0021 0003 0004 0000 0001 0002 0005 0006 0000 0002 0001 0007 0008 0001 0009 0000 002f 0001 0001 0000 0005 2ab7 0001 b100 0000 0200 0a00 0000 0600 0100 0000 0900 0b00 0000 0c00 0100 0000 0500 0c00 0d00 0000 0100 0e00 0f00 0100 0900 0000 3100 0200 0100 0000 072a b400 0204 60ac 0000 0002 000a 0000 0006 0001 0000 000e 000b 0000 000c 0001 0000 0007 000c 000d 0000 0001 0010 0000 0002 0011
以下是整理后的结果,这个过程还是需要些耐心的。但是这个时间花得决绝物超所值。我解析了大部分内容,基本都注释了,其中常量池占了很多内容,但其实是最简单部分,method中关于code属性是比较麻烦的。不同版本编译得到的内容可能会有不同。
#魔数 cafe babe #版本 jdk 8 0000 0034 # 常量池有21 个,第一个,是保留 0016 # 第一个常量 CONSTANT_Methodref_info{ u1 tag //10 u2 class_index //指向CONSTANT_Class_info;表示类 u2 name_and_type_index //指向CONSTANT_NameAndType,表示方法名、方法描述符 } 0a tag 10 0004 class_index 指向 4 0012 name_and_type_index 指向 18 # 第二个常量 tag=9 CONSTANT_Fieldref_info{ u1 tag //9 u2 class_index //指向CONSTANT_Class_info;既可以表示类、也可以表示接口 u2 name_and_type_index //指向CONSTANT_NameAndType,表示字段名、字段描述符 } 09 tag 9 0003 class_index 指向 3 0013 name_and_type_index 指向19 # 第三个常量 tag=7 CONSTANT_Class_info{ u1 tag //tag=7 u2 name_index // name_index是索引值,指向CONSTANT_Utf8_info } 07 tag 7 0014 name_index 指向 20 com/hj/tool/klass/ByteCodeTest # 第4个常量 tag=7 07 0015 name_index 指向 21 # 第5个常量 tag=01 CONSTANT_Utf8_info{ u1 tag //1 u2 length u1 bytes[length] //长度为length的字符串数组 } 01 tag 0001 length 6d asc 109=m # 第6个常量 tag=01 01 0001 length 49 asc 73 I 表示int # 第7个常量 tag=01 01 0006 3c 69 6e 69 74 3e <init> # 第8个常量 tag=01 utf8 字符串数组 01 0003 28 29 56 ()V # 第9个常量 tag=01 utf8 字符串数组 01 0004 43 6f 64 65 Code # 第10个常量 tag=01 utf8 字符串数组 01 000f length=15 4c 69 6e 65 Line 4e 75 6d 62 65 72 number 54 61 62 6c 65 Table # 第11个常量 tag=01 utf8 字符串数组 01 0012 4c 6f 63 LocalVariableTable 61 6c 56 61 72 69 61 62 6c 65 54 61 62 6c 65 # 第12个常量 tag=01 utf8 字符串数组 01 0004 74 68 69 73 this # 第13个常量 tag=01 utf8 字符串数组 01 0020 4c 63 6f 6d 2f 68 6a 2f 74 6f 6f 6c 2f 6b 6c 61 73 73 2f 42 79 74 65 43 6f 64 65 54 65 73 74 3b Lcom/hj/tool/klass/ByteCodeTest; 3b=; # 第14个常量 tag=01 utf8 字符串数组 01 0003 69 6e 63 inc # 第15个常量 tag=01 utf8 字符串数组 01 0003 28 29 49 ()I # 第16个常量 tag=01 utf8 字符串数组 01 000a 53 6f 75 72 63 65 46 69 6c 65 SourceFile # 第17个常量 tag=01 utf8 字符串数组 01 0011 17个 42 79 74 65 43 6f 64 65 54 65 73 74 2e 6a 61 76 61 ByteCodeTest.java # 第18个常量 tag=12 NameAndType CONSTANT_NameAndType{ u1 tag //12 u2 name_index //指向CONSTANT_Utf8_info,表示名称 u2 descriptor_index //指向CONSTANT_Utf8_info,表示描述符 } 0c tag 12 nameAndType 0007 name_index 指向第7个常量 <init> 0008 descriptor_index 指向第8个常量 ()V # 第19个常量 tag=12 NameAndType 0c 0005 m 0006 I # 第20个常量 tag=01 utf8 字符串数组 01 001e 63 6f 6d 2f 68 6a 2f 74 6f 6f 6c 2f 6b 6c 61 73 73 2f 42 79 74 65 43 6f 64 65 54 65 73 74 com/hj/tool/klass/ByteCodeTest # 第21个常量 tag=01 utf8 字符串数组 01 0010 6a 61 76 61 2f 6c 61 6e 67 2f 4f 62 6a 65 63 74 java/lang/Object access_flags 0021 表示是public ,是1.2以后所以21 类索引,父类索引,接口索引 0003 类索引 2字节 指向第三个常量 class-info 又指向 和指向第20个 com/hj/tool/klass/ByteCodeTest 0004 父类索引 2字节 同理指向 java/lang/Object 0000 接口索引 无 0001 field_count u2 1个 field_info[1] field_info{ u2 access_flags //表示字段的访问权限、属性 u2 name_index //对常量池的索引 u2 descriptor_index //对常量池的索引 u2 attributes_count //附加属性的数量 attribute_info attributes[attributes_count] //每个成员是attribute_info结构 } 0002 private 0005 name_index m 0006 descriptor_index I 0000 attributes_count 0 0002 method_count method_info{ u2 access_flags //表示方法的访问权限、属性 u2 name_index //对常量池的索引 u2 descriptor_index //对常量池的索引 u2 attributes_count//附加属性的数量 attribute_info attributes[attributes_count] //每个成员是attribute_info结构 } # 第一个 method init 0001 access_flags public 0007 name_index <init> 0008 descriptor_index ()V 0001 attributes_count 1 attribute_info{ u2 attribute_name_index //常量池索引 u4 attribute_length u1 info[attribute_length] } 0009 attribute_name_index Code 0000 002f attribute_length 47 0001 max_stack 0001 max_locals 0000 0005 code_attribute_length 2a b7 0001 b100 00 00 02 00 0a 00 00 00 06 00 01 00 00 00 09 00 0b 00 00 00 0c 00 01 00 00 00 05 00 0c 00 0d 00 00 # 第二个method 0001 access_flags public 000e name_index 14 inc 000f descriptor_index 15 ()I 0001 attributes_count 1 attribute_info 0009 attribute_name_index Code 0000 0031 attribute_length 49 00 02 max_stack 00 01 max_locals 一个 00 00 00 07 code_length 7 2a aload_0 将第一个引用类型的本地变量 b4 getfield 获取指定类型的实例字段 m #下面这两个指令没弄明白是啥意思, 00 nop 不做 02 iconst_ml 将-1 推到栈顶 04 iconst_1 将1 推到栈顶 60 iadd 将栈顶两个相加,结果压入栈顶 ac ireturn 返回int 00 00 exception_table_length 00 02 attritutes_count 2 00 0a LineNumberTable 00 00 00 06 length=6 00 01 00 00 00 0e 00 0b LocalVariableTable 00 00 00 0c length =12 00 01 00 00 00 07 00 0c 00 0d 00 00 0001 attributes_count 1 0010 attribute_name_index 16 SourceFile 0000 0002 attribute_length 2 0011 sourcefile_index 17 指向常量池中 ByteCodeTest.java
结语
文章写到这里,感觉非常艰难,一是感觉写得不知所云,估计只有自己能明白,二是感觉自己的理解还很浅显。没动手之前,感觉啥都理解了,真正开始动手吧,又感觉啥都没理解。这便是从输入到输出的真实过程;读只是输入,无法形成真正的理解,只有持续输出才能真正领悟,而这个输出的过程才是消化的过程。写得过程中,又不断翻阅资料,把原来点点的理解,连接成断断续续的线,希望以后可以再深入学习,把这些点点的东西,连成线,汇成面。
成为一名优秀的程序员!
文章参考了很多《jjava编程思想》,《java虚拟机规范 se 8》,《深入理解java虚拟机》第二版中的内容。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
从“四舍五入”到“奇进偶舍”
处理取整时,大概下意识的可以想到的方法,都是“四舍五入”吧?不过我们可以先看两个例子,在Python 3中,round(4.5) == 4,而在mongodb 以上的版本中,{$round: 4.5}的结果也是4。对于习惯了只存在“四舍五入”这一种舍入方法的同学们来说,估计是要去怀疑这是不是代码的bug了。其实,这里舍入的方法并不是“四舍五入”,而是采用了所谓的“奇进偶舍”或者“四舍六入五成双”的方法,这种方法也被称为Banker's Rounding(银行家舍入法)。Python 3选择了这种舍入方法作为标准库的实现,最主要的原因还是因为这个舍入方法被IEEE 754标准选为了默认的浮点数舍入方法和Decimal的推荐默认舍入方法(Round to nearest, ties to even)。 作为默认舍入方法被推荐,并且还有Banker's Rounding这么一个拉风的名字,这个方法的优势在什么地方呢?首先,以舍入到整数为例,让我们来看一下,“奇进偶舍”这个方法的规则是什么。这里,我们就从Round to nearest, ties to even这个定义来解释。首先是Roun...
- 下一篇
打一个通用 UMD 包
打一个通用 UMD 包 有这样一个场景,客户端运行很久,但是法务部和数据部需要收集用户的一些信息,这些信息收集好之后需要进行相应的数据处理,之后上报到服务端。客户端提供一个纯粹的 JS 执行引擎,不需要 WebView 容器。iOS 端有成熟的 JavaScriptCore、Android 可以使用 V8 引擎。这样一个引擎配套有一个 SDK,访问 Native 的基础能力和数据运算能力,可以看成是一个阉割版的 Hybrid SDK 额外增加了一些数据处理能力。 问题结束了吗?处理逻辑的时候还需要用到2个库:cheerio 和 sql。因为都是 Node 工程,所以纯粹的 JS 环境是没办法直接执行。所以需求就进行了转变 ———— 将 Node 项目打包成 UMD 规范。这样就可以在纯粹的 JS 环境下运行。接下来的文章就分析下各种规范。其实也就是前端模块化的几种规范。 前端模块化开发的价值 随着互联网的飞速发展,前端开发越来越复杂。本文将从实际项目中遇到的问题出发,讲述模块化能解决哪些问题,以及以 Sea.js 为例讲解如何进行前端的模块化开发。 恼人的命名冲突 我们从一个简单的习惯...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8编译安装MySQL8.0.19
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Red5直播服务器,属于Java语言的直播服务器
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS6,CentOS7官方镜像安装Oracle11G
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装