当前位置:网站首页>深入学习JVM底层(四):类文件结构
深入学习JVM底层(四):类文件结构
2022-07-02 06:09:00 【我觉得海星_98】
类文件结构
概述
我们所编写的每一行代码,要在机器上运行,最终都需要编译成二进制的机器码 CPU 才能识别。但是由于虚拟机的存在,屏蔽了操作系统与 CPU 指令集的差异性,类似于 Java 这种建立在虚拟机之上的编程语言通常会编译成一种中间格式的文件来存储,比如我们今天要聊的字节码(ByteCode)文件。
无关性的基石
Java 虚拟机的设计者在设计之初就考虑并实现了其它语言在 Java 虚拟机上运行的可能性。所以并不是只有 Java 语言能够跑在 Java 虚拟机上,时至今日诸如 Kotlin、Groovy、Jython、JRuby 等一大批 JVM 语言都能够在 Java 虚拟机上运行。它们和 Java 语言一样都会被编译器编译成字节码文件,然后由虚拟机来执行。所以说类文件(字节码文件)具有语言无关性。

Class类文件的结构
Class 文件是一组以 8 位字节为基础单位的二进制流,各个数据严格按照顺序紧凑的排列在 Class 文件中,中间无任何分隔符,这使得整个 Class 文件中存储的内容几乎全部都是程序运行的必要数据,没有空隙存在。当遇到需要占用 8 位字节以上空间的数据项时,会按照高位在前的方式分割成若干个 8 位字节进行存储。
Java 虚拟机规范规定 Class 文件格式采用一种类似与 C 语言结构体的伪结构体来存储数据,这种伪结构体中只有两种数据类型:无符号数和表:
- 无符号数:属于基本的数据类型,以 u1、u2、u4、u8来分别代表 1 个字节、2 个字节、4 个字节和 8 个字节的无符号数,无符号数可以用来描述数字、索引引用、数量值或者按照 UTF-8 编码结构构成的字符串值。
- 表:由多个无符号数或者其他表作为数据项构成的复合数据类型,所有表都习惯性地以「_info」结尾。表用于描述有层次关系的复合结构的数据,整个 Class 文件就是一张表,它由下表中所示的数据项构成。

如图,Class 文件中存储的字节严格按照上表中的顺序紧凑的排列在一起。哪个字节代表什么含义,长度是多少,先后顺序如何都是被严格限制的,不允许有任何改变。
魔数与 Class 文件的版本
每个 Class 文件的头 4 个字节称为魔数(Magic Number),它的唯一作用是确定这个文件是否为一个能被虚拟机接收的 Calss 文件。之所以使用魔数而不是文件后缀名来进行识别主要是基于安全性的考虑,因为文件后缀名是可以随意更改的。Class 文件的魔数值为「0xCAFEBABE」。
紧接着魔数的 4 个字节存储的是 Class 文件的版本号:第 5 和第 6 两个字节是次版本号(Minor Version),第 7 和第 8 个字节是主版本号(Major Version)。高版本的 JDK 能够向下兼容低版本的 Class 文件,虚拟机会拒绝执行超过其版本号的 Class 文件。
常量池
主版本号之后是常量池入口,常量池可以理解为 Class 文件之中的资源仓库,它是 Class 文件结构中与其他项目关联最多的数据类型,也是占用 Class 文件空间最大的数据项目之一,同是它还是 Class 文件中第一个出现的表类型数据项目。
常量池中主要存放两大类常量:字面量和符号引用
- 字面量:比较接近 Java 语言层面的常量概念,如字符串、声明为 final 的常量值等。
- 符号引用:属于编译原理方面的概念,包括了以下三类常量
- 类和接口的全限定名
- 字段的名称和描述符
- 方法的名称和描述符
访问标志
紧接着常量池之后的两个字节代表访问标志(access_flag),这个标志用于识别一些类或者接口层次的访问信息,包括这个 Class 是类还是接口;是否定义为 public 类型;是否定义为 abstract 类型;如果是类的话,是否被申明为 final 等。具体的标志位以及标志的含义见下表:
access_flags 中一共有 16 个标志位可以使用,当前只定义了其中的 8 个,没有使用到的标志位要求一律为 0。

类索引、父类索引与接口索引集合
类索引(this_class)和父类索引(super_class)都是一个 u2 类型的数据,而接口索引集合(interfaces)是一组 u2 类型的数据集合,Class 文件中由这三项数据来确定这个类的继承关系。
- 类索引用于确定这个类的全限定名
- 父类索引用于确定这个类的父类的全限定名
- 接口索引集合用于描述这个类实现了哪些接口
字段表集合
字段表集合(field_info)用于描述接口或者类中声明的变量。字段(field)包括类变量和实例变量,但不包括方法内部声明的局部变量。下面我们看看字段表的结构:

字段修饰符放在 access_flags 中,它与类中的 access_flag 非常相似,都是一个 u2 的数据类型:

方法表集合
- Class 文件中对方法的描述和对字段的述是完全一致的,方法表中的结构和字段表的结构一样。
- 因为 volatile 关键字和 transient 关键字不能修饰方法,所以方法表的访问标志中没有 ACC_VOLATILE 和 ACC_TRANSIENT。与之相对的,synchronizes、native、strictfp 和 abstract 关键字可以修饰方法,所以方法表的访问标志中增加了 ACC_SYNCHRONIZED、ACC_NATIVE、ACC_STRICTFP 和 ACC_ABSTRACT 标志。
属性表集合
在 Class 文件、字段表、方法表中都可以携带自己的属性表(attribute_info)集合,用于描述某些场景专有的信息。
属性表集合不像 Class 文件中的其它数据项要求这么严格,不强制要求各属性表的顺序,并且只要不与已有属性名重复,任何人实现的编译器都可以向属性表中写入自己定义的属性信息,Java 虚拟机在运行时会略掉它不认识的属性。
边栏推荐
- Bgp Routing preference Rules and notice Principles
- Lucene Basics
- TI毫米波雷达学习(一)
- 谷歌出海创业加速器报名倒计时 3 天,创业人闯关指南提前收藏!
- Monitoring uplink of VRRP
- Linkage between esp8266 and stc8h8k single chip microcomputer - Weather Clock
- Common websites for Postgraduates in data mining
- Zhuanzhuanben - LAN construction - Notes
- Web components series (VIII) -- custom component style settings
- Deep learning classification network -- vggnet
猜你喜欢

神机百炼3.52-Prim

借力 Google Cloud 基础设施和着陆区,构建企业级云原生卓越运营能力

Google Go to sea entrepreneurship accelerator registration countdown 3 days, entrepreneurs pass through the guide in advance collection!

Brain and cognitive neuroscience matlab psychoolbox cognitive science experimental design - experimental design 4

Flutter hybrid development: develop a simple quick start framework | developers say · dtalk

How vite is compatible with lower version browsers

AttributeError: ‘str‘ object has no attribute ‘decode‘

Problems encountered in uni app development (continuous update)

Regular expression summary

MySQL transaction and isolation level
随机推荐
Problems encountered in uni app development (continuous update)
Shenji Bailian 3.54-dichotomy of dyeing judgment
Web page user step-by-step operation guide plug-in driver js
Let every developer use machine learning technology
使用HBuilderX的一些常用功能
Flutter hybrid development: develop a simple quick start framework | developers say · dtalk
Compte à rebours de 3 jours pour l'inscription à l'accélérateur de démarrage Google Sea, Guide de démarrage collecté à l'avance!
Scheme and implementation of automatic renewal of token expiration
官方零基础入门 Jetpack Compose 的中文课程来啦!
STC8H8K系列汇编和C51实战——按键允许按键计数(利用下降沿中断控制)
LeetCode 283. 移动零
Classic literature reading -- deformable Detr
从设计交付到开发,轻松畅快高效率!
借力 Google Cloud 基础设施和着陆区,构建企业级云原生卓越运营能力
STC8H8K系列汇编和C51实战——串口发送菜单界面选择不同功能
CNN visualization technology -- detailed explanation of cam & grad cam and concise implementation of pytorch
Current situation analysis of Devops and noops
MySQL transaction and isolation level
MUI底部导航的样式修改
Zabbix Server trapper 命令注入漏洞 (CVE-2017-2824)