大家好,我是二哥呀。字节码指令是 JVM 体系中比较难啃的一块硬骨头,我估计有些球友会有这样的疑惑,“这么难啃,我还能学会啊?”
讲良心话,不是我谦虚,一开始学 Java 字节码和 Java 虚拟机方面的知识我也头大!但硬着头皮学了一阵子之后,突然就开窍了,觉得好有意思,尤其是明白了 Java 代码在底层竟然是这样执行的时候,感觉既膨胀又飘飘然,浑身上下散发着自信的光芒!
来吧,跟着二哥一起来学习吧,别畏难。前面我们已经讲过了,JVM 是基于栈结构的字节码指令集,那今天我们就来继续来学习,什么是字节码指令。
Java 的字节码指令由操作码和操作数组成:
- 操作码(Opcode):一个字节长度(0-255,意味着指令集的操作码总数不可能超过 256 条),代表着某种特定的操作含义。
- 操作数(Operands):零个或者多个,紧跟在操作码之后,代表此操作需要的参数。
由于 Java 虚拟机是基于栈而不是寄存器的结构,所以大多数字节码指令都只有一个操作码。比如 aload_0 就只有操作码没有操作数,而 invokespecial #1 则由操作码和操作数组成。
- aload_0:将局部变量表中下标为 0 的数据压入操作数栈中
- invokespecial #1:调用成员方法或者构造方法,并传递常量池中下标为 1 的常量
字节码指令主要有以下几种,分别是:
- 加载与存储指令
- 算术指令
- 类型转换指令
- 对象的创建与访问指令
- 方法调用和返回指令
- 操作数栈管理指令
- 控制转移指令
我们来一一说明下。
加载与存储指令
加载(load)和存储(store)指令是使用最频繁的指令,用于将数据从栈帧的局部变量表和操作数栈之间来回传递。
看下面这段代码。
public int add(int a, int b) {
int result = a + b;
return result;
}
使用 javap 查看字节码指令(大致)如下:
public int add(int, int);
Code:
0: iload_1
1: iload_2
2: iadd
3: istore_3
4: ireturn
我用下面一幅图来给大家说明白字节码指令的执行过程:
然后我们再来分析 load 和 store 指令的具体含义。
1)将局部变量表中的变量压入操作数栈中
xload_(x 为 i、l、f、d、a,n 默认为 0 到 3),表示将第 n 个局部变量压入操作数栈中。- xload(x 为 i、l、f、d、a),通过指定参数的形式,将局部变量压入操作数栈中,当使用这个指令时,表示局部变量的数量可能超过了 4 个
解释一下。
x 为操作码助记符,表明是哪一种数据类型。见下表所示。
像 arraylength 指令,就没有操作码助记符,它没有代表数据类型的特殊字符,但操作数只能是一个数组类型的对象。
大部分的指令都不支持 byte、short 和 char,甚至没有任何指令支持 boolean 类型。编译器会将 byte 和 short 类型的数据带符号扩展(Sign-Extend)为 int 类型,将 boolean 和 char 零位扩展(Zero-Extend)为 int 类型。
举例来说。
private void load(int age, String name, long birthday, boolean sex) {
System.out.println(age + name + birthday + sex);
}
通过 jclasslib 看一下 load() 方法(4 个参数)的字节码指令。
iload_1:将局部变量表中下标为 1 的 int 变量压入操作数栈中。aload_2:将局部变量表中下标为 2 的引用数据类型变量(此时为 String)压入操作数栈中。lload_3:将局部变量表中下标为 3 的 long 型变量压入操作数栈中。- iload 5:将局部变量表中下标为 5 的 int 变量(实际为 boolean)压入操作数栈中。
通过查看局部变量表就能关联上了。
2)将常量池中的常量压入操作数栈中
根据数据类型和入栈内容的不同,又可以细分为 const 系列、push 系列和 Idc 指令。
const 系列,用于特殊的常量入栈,要入栈的常量隐含在指令本身。
push 系列,主要包括 bipush 和 sipush,前者接收 8 位整数作为参数,后者接收 16 位整数。
Idc 指令,当 const 和 push 不能满足的时候,万能的 Idc 指令就上场了,它接收一个 8 位的参数,指向常量池中的索引。
Idc_w:接收两个 8 位数,索引范围更大。- 如果参数是 long 或者 double,使用
Idc2_w指令。
举例来说。
public void pushConstLdc() {
// 范围 [-1,5]
int iconst = -1;
// 范围 [-128,127]
int bipush = 127;
// 范围 [-32768,32767]
int sipush= 32767;
// 其他 int
int ldc = 32768;
String aconst = null;
String IdcString = "沉默王二";
}
通过 jclasslib 看一下 pushConstLdc() 方法的字节码指令。
iconst_m1:将 -1 入栈。范围 [-1,5]。- bipush 127:将 127 入栈。范围 [-128,127]。
- sipush 32767:将 32767 入栈。范围 [-32768,32767]。
ldc #6 <32768>:将常量池中下标为 6 的常量 32768 入栈。- aconst_null:将 null 入栈。
ldc #7 <沉默王二>:将常量池中下标为 7 的常量“沉默王二”入栈。
3)将栈顶的数据出栈并装入局部变量表中
主要是用来给局部变量赋值,这类指令主要以 store 的形式存在。
xstore_(x 为 i、l、f、d、a,n 默认为 0 到 3)- xstore(x 为 i、l、f、d、a)
明白了 xload_ 和 xload,再看 xstore_ 和 xstore 就会轻松得多,作用反了一下而已。
大家来想一个问题,为什么要有 xstore_ 和 xload_ 呢?它们的作用和 xstore n、xload n 不是一样的吗?
xstore_ 和 xstore n 的区别在于,前者相当于只有操...
真诚点赞 诚不我欺
回复