揭秘JVM创世过程之Call Stub进入Java世界的门票
前言本文旨在记录近期研读Java源码的学习心得与疑难问题。由于个人理解水平有限文中内容可能存在疏漏恳请读者不吝指正。前情回顾在揭秘JVM创世过程之两种语言首席外交官JavaCalls一文中将JVM看作Java世界中一个拥有两种语言的领事馆一边说C系统语另一边说Java字节码语。那么JavaCalls就是那个身着正装、手里拿着翻译机的首席外交官。当 JVM 需要从 C 内部逻辑如启动、反射、类初始化去执行一段 Java 代码时它必须通过JavaCalls。而JavaCalls最精彩的地方并不直接 jmp 到 Java 代码而是通过一个**“跳板” (Call Stub)**。JVM 在启动时是如何生成这段“跳板(Call Stub)”汇编代码进入Java世界的门票“跳板”代码Call Stub的生成过程是 JVM 启动时最硬核的底层操作之一。它不是由编译器提前编译好的而是 JVM 在运行初期直接在内存里**“现场手写”**出来的机器码。这个过程主要由StubGenerator和MacroAssembler这两个组件协作完成。1. 核心流程从 C 到机器码在Threads::create_vm执行过程中会调用init_globals()进而触发stubRoutines_init1()。这时JVM 会开启“机器码印刷机”。整个执行过程相关核心代码如下hotspot\src\share\vm\runtime\thread.cpp中Threads::create_vm()核心代码如下jintThreads::create_vm(JavaVMInitArgs*args,bool*canTryAgain){// 省略部分代码// Attach the main thread to this os threadJavaThread*main_threadnewJavaThread();main_thread-set_thread_state(_thread_in_vm);main_thread-record_stack_base_and_size();main_thread-initialize_thread_local_storage();main_thread-set_active_handles(JNIHandleBlock::allocate_block());// 省略部分代码// Initialize global modules// 在此方法中会执行stubRoutines_init1()完成“跳板”代码Call Stubjint statusinit_globals();if(status!JNI_OK){deletemain_thread;*canTryAgainfalse;// dont let caller call JNI_CreateJavaVM againreturnstatus;}// 省略部分代码{// The VM creates returns objects of this class. Make sure its initialized.initialize_class(vmSymbols::java_lang_Class(),CHECK_0);// The VM preresolves methods to these classes. Make sure that they get initializedinitialize_class(vmSymbols::java_lang_reflect_Method(),CHECK_0);initialize_class(vmSymbols::java_lang_ref_Finalizer(),CHECK_0);call_initializeSystemClass(CHECK_0);// 省略部分代码}// 省略部分代码}init_globals()方法核心代码hotspot\src\share\vm\runtime\init.cpp中init_globals()中调用stubRoutines_init1()和stubRoutines_init2()完成stubRoutines初始化。jintinit_globals(){// 省略部分代码bytecodes_init();classLoader_init();codeCache_init();VM_Version_init();os_init_globals();stubRoutines_init1();jint statusuniverse_init();// dependent on codeCache_init and// stubRoutines_init1 and metaspace_init.if(status!JNI_OK)returnstatus;javaClasses_init();// must happen after vtable initializationstubRoutines_init2();// note: StubRoutines need 2-phase init// 省略部分代码returnJNI_OK;}stubRoutines_init1()方法核心代码hotspot\src\share\vm\runtime\stubRoutines.cppvoidstubRoutines_init1(){StubRoutines::initialize1();}voidStubRoutines::initialize1(){if(_code1NULL){ResourceMark rm;TraceTimetimer(StubRoutines generation 1,TraceStartupTime);_code1BufferBlob::create(StubRoutines (1),code_size1);if(_code1NULL){vm_exit_out_of_memory(code_size1,OOM_MALLOC_ERROR,CodeCache: no room for StubRoutines (1));}CodeBufferbuffer(_code1);StubGenerator_generate(buffer,false);}}Step 1: 申请可执行内存 (Code Buffer)JVM 会在内存中开辟一块特殊的区域属于 CodeCache 的一部分并将其权限设置为可读、可写、可执行RWX。这块内存就是用来存放生成的汇编指令的“纸”。hotspot\src\share\vm\runtime\stubRoutines.cpp在方法initialize1()中通过BufferBlob::create()申请一块内存代码如下voidStubRoutines::initialize1(){if(_code1NULL){ResourceMark rm;TraceTimetimer(StubRoutines generation 1,TraceStartupTime);_code1BufferBlob::create(StubRoutines (1),code_size1);if(_code1NULL){vm_exit_out_of_memory(code_size1,OOM_MALLOC_ERROR,CodeCache: no room for StubRoutines (1));}CodeBufferbuffer(_code1);StubGenerator_generate(buffer,false);}}Step 2: 启动 MacroAssembler (宏汇编器)JVM 使用一个名为MacroAssembler的 C 类。这个类非常神奇它把每一条 CPU 指令如push,mov,call都封装成了一个 C 函数。当你调用masm-push(rax)时它并不是在执行 push而是在往刚才申请的内存缓冲区里写入0x50x86-64 架构下push rax的机器码。2. 生成 Call Stub 的具体代码逻辑在 OpenJDK 源码中以 x86_64 为例生成这段代码的逻辑位于src/hotspot/cpu/x86/stubGenerator_x86_64.cpp的generate_call_stub方法中。我们可以通过 C 源码窥见它“手写”汇编的过程addressgenerate_call_stub(addressreturn_address){// ... 准备缓冲区 ...StubCodeMarkmark(this,StubRoutines,call_stub);address start__pc();// 记录起始地址// 1. 保存调用者C的现场__enter();// push rbp; mov rbp, rsp__push(r15);// 保存关键寄存器__push(r14);__push(r13);__push(r12);// 2. 将 C 传进来的参数移动到指定的寄存器// 比如从 c_rarg1 (rsi) 拿到 Java 方法的入口地址__movptr(rbx,method);// 把 Method* 放入 rbx// 3. 构建 Java 栈帧// 这里会根据参数个数动态调整 rsp 的位置为 Java 参数腾地方// 4. 关键一跃跳入 Java 世界__call(entry_point);// 这里的 entry_point 就是解释器的入口// 5. 凯旋归来清理 Java 栈并恢复 C 寄存器__pop(r12);__pop(r13);__pop(r14);__pop(r15);__leave();__ret(0);// 返回到 JavaCalls::callreturnstart;// 返回这段代码在内存中的首地址}3. 如何变成函数指针生成完这段机器码后JVM 会做一个非常关键的动作记录地址将start这段代码的首地址存入全局变量StubRoutines::_call_stub_entry。强制转换在头文件中这个地址被定义为一个复杂的函数指针类型。调用当JavaCalls需要执行 Java 代码时它直接通过这个指针调用(*(CallStub)cast_to_fqn(_call_stub_entry))(...)这时CPU 就会从当前的 C 指令流直接跳转到那块刚才生成的内存区域开始执行那几条push和mov。4. 为什么要“现场手写”而不是写在.s汇编文件里你可能会问为什么不直接写个.s汇编文件编译进来动态性JVM 需要根据当前的硬件特性比如是否支持 AVX-512 指令集、是否开启了某些安全补丁来动态决定生成什么样的指令。极致优化现场生成可以根据当前的偏移量计算出最短的跳转指令Short Jump减少代码体积。统一抽象通过 C 宏汇编器JVM 可以用一套逻辑在不同的系统Linux/Windows/macOS上生成对应的机器码而不需要维护无数个版本的.s文件。总结JVM 生成跳板代码的过程就像是一个在施工现场直接烧制异形砖块的建筑师MacroAssembler是模具。内存缓冲区是原材料。StubGenerator是施工图纸。这种“运行时生成代码”的技术JIT 思想的萌芽确保了 Java 能够跨越 C 和字节码的鸿沟同时保持顶级的执行效率。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2473444.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!