文章目录
- 前言
 - 一、预处理
 - 二、编译
 - 三、汇编
 - 四、链接
 - 总结
 
前言
本篇文章来讲解一个.c文件生成一个可执行文件的完整过程,我们学习了那么久,只知道在编译器中按下编译运行就可以将一个.c文件运行起来了,但是我们并不了解其中的具体步骤,那么下面我将会在Linux环境下给大家演示一下具体的操作。
生成一个可执行文件一共包括下面4个步骤:
1.预处理
2.编译
3.汇编
4.链接
这里首先准备一个程序:
#include <stdio.h>
#define PI  3.14
int main(void)
{
    printf("PI :%d\n", PI);
    return 0;
}
 
一、预处理
预处理是程序编译的第一个阶段。在这个阶段,预处理器会执行一系列的预处理指令,例如宏展开、头文件包含等操作,将源代码转换为被编译器处理的形式。预处理器根据以#为前缀的指令对源代码进行处理,然后生成一个被修改过的临时文件。
在Linux下使用 gcc -E -o test1.i test1.c这个命令来生成一个预处理后的.i文件:
 
 test.i内容:
这里大家可以看到有非常多的各种函数,而且我们的PI也被直接替换成了3.14。这就印证了我们上面说的:预处理器会进行宏展开和头文件包含的这些操作了。
 
二、编译
编译是程序编译的第二个阶段,也是最核心的阶段。在这个阶段,编译器会将预处理后的源代码转换为汇编语言(Assembly Language)或者直接转换为机器代码。编译器会进行语法和语义分析,生成中间表示(Intermediate Representation)以及对应的目标文件(Object File)。
在Linux下使用gcc -S -o test1.s test1.i命令生成对应的.s文件:
 
 test1.s文件内容:
 可以看到这里生成了对应的汇编语言:
	.file	"test1.c"
	.text
	.section	.rodata
.LC1:
	.string	"PI :%d\n"
	.text
	.globl	main
	.type	main, @function
main:
.LFB0:
	.cfi_startproc
	pushq	%rbp
	.cfi_def_cfa_offset 16
	.cfi_offset 6, -16
	movq	%rsp, %rbp
	.cfi_def_cfa_register 6
	subq	$16, %rsp
	movq	.LC0(%rip), %rax
	movq	%rax, -8(%rbp)
	movsd	-8(%rbp), %xmm0
	leaq	.LC1(%rip), %rdi
	movl	$1, %eax
	call	printf@PLT
	movl	$0, %eax
	leave
	.cfi_def_cfa 7, 8
	ret
	.cfi_endproc
.LFE0:
	.size	main, .-main
	.section	.rodata
	.align 8
.LC0:
	.long	1374389535
	.long	1074339512
	.ident	"GCC: (Ubuntu 7.5.0-3ubuntu1~18.04) 7.5.0"
	.section	.note.GNU-stack,"",@progbits
 
三、汇编
汇编是程序编译的第三个阶段。在这个阶段,汇编器会将上一步生成的目标文件转化为机器代码指令。它利用汇编语言来描述指令的操作和操作数,并将其转化为可以由计算机直接执行的二进制形式。
在Linux下使用gcc -c -o test1.o test1.s 命令来生成对应的.o文件:

 这里可以看到生成的文件是二进制的文件,所以这里我们无法查看:
 
四、链接
链接是程序编译的最后一个阶段。在这个阶段,链接器将多个目标文件、库文件以及系统提供的运行时支持代码(Runtime Support Code)合并在一起,生成最终的可执行文件。链接器解决了符号引用和符号定义之间的关联问题。它会检查目标文件中的符号表,并确保所有的符号被正确引用和定义,以及解决函数和变量的地址关联。
在Linux下使用gcc -o test1 test1.c命令来生成最后的可执行文件:
 
总结
预处理阶段通过宏展开和头文件包含等操作修改源代码。编译阶段将源代码转换为汇编语言或机器代码。汇编阶段将汇编语言转换为机器代码指令。链接阶段将目标文件和运行时支持代码合并生成最终的可执行文件。通过这一系列的处理过程,源代码最终被转换为计算机可以执行的机器代码。


















