探索C语言编译链接过程
C语言程序的编译和链接,一般都是在IDE的内部完成我们无法知道其内部具体执行了什么,是怎么一步步从.c和.h文件生成可执行文件exe的,所以本篇文章就将这一段被封存的过程进行阐述。
可执行文件的生成过程,包括两步编译和链接,而编译又可以分解成:预编译,编译和汇编三个过程
编译
整个编译的过程就是通过编译器,将我们写的代码文件全部转换成一条条的机器可以看懂的机器指令的过程。
预编译(预处理)
在预编译阶段,所有的源文件和头文件都会转换成.i为后缀的文件。
预处理阶段主要是将源文件中以#开始的预编译指令。比如:#define #include #ifndef。
处理规则:
1:将所有的#define删除,并展开所有的宏定义。
2:处理所有的条件编译指令,如:#if ,#elif,#else等。
3:处理#include预编译指令,将包含的头文件的内容插入到改预编译指令的位置。这个过程是递归进行的,也就是说被包含的头文件也可能包含其他文件。
4:删除所有的注释
5:添加行号和文件名标识,方便后面编译器生成调试信息等。
6:保留所有的#pragma的编译器指令,编译器后续会使用。
编译
编译的过程就是将预处理后的文件进行一系列的:词法分析,语法分析,语义分析及优化,生成相应的汇编代码。
词法分析
将源代码输入到扫描器,扫描器的任务就是简单的对代码进行词法分析,把代码中的字符分割成一系列的记号(关键字,标识符,字面量,特殊字符等)。
类如:
array[index]=(1+1)*(i+3);
语法分析
将对扫描产⽣的记号进⾏语法分析,从⽽产⽣语法树。这些语法树是以表达式为节点的树。
语义分析
由语义分析器来完成语义分析,即对表达式的语法层⾯分析。编译器所能做的分析是语义的静态分析。静态语义分析通常包括声明和类型的匹配,类型的转换等。这个阶段会报告错误的语法信息。
汇编
汇编器是将汇编代码转转变成机器可执⾏的指令,每⼀个汇编语句⼏乎都对应⼀条机器指令。就是根据汇编指令和机器指令的对照表⼀⼀的进⾏翻译,也不做指令优化。
链接
链接是⼀个复杂的过程,链接的时候需要把⼀堆⽂件链接在⼀起才⽣成可执⾏程序。
链接过程主要包括:地址和空间分配,符号决议和重定位等这些步骤。
链接解决的是⼀个项⽬中多⽂件、多模块之间互相调⽤的问题。