程序的链接过程和存储区解读

hunterccc · 发表于 2021-10-14 10:28

EDA365欢迎您登录！

您需要登录才可以下载或查看，没有帐号？注册

x

根据C语言的特点，每一个源程序生成的目标代码将包含源程序所需要表达的所有信息和功能。有些时候很有必要从这些段中来分析实际使用情况和改进空间。目标代码中各段生成情况如下：

1、代码段（Code）
代码段由程序中各个函数产生，函数的每一个语句将最终经过编译和汇编生成二进制机器代码（具体生成哪种体系结构的机器代码由编译器决定）

2、只读数据段（RO Data）
只读数据段由程序中所使用的数据产生，该部分数据的特点是在运行中不需要改变，因此编译器会将该数据放入只读的部分中。C语言的一些语法将生成只读数据段。

① 只读全局变量
例如：定义全局变量 const char a[100]={“ABCDEFG”};
这个是生成大小为100个字节的只读数据区，并使用字符串“ABCDEFG”初始化。如果定义的时候没有指定大小，那么根据初始化的字符串长度生成相应大小的只读数据段。

② 只读局部变量
例如：在函数内部定义的只读变量 const char b[100]={“9876543210”};

③ 程序中使用的常量
例如：在程序中使用printf（“information \n”）,其中“information \n”是字符串常量，编译器会自动把常量放入只读数据区。

注意：上面两个变量定义，定义100个大小的区域，但是只初始化前面几个字节，实际后面的字节没有初始化，但是在程序中也不能写，实际是没有任何用处的。所以定义只读的时候需要做完全的初始化。

3、读写数据段（RW Data）
读写数据段表示了在目标文件中一部分可以读也可以写的数据区，在某些场合它们又被称为已初始化数据段。这部分是属于程序中的静态区域。

①已初始化全局静态变量
在函数外部定义的全局的变量，并且初始化。（static是限制作用域的）

②已初始化局部静态变量
在函数中定义的由static定义并且已经初始化的数据或者数组。
注意：定义的变量要有初始化才会在读写数据区。

4、未初始化数据段（BSS）
这个段也属于静态数据区。但是没有初始化，所以在目标文件中会有标识，而不会真正称为目标文件中的一个段，这个段会在运行时产生，所以它的大小不会影响目标文件的大小。

比如上面这个图就是通常我们编译后获得的。当你的方案选型是一个空间很小的处理器的时候很有必要了解这些存储的区域都存的是什么，方便处理冗余或者修改方案。

上面我们了解了程序对应的存储空间，程序是怎么对号入座到这些存储区的呢？一起来看下吧，也没想象的那么神秘。

我们每一个C语言源程序（*.c）经过编译生成目标文件（.o），目标文件就包含前面我们说的代码段、只读数据段、读写数据段。未初始化数据段、堆和栈不会占用目标文件的空间。

那么可执行程序是由各个目标文件经过链接而成，链接就是把各个目标文件的代码段、只读数据段、读写数据段经过了重新的排列组合。

需要注意的是未初始化数据段是怎么样的，在链接的过程中，链接器可以得到未初始化数据段的大小，它也是各个目标文件的各个未初始化数据段之和，但是这个段是不影响可执行程序大小的。在C语言使用的角度，读写数据段和未初始化数据段都是可读写的。实质上，在目标文件中未初始化数据段和读写数据段的区别也在于此，读写数据段占用目标文件的容量，而未初始化数据段只是一个标识，不需要占用实际的空间。

在链接过程之前，各个源文件生成目标文件相互没有关系。在链接之后，各目标文件函数和变量可以相互调用和访问，从而被联系在一起。比如函数调用，链接过程就是要有函数调用的地方还需要找到真正的函数定义才可以完成链接，链接器会根据需要根据实际的情况修改编译器生成的机器代码，完成正确的跳转。全局变量的访问也是同理。

再来了解下链接过程中常见的错误：

1、符号未找到
(1) 只要符号被声明，编译就可以通过，但是在链接过程中符号必须具有具体的实现才可以成功链接。
(2) 由于数据仅能在文件内部使用（static），导致符号未定义错误。

2、符号重定义
(1) 在多个文件中定义全局的同名函数和变量（static的重名了是正确的）。
(2) 在头文件中定义已经初始化数据，在头文件被多个文件包含的时候，将发生错误。同样在头文件中也不应该定义只读数据段的常量。

再有在头文件中不应该使用静态的变量，无论它有没有初值，这样虽然不会引起链接错误，但是在各个源文件中各自产生变量，不但占用空间，而且在逻辑上是不对的，也违背了头文件的使用原则。

从C语言程序设计的角度，不应该在头文件中定义变量或者函数。对于函数，在头文件中只是声明，需要在源文件中定义；对于变量，无论何种性质，最好的方式是在C语言的源文件中定义，在头文件中使用extern声明使用。

编译，链接后面就是执行了，后面我会跟大家再分享程序运行过程，这个其实都是C语言定的一些规则，只要守规则就会顺利完成想要实现的结果。

damengshu · 发表于 2021-10-14 11:09

每一个源程序生成的目标代码将包含源程序所需要表达的所有信息和功能

xiaoming11 · 发表于 2021-10-14 11:09

代码段由程序中各个函数产生，函数的每一个语句将最终经过编译和汇编生成二进制机器代码

RNGxiaohu · 发表于 2021-10-14 11:10

读写数据段表示了在目标文件中一部分可以读也可以写的数据区，在某些场合它们又被称为已初始化数据段

帐号		自动登录	找回密码
密码			注册

程序的链接过程和存储区解读

EDA365欢迎您登录！

浏览过的版块

推荐内容 /1