更新链接装载库

This commit is contained in:
huihut 2018-02-14 17:17:49 +08:00
parent 36699b4f34
commit 3d0f725614

174
README.md
View File

@ -136,6 +136,178 @@
## 链接装载库
### 内存、栈、堆
一般应用程序内存空间有如下区域:
* 栈:用于维护函数调用的上下文
* 堆:用来容纳应用程序动态分配的内存区域
* 可执行文件映像:存储着可执行文件在内存中的映像,由装载器装载是将可执行文件的内存读取或映射到这里
* 保留区保留区并不是一个单一的内存区域而是对内存中受到保护而禁止访问的内存区域的总称如通常C语言讲无效指针赋值为0NULL因此0地址正常情况下不可能有效的访问数据
#### 栈
栈保存了一个函数调用所需要的维护信息常被称为堆栈帧Stack Frame或活动记录Activate Record一般包含以下几方面
* 函数的返回地址和参数
* 临时变量:包括函数的非静态局部变量以及编译器自动生成的其他临时变量
* 保存上下文:包括函数调用前后需要保持不变的寄存器
#### 堆
堆分配算法:
* 空闲链表Free List
* 位图Bitmap
* 对象池
#### “段错误segment fault” 或 “非法操作该内存地址不能read/write”
典型的非法指针解引用造成的错误。当指针指向一个不允许读写的内存地址,而程序却试图利用指针来读或写该地址时,会出现这个错误。
普遍原因:
* 将指针初始化位NULL之后没有给它一个合理的值就开始使用指针
* 没用初始化栈中的指针,指针的值一般会是随机数,之后就直接开始使用指针
### 编译链接
#### 编译链接过程
1. 预编译(预编译器处理如`#include`、`#define`等预编译指令,生成`.i`或`.ii`文件)
2. 编译(编译器进行词法分析、语法分析、语义分析、中间代码生成、目标代码生成、优化,生成`.s`文件)
3. 汇编(汇编器把汇编码翻译成机器码,生成`.o`文件)
4. 链接(连接器进行地址和空间分配、符号决议、重定位,生成`.out`文件)
> 现在版本GCC把预编译和编译合成一步预编译编译程序cc1、汇编器as、连接器ld
> MSVC编译环境编译器cl、连接器link、可执行文件查看器dumpbin
#### 目标文件
编译器编译源代码后生成的文件叫做目标文件。目标文件从结构上讲,它是已经编译后的可执行文件格式,只是还没有经过链接的过程,其中可能有些符号或有些地址还没有被调整。
> 可执行文件Windows的`.exe`和Linux的`ELF`、动态链接库Windows的`.dll`和Linux的`.so`、静态链接库Windows的`.lib`和Linux的`.a`都是按照可执行文件格式存储Windows按照PE-COFFLinux按照ELF
##### 目标文件格式
* Windows的PEPortable Executable或称为PE-COFF`.obj`格式
* Linux的ELFExecutable Linkable Format`.o`格式
* Intel/Microsoft的OMFObject Module Format
* Unix的`a.out`格式
* MS-DOS的`.COM`格式
> PE和ELF都是COFFCommon File Format的变种
##### 目标文件存储结构
段 | 功能
--- | ---
File Header | 文件头,描述整个文件的文件属性(包括文件是否可执行、是静态链接或动态连接及入口地址、目标硬件、目标操作系统等)
.text section | 代码段,执行语句编译成的机器代码
.data section | 数据段,已初始化的全局变量和局部静态变量
.bss section | BBS段Block Started by Symbol未初始化的全局变量和局部静态变量因为默认值为0所以只是在此预留位置不占空间
.rodate section | 只读数据段存放只读数据一般是程序里面的只读变量如const修饰的变量和字符串常量
.comment section | 注释信息段,存放编译器版本信息
.note.GNU-stack section | 堆栈提示段
> 其他段略
#### 链接的接口————符号
在链接中目标文件之间相互拼合实际上是目标文件之间对地址的引用即对函数和变量的地址的引用。我们将函数和变量统称为符号Symbol函数名或变量名就是符号名Symbol Name
如下符号表Symbol Table
Symbol符号名 | Symbol Value (地址)
--- | ---
main| 0x100
Add | 0x123
... | ...
#### extern "C"
extern "C" 的作用是让C++编译器将 `extern "C"` 声明的代码当作C语言代码处理可以避免C++因符号修饰导致代码不能和C语言库中的符号进行链接的问题。
```
#ifdef __cplusplus
extern "C" {
#endif
void *memset(void *, int, size_t);
#ifdef __cplusplus
}
#endif
```
### Linux的共享库Shared Library
Linux下的共享库就是普通的ELF共享对象。
共享库版本更新应该保证二进制接口ABIApplication Binary Interface的兼容
#### 命名
`libname.so.x.y.z`
* x主版本号不同主版本号的库之间不兼容需要重新编译
* y次版本号高版本号向后兼容低版本号
* z发布版本号不对接口进行更改完全兼容
#### 路径
大部分包括Linux在内的开源系统遵循FHSFile Hierarchy Standard的标准这标准规定了系统文件如何存放包括各个目录结构、组织和作用。
* /lib存放系统最关键和最基础的共享库如动态链接器、C语言运行库、数学库等
* /usr/lib存放非系统运行时所需要的关键性的库主要是开发库
* /usr/local/lib存放跟操作系统本身并不十分相关的库主要是一些第三方应用程序的库
> 动态链接器会在`/lib`、`/usr/lib`和由`/etc/ld.so.conf`配置文件指定的,目录中查找共享库
#### 环境变量
* LD_LIBRARY_PATH临时改变某个应用程序的共享库查找路径而不会影响其他应用程序
* LD_PRELOAD指定预先装载的一些共享库甚至是目标文件
* LD_DEBUG打开动态链接器的调试功能
### Windows的动态链接库Dynamic-Link Library
DLL头文件
```
#ifdef __cplusplus
extern "C" {
#endif
#ifdef _WIN32
# ifdef MODULE_API_EXPORTS
# define MODULE_API __declspec(dllexport)
# else
# define MODULE_API __declspec(dllimport)
# endif
#else
# define MODULE_API
#endif
MODULE_API int module_init();
#ifdef __cplusplus
}
#endif
```
DLL源文件
```
#define MODULE_API_EXPORTS
#include "module.h"
MODULE_API int module_init()
{
/* do something useful */
return 0;
}
```
### 运行库Runtime Library
#### 典型程序运行步骤
@ -169,7 +341,7 @@
#### C语言运行库CRT
一个C语言运行库大致包含如下功能:
大致包含如下功能:
* 启动与退出:包括入口函数及入口函数所依赖的其他函数等。
* 标准函数有C语言标准规定的C语言标准库所拥有的函数实现。