📚 C/C++ 技术面试基础知识总结,包括语言、程序库、数据结构、算法、系统、网络、链接装载库等知识及面试经验、招聘、内推等信息。
Go to file
2018-03-01 00:53:41 +08:00
.vscode 66. Plus One 、 88. Merge Sorted Array 2018-02-11 22:17:45 +08:00
Algorithm 添加文件排序、查找的exe 2018-02-11 01:10:40 +08:00
DataStructure 更新数据结构代码 2018-02-16 23:58:28 +08:00
images 添加C++、计算机网络、音视频、Leetcode118、119、122 2018-02-28 17:36:34 +08:00
Problems 添加C++、计算机网络、音视频、Leetcode118、119、122 2018-02-28 17:36:34 +08:00
README.md 更新链接 2018-03-01 00:53:41 +08:00

目录


C/C++

  • 封装
  • 继承
  • 多态
  • 虚函数
  • 内存分配和管理
  • extern"C"
  • const作用
  • 什么是面向对象OOP
  • new、malloc、alloca的区别
  • 运行时类型识别RTTI
  • 友元类和友元函数
  • struct和class的区别
  • this指针

const

// 类
class A
{
private:
    const int a;                // 常对象成员,只能在初始化列表赋值

public:
    // 构造函数
    A() { };
    A(int x) : a(x) { };        // 初始化列表

    // const可用于对重载函数的区分
    int getValue();             // 普通成员函数
    int getValue() const;       // 常成员函数
};

void function()
{
    // 对象
    A b;                        // 普通对象,可以调用全部成员函数
    const A a;                  // 常对象,只能调用常成员函数、更新常成员变量
    canst A *p = &a;            // 常指针
    canst A &q = a;             // 常引用

    // 指针
    char greeting[] = "Hello";
    char* p1 = greeting;                // 指针变量,指向字符数组变量
    const char* p2 = greeting;          // 指针变量,指向字符数组常量
    char* const p3 = greeting;          // 常指针,指向字符数组变量
    const char* const p4 = greeting;    // 常指针,指向字符数组常量
}

// 函数
void function1(const int Var);           // 传递过来的参数在函数内不可变
void function2(const char* Var);         // 参数指针所指内容为常量
void function3(char* const Var);         // 参数指针为常指针
void function4(const int& Var);          // 引用参数在函数内为常量

// 函数返回值
const int function5();      // 返回一个常数
const int* function6();     // 返回一个指向常量的指针变量使用const int *p = function6();
int* const function7();     // 返回一个指向变量的常指针使用int* const p = function7();

inline 内联函数

特征

  • 相当于把内联函数里面的内容写在调用内联函数处;
  • 相当于不用执行进入函数的步骤,直接执行函数体;
  • 相当于宏,却比宏多了类型检查,真正具有函数特性;
  • 不能包含循环、递归、switch等复杂操作。

使用

// 声明1加inline建议使用
inline int functionName(int first, int secend,...);

// 声明2不加inline
int functionName(int first, int secend,...);

// 定义
inline int functionName(int first, int secend,...) {/****/};

编译器对inline函数的处理步骤

  1. 将inline函数体复制到inline函数调用点处
  2. 为所用inline函数中的局部变量分配内存空间
  3. 将inline函数的的输入参数和返回值映射到调用方法的局部变量空间中
  4. 如果inline函数有多个返回点将其转变为inline函数代码块末尾的分支使用GOTO

优缺点

优点

  1. 内联函数同宏函数一样将在被调用处进行代码展开,省去了参数压栈、栈帧开辟与回收,结果返回等,从而提高程序运行速度。
  2. 内联函数相比宏函数来说,在代码展开时,会做安全检查或自动类型转换(同普通函数),而宏定义则不会。
  3. 在类中声明同时定义的成员函数,自动转化为内联函数,因此内联函数可以访问类的成员变量,宏定义则不能。
  4. 内联函数在运行时可调试,而宏定义不可以。

缺点

  1. 代码膨胀。内联是以代码膨胀(复制)为代价,消除函数调用带来的开销。如果执行函数体内代码的时间,相比于函数调用的开销较大,那么效率的收获会很少。另一方面,每一处内联函数的调用都要复制代码,将使程序的总代码量增大,消耗更多的内存空间。
  2. inline函数无法随着函数库升级而升级。inline函数的改变需要重新编译不像non-inline可以直接链接。
  3. 是否内联,程序员不可控。内联函数只是对编译器的建议,是否对函数内联,决定权在于编译器。

Effective C++

  1. 视C++为一个语言联邦C、Object-Oriented C++、Template C++、STL
  2. 尽量以constenuminline替换#define(宁可以编译器替换预处理器)
  3. 尽可能使用const
  4. 确定对象被使用前已先被初始化
  5. 了解C++默默编写并调用哪些函数编译器暗自为class创建default构造函数、copy构造函数、copy assignment操作符、析构函数

STL

数据结构

顺序结构

顺序栈Sequence Stack

SqStack.cpp

typedef struct {
	ElemType *elem;
	int top;
	int size;
	int increment;
} SqSrack;

队列Sequence Queue

typedef struct {
	ElemType * elem;
	int front;
	int rear;
	int maxSize;
}SqQueue;
非循环队列

SqQueue.rear++

循环队列

SqQueue.rear = (SqQueue.rear + 1) % SqQueue.maxSize

顺序表Sequence List

SqList.cpp

typedef struct {
	ElemType *elem;
	int length;
	int size;
	int increment;
} SqList;

链式结构

LinkList.cpp

LinkList_with_head.cpp

typedef struct LNode {
    ElemType data;
    struct LNode *next;
} LNode, *LinkList; 

线性表的链式表示

哈希表

HashTable.cpp

概念

哈希函数:H(key): K -> D , key ∈ K

构造方法

  • 直接定址法
  • 除留余数法
  • 数字分析法
  • 折叠法
  • 平方取中法

冲突处理方法

  • 链地址法key相同的用单链表链接
  • 开放定址法
    • 线性探测法key相同 -> 放到key的下一个位置Hi = (H(key) + i) % m
    • 二次探测法key相同 -> 放到 Di = 1^2, -1^2, ..., ±k)^2,(k<=m/2
    • 随机探测法:H = (H(key) + 伪随机数) % m

线性探测的哈希表数据结构


typedef char KeyType;

typedef struct {
	KeyType key;
}RcdType;

typedef struct {
	RcdType *rcd;
	int size;
	int count;
	bool *tag;
}HashTable;

递归

概念

函数直接或间接地调用自身

递归与分治

  • 分治法
    • 问题的分解
    • 问题规模的分解
  • 折半查找(递归)
  • 归并查找(递归)
  • 快速排序(递归)

递归与迭代

  • 迭代:反复利用变量旧值推出新值
  • 折半查找(迭代)
  • 归并查找(迭代)

广义表

头尾链表存储表示
// 广义表的头尾链表存储表示
typedef enum {ATOM, LIST} ElemTag;
// ATOM==0原子LIST==1子表
typedef struct GLNode {
    ElemTag tag;
    // 公共部分,用于区分原子结点和表结点
    union {
        // 原子结点和表结点的联合部分
        AtomType atom;
        // atom是原子结点的值域AtomType由用户定义
        struct {
            struct GLNode *hp, *tp;
        } ptr;
        // ptr是表结点的指针域prt.hp和ptr.tp分别指向表头和表尾
    } a;
} *GList, GLNode;

扩展线性链表存储表示
// 广义表的扩展线性链表存储表示
typedef enum {ATOM, LIST} ElemTag;
// ATOM==0原子LIST==1子表
typedef struct GLNode1 {
    ElemTag tag;
    // 公共部分,用于区分原子结点和表结点
    union {
        // 原子结点和表结点的联合部分
        AtomType atom; // 原子结点的值域
        struct GLNode1 *hp; // 表结点的表头指针
    } a;
    struct GLNode1 *tp;
    // 相当于线性链表的next指向下一个元素结点
} *GList1, GLNode1;

二叉树

BinaryTree.cpp

性质

  1. 非空二叉树第 i 层最多 2^(i-1) 个结点 (i >= 1)
  2. 深度为 k 的二叉树最多 2^k - 1 个结点 (k >= 1)
  3. 度为 0 的结点数为 n0度为 2 的结点数为 n2则 n0 = n2 + 1
  4. 有 n 个结点的完全二叉树深度 k = ⌊ log2(n) ⌋ + 1
  5. 对于含 n 个结点的完全二叉树中编号为 i (1 <= i <= n) 的结点
    1. 若 i = 1为根否则双亲为 ⌊ i / 2 ⌋
    2. 若 2i > n则 i 结点没有左孩子,否则孩子编号为 2i + 1
    3. 若 2i + 1 > n则 i 结点没有右孩子,否则孩子编号为 2i + 1

存储结构

typedef struct BiTNode
{
    TElemType data;
    struct BiTNode *lchild, *rchild;
}BiTNode, *BiTree;
顺序存储

链式存储

遍历方式

  • 先序遍历
  • 中序遍历
  • 后续遍历
  • 层次遍历

分类

  • 满二叉树
  • 完全二叉树(堆)
    • 大顶堆:根 >= 左 && 根 >= 右
    • 小顶堆:根 <= 左 && 根 <= 右
  • 二叉查找树(二叉排序树):左 < 根 < 右
  • 平衡二叉树AVL树| 左子树树高 - 右子树树高 | <= 1
  • 最小失衡树:平衡二叉树插入新结点导致失衡的子树:调整:
    • LL型根的左孩子右旋
    • RR型根的右孩子左旋
    • LR型根的左孩子左旋再右旋
    • RL型右孩子的左子树先右旋再左旋

其他树及森林

树的存储结构

  • 双亲表示法
  • 双亲孩子表示法
  • 孩子兄弟表示法

并查集

一种不相交的子集所构成的集合 S = {S1, S2, ..., Sn}

平衡二叉树AVL树

性质
  • | 左子树树高 - 右子树树高 | <= 1
  • 平衡二叉树必定是二叉搜索树,反之则不一定
  • 最小二叉平衡树的节点的公式:F(n)=F(n-1)+F(n-2)+1 1是根节点F(n-1)是左子树的节点数量F(n-2)是右子树的节点数量)

最小失衡树

平衡二叉树插入新结点导致失衡的子树

调整:

  • LL型根的左孩子右旋
  • RR型根的右孩子左旋
  • LR型根的左孩子左旋再右旋
  • RL型右孩子的左子树先右旋再左旋

红黑树

应用
  • 关联数组如STL中的map、set

B树

B+树

八叉树

算法

排序

查找

Problems

Single Problem

Leetcode Problems

Array

操作系统

  • 进程间的通信方式(管道、有名管道、信号、共享内存、消息队列、信号量、套接字、文件)

计算机网络

  • TCP/IP
  • TCP协议
  • TCP三次握手
  • TCP和UDP的区别
  • socket套接字
  • HTTP返回码

概念

  • TCPTransmission Control Protocol传输控制协议在运输层是一种面向连接的、可靠的、基于字节流的传输层通信协议。
  • UDPUser Datagram Protocol用户数据报协议在运输层是OSIOpen System Interconnection 开放式系统互联) 参考模型中一种无连接的传输层协议,提供面向事务的简单不可靠信息传送服务。
  • IPInternet Protocol网际协议在网络层是为计算机网络相互连接进行通信而设计的协议。
  • Socket 建立网络通信连接至少要一对端口号(socket)。socket本质是编程接口(API)对TCP/IP的封装TCP/IP也要提供可供程序员做网络开发所用的接口这就是Socket编程接口。

linux网络编程之TCP/IP基础TCP/IP协议栈与数据报封装

ISO/OSI参考模型

OSIopen system interconnection开放系统互联模型是由ISOInternational Organization for Standardization国际标准化组织定义的网络分层模型共七层如下图

ISO/OSI七层网络模型

TCP/IP协议四层模型

TCP/IP网络协议栈分为应用层Application、传输层Transport、网络层Network和链路层Link四层。如下图所示

TCP/IP协议四层模型

HTTP

runoob . HTTP教程

HTTP 请求方法

  • GET请求指定的页面信息并返回实体主体
  • HEAD类似于get请求只不过返回的响应中没有具体的内容用于获取报头
  • POST向指定资源提交数据进行处理请求例如提交表单或者上传文件。数据被包含在请求体中。POST请求可能会导致新的资源的建立和/或已有资源的修改。
  • PUT从客户端向服务器传送的数据取代指定的文档的内容。
  • DELETE请求服务器删除指定的页面
  • CONNECTHTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器
  • OPTIONS允许客户端查看服务器的性能
  • TRACE回显服务器收到的请求主要用于测试或诊断

HTTP 状态码

  • 200 OK: 请求成功
  • 301 Moved Permanently: 永久移动。请求的资源已被永久的移动到新URI返回信息会包括新的URI浏览器会自动定向到新URI。今后任何新的请求都应使用新的URI代替
  • 400 Bad Request: 客户端请求的语法错误,服务器无法理解
  • 401 Unauthorized: 请求要求用户的身份认证
  • 403 Forbidden: 服务器理解请求客户端的请求,但是拒绝执行此请求
  • 404 Not Found: 服务器无法根据客户端的请求找到资源(网页)。通过此代码,网站设计人员可设置"您所请求的资源无法找到"的个性页面
  • 408 Request Timeout: 服务器等待客户端发送的请求时间过长,超时
  • 500 Internal Server Error: 服务器内部错误,无法完成请求
  • 503 Service Unavailable: 由于超载或系统维护服务器暂时的无法处理客户端的请求。延时的长度可包含在服务器的Retry-After头信息中
  • 504 Gateway Timeout: 充当网关或代理的服务器,未及时从远端服务器获取请求

网络编程

Socket

Linux Socket编程不限Linux

Socket客户端服务器通讯

Socket 中的 read()、write() 函数

ssize_t read(int fd, void *buf, size_t count);
ssize_t write(int fd, const void *buf, size_t count);
  • read函数是负责从fd中读取内容.当读成功时read返回实际所读的字节数。如果返回的值是0表示已经读到文件的结束了小于0表示出现了错误。如果错误为EINTR说明读是由中断引起的如果是ECONNREST表示网络连接出了问题。
  • write函数将buf中的nbytes字节内容写入文件描述符fd。成功时返回写的字节数。失败时返回-1并设置errno变量。在网络程序中当我们向套接字文件描述符写时有俩种可能。1write的返回值大于0表示写了部分或者是全部的数据。2返回的值小于0此时出现了错误。我们要根据错误类型来处理。如果错误为EINTR表示在写的时候出现了中断错误。如果为EPIPE表示网络连接出现了问题对方已经关闭了连接

socket中TCP的三次握手建立连接

我们知道tcp建立连接要进行“三次握手”即交换三个分组。大致流程如下

  1. 客户端向服务器发送一个SYN J
  2. 服务器向客户端响应一个SYN K并对SYN J进行确认ACK J+1
  3. 客户端再想服务器发一个确认ACK K+1

只有就完了三次握手但是这个三次握手发生在socket的那几个函数中呢请看下图

socket中发送的TCP三次握手

从图中可以看出:

  1. 当客户端调用connect时触发了连接请求向服务器发送了SYN J包这时connect进入阻塞状态
  2. 服务器监听到连接请求即收到SYN J包调用accept函数接收请求向客户端发送SYN K ACK J+1这时accept进入阻塞状态
  3. 客户端收到服务器的SYN K ACK J+1之后这时connect返回并对SYN K进行确认
  4. 服务器收到ACK K+1时accept返回至此三次握手完毕连接建立。

socket中TCP的四次握手释放连接

上面介绍了socket中TCP的三次握手建立过程及其涉及的socket函数。现在我们介绍socket中的四次握手释放连接的过程请看下图

socket中发送的TCP四次握手

图示过程如下:

  1. 某个应用进程首先调用close主动关闭连接这时TCP发送一个FIN M
  2. 另一端接收到FIN M之后执行被动关闭对这个FIN进行确认。它的接收也作为文件结束符传递给应用进程因为FIN的接收意味着应用进程在相应的连接上再也接收不到额外数据
  3. 一段时间之后接收到文件结束符的应用进程调用close关闭它的socket。这导致它的TCP也发送一个FIN N
  4. 接收到这个FIN的源发送端TCP对它进行确认。

这样每个方向上都有一个FIN和ACK。

数据库

设计模式

链接装载库

内存、栈、堆

一般应用程序内存空间有如下区域:

  • 栈:由操作系统自动分配释放,存放函数的参数值、局部变量等的值,用于维护函数调用的上下文
  • 堆:一般由程序员分配释放,若程序员不释放,程序结束时可能由操作系统回收,用来容纳应用程序动态分配的内存区域
  • 可执行文件映像:存储着可执行文件在内存中的映像,由装载器装载是将可执行文件的内存读取或映射到这里
  • 保留区保留区并不是一个单一的内存区域而是对内存中受到保护而禁止访问的内存区域的总称如通常C语言讲无效指针赋值为0NULL因此0地址正常情况下不可能有效的访问数据

栈保存了一个函数调用所需要的维护信息常被称为堆栈帧Stack Frame或活动记录Activate Record一般包含以下几方面

  • 函数的返回地址和参数
  • 临时变量:包括函数的非静态局部变量以及编译器自动生成的其他临时变量
  • 保存上下文:包括函数调用前后需要保持不变的寄存器

堆分配算法:

  • 空闲链表Free List
  • 位图Bitmap
  • 对象池

“段错误segment fault” 或 “非法操作该内存地址不能read/write”

典型的非法指针解引用造成的错误。当指针指向一个不允许读写的内存地址,而程序却试图利用指针来读或写该地址时,会出现这个错误。

普遍原因:

  • 将指针初始化位NULL之后没有给它一个合理的值就开始使用指针
  • 没用初始化栈中的指针,指针的值一般会是随机数,之后就直接开始使用指针

编译链接

编译链接过程

  1. 预编译(预编译器处理如#include#define等预编译指令,生成.i.ii文件)
  2. 编译(编译器进行词法分析、语法分析、语义分析、中间代码生成、目标代码生成、优化,生成.s文件)
  3. 汇编(汇编器把汇编码翻译成机器码,生成.o文件)
  4. 链接(连接器进行地址和空间分配、符号决议、重定位,生成.out文件)

现在版本GCC把预编译和编译合成一步预编译编译程序cc1、汇编器as、连接器ld

MSVC编译环境编译器cl、连接器link、可执行文件查看器dumpbin

目标文件

编译器编译源代码后生成的文件叫做目标文件。目标文件从结构上讲,它是已经编译后的可执行文件格式,只是还没有经过链接的过程,其中可能有些符号或有些地址还没有被调整。

可执行文件Windows的.exe和Linux的ELF、动态链接库Windows的.dll和Linux的.so、静态链接库Windows的.lib和Linux的.a都是按照可执行文件格式存储Windows按照PE-COFFLinux按照ELF

目标文件格式
  • Windows的PEPortable Executable或称为PE-COFF.obj格式
  • Linux的ELFExecutable Linkable Format.o格式
  • Intel/Microsoft的OMFObject Module Format
  • Unix的a.out格式
  • MS-DOS的.COM格式

PE和ELF都是COFFCommon File Format的变种

目标文件存储结构
功能
File Header 文件头,描述整个文件的文件属性(包括文件是否可执行、是静态链接或动态连接及入口地址、目标硬件、目标操作系统等)
.text section 代码段,执行语句编译成的机器代码
.data section 数据段,已初始化的全局变量和局部静态变量
.bss section BBS段Block Started by Symbol未初始化的全局变量和局部静态变量因为默认值为0所以只是在此预留位置不占空间
.rodate section 只读数据段存放只读数据一般是程序里面的只读变量如const修饰的变量和字符串常量
.comment section 注释信息段,存放编译器版本信息
.note.GNU-stack section 堆栈提示段

其他段略

链接的接口————符号

在链接中目标文件之间相互拼合实际上是目标文件之间对地址的引用即对函数和变量的地址的引用。我们将函数和变量统称为符号Symbol函数名或变量名就是符号名Symbol Name

如下符号表Symbol Table

Symbol符号名 Symbol Value (地址)
main 0x100
Add 0x123
... ...

extern "C"

extern "C" 的作用是让C++编译器将 extern "C" 声明的代码当作C语言代码处理可以避免C++因符号修饰导致代码不能和C语言库中的符号进行链接的问题。

#ifdef __cplusplus
extern "C" {
#endif

void *memset(void *, int, size_t);

#ifdef __cplusplus
}
#endif

Linux的共享库Shared Library

Linux下的共享库就是普通的ELF共享对象。

共享库版本更新应该保证二进制接口ABIApplication Binary Interface的兼容

命名

libname.so.x.y.z

  • x主版本号不同主版本号的库之间不兼容需要重新编译
  • y次版本号高版本号向后兼容低版本号
  • z发布版本号不对接口进行更改完全兼容

路径

大部分包括Linux在内的开源系统遵循FHSFile Hierarchy Standard的标准这标准规定了系统文件如何存放包括各个目录结构、组织和作用。

  • /lib存放系统最关键和最基础的共享库如动态链接器、C语言运行库、数学库等
  • /usr/lib:存放非系统运行时所需要的关键性的库,主要是开发库
  • /usr/local/lib:存放跟操作系统本身并不十分相关的库,主要是一些第三方应用程序的库

动态链接器会在/lib/usr/lib和由/etc/ld.so.conf配置文件指定的,目录中查找共享库

环境变量

  • LD_LIBRARY_PATH:临时改变某个应用程序的共享库查找路径,而不会影响其他应用程序
  • LD_PRELOAD:指定预先装载的一些共享库甚至是目标文件
  • LD_DEBUG:打开动态链接器的调试功能

DLL头文件

#ifdef __cplusplus
extern "C" {
#endif

#ifdef _WIN32
#  ifdef MODULE_API_EXPORTS
#    define MODULE_API __declspec(dllexport)
#  else
#    define MODULE_API __declspec(dllimport)
#  endif
#else
#  define MODULE_API
#endif

MODULE_API int module_init();

#ifdef __cplusplus
}
#endif

DLL源文件

#define MODULE_API_EXPORTS
#include "module.h"

MODULE_API int module_init()
{
    /* do something useful */
    return 0;
}

运行库Runtime Library

典型程序运行步骤

  1. 操作系统创建进程,把控制权交给程序的入口(往往是运行库中的某个入口函数)
  2. 入口函数对运行库和程序运行环境进行初始化包括堆、I/O、线程、全局变量构造等等
  3. 入口函数初始化后调用main函数正式开始执行程序主体部分。
  4. main函数执行完毕后返回到入口函数进行清理工作包括全局变量析构、堆销毁、关闭I/O等然后进行系统调用结束进程。

一个程序的I/O指代程序与外界的交互包括文件、管程、网络、命令行、信号等。更广义地讲I/O指代操作系统理解为“文件”的事物。

glibc 入口

_start -> __libc_start_main -> exit -> _exit

其中main(argc, argv, __environ)函数在__libc_start_main里执行。

MSVC CRT 入口

int mainCRTStartup(void)

执行如下操作:

  1. 初始化和OS版本有关的全局变量。
  2. 初始化堆。
  3. 初始化I/O。
  4. 获取命令行参数和环境变量。
  5. 初始化C库的一些数据。
  6. 调用main并记录返回值。
  7. 检查错误并将main的返回值返回。

C语言运行库CRT

大致包含如下功能:

  • 启动与退出:包括入口函数及入口函数所依赖的其他函数等。
  • 标准函数有C语言标准规定的C语言标准库所拥有的函数实现。
  • I/OI/O功能的封装和实现。
  • 堆:堆的封装和实现。
  • 语言实现:语言中一些特殊功能的实现。
  • 调试:实现调试功能的代码。

C语言标准库ANSI C

包含:

  • 标准输入输出stdio.h
  • 文件操作stdio.h
  • 字符操作ctype.h
  • 字符串操作string.h
  • 数学函数math.h
  • 资源管理stdlib.h
  • 格式转换stdlib.h
  • 时间/日期time.h
  • 断言assert.h
  • 各种类型上的常数limits.h & float.h
  • 变长参数stdarg.h
  • 非局部跳转setjmp.h

海量数据处理

音视频

其他

书籍

  • 《剑指Offer》
  • 《编程珠玑》
  • 《深度探索C++对象模型》
  • 《Effective C++》
  • 《More Effective C++》
  • 《深入理解C++11》
  • 《STL源码剖析》
  • 《深入理解计算机系统》
  • 《TCP/IP网络编程》
  • 《程序员的自我修养》

复习刷题网站

招聘时间岗位

牛客网 . 2018 IT名企校招指南

面试题目经验