CS-Notes/docs/notes/算法 - 算法分析.md

248 lines
7.7 KiB
Markdown
Raw Normal View History

2019-04-21 10:36:08 +08:00
<!-- GFM-TOC -->
2019-03-27 20:57:37 +08:00
* [数学模型](#数学模型)
* [1. 近似](#1-近似)
* [2. 增长数量级](#2-增长数量级)
* [3. 内循环](#3-内循环)
* [4. 成本模型](#4-成本模型)
* [注意事项](#注意事项)
* [1. 大常数](#1-大常数)
* [2. 缓存](#2-缓存)
* [3. 对最坏情况下的性能的保证](#3-对最坏情况下的性能的保证)
* [4. 随机化算法](#4-随机化算法)
* [5. 均摊分析](#5-均摊分析)
* [ThreeSum](#threesum)
* [1. ThreeSumSlow](#1-threesumslow)
* [2. ThreeSumBinarySearch](#2-threesumbinarysearch)
* [3. ThreeSumTwoPointer](#3-threesumtwopointer)
* [倍率实验](#倍率实验)
2019-04-21 10:36:08 +08:00
<!-- GFM-TOC -->
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
# 数学模型
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
## 1. 近似
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
N<sup>3</sup>/6-N<sup>2</sup>/2+N/3 \~ N<sup>3</sup>/6。使用 \~f(N) 来表示所有随着 N 的增大除以 f(N) 的结果趋近于 1 的函数。
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
## 2. 增长数量级
2019-04-21 12:19:08 +08:00
N<sup>3</sup>/6-N<sup>2</sup>/2+N/3 的增长数量级为 O(N<sup>3</sup>)。增长数量级将算法与它的具体实现隔离开来,一个算法的增长数量级为 O(N<sup>3</sup>) 与它是否用 Java 实现,是否运行于特定计算机上无关。
2019-03-27 20:57:37 +08:00
## 3. 内循环
2019-03-08 23:06:28 +08:00
执行最频繁的指令决定了程序执行的总时间,把这些指令称为程序的内循环。
2019-03-27 20:57:37 +08:00
## 4. 成本模型
2019-03-08 23:06:28 +08:00
使用成本模型来评估算法,例如数组的访问次数就是一种成本模型。
2019-03-27 20:57:37 +08:00
# 注意事项
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
## 1. 大常数
2019-03-08 23:06:28 +08:00
2019-04-21 12:19:08 +08:00
在求近似时,如果低级项的常数系数很大,那么近似的结果是错误的。
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
## 2. 缓存
2019-03-08 23:06:28 +08:00
计算机系统会使用缓存技术来组织内存,访问数组相邻的元素会比访问不相邻的元素快很多。
2019-03-27 20:57:37 +08:00
## 3. 对最坏情况下的性能的保证
2019-03-08 23:06:28 +08:00
在核反应堆、心脏起搏器或者刹车控制器中的软件,最坏情况下的性能是十分重要的。
2019-03-27 20:57:37 +08:00
## 4. 随机化算法
2019-03-08 23:06:28 +08:00
通过打乱输入,去除算法对输入的依赖。
2019-03-27 20:57:37 +08:00
## 5. 均摊分析
2019-03-08 23:06:28 +08:00
2019-04-21 12:19:08 +08:00
将所有操作的总成本除于操作总数来将成本均摊。例如对一个空栈进行 N 次连续的 push() 调用需要访问数组的次数为 N+4+8+16+...+2N=5N-4N 是向数组写入元素的次数,其余都是调整数组大小时进行复制需要的访问数组次数),均摊后访问数组的平均次数为常数。
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
# ThreeSum
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
ThreeSum 用于统计一个数组中和为 0 的三元组数量。
2019-03-08 23:06:28 +08:00
```java
2019-03-27 20:57:37 +08:00
public interface ThreeSum {
int count(int[] nums);
2019-03-08 23:06:28 +08:00
}
```
2019-03-27 20:57:37 +08:00
## 1. ThreeSumSlow
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
该算法的内循环为 `if (nums[i] + nums[j] + nums[k] == 0)` 语句,总共执行的次数为 N(N-1)(N-2) = N<sup>3</sup>/6-N<sup>2</sup>/2+N/3因此它的近似执行次数为 \~N<sup>3</sup>/6增长数量级为 O(N<sup>3</sup>)。
2019-03-08 23:06:28 +08:00
```java
2019-03-27 20:57:37 +08:00
public class ThreeSumSlow implements ThreeSum {
@Override
public int count(int[] nums) {
int N = nums.length;
int cnt = 0;
for (int i = 0; i < N; i++) {
for (int j = i + 1; j < N; j++) {
for (int k = j + 1; k < N; k++) {
if (nums[i] + nums[j] + nums[k] == 0) {
cnt++;
}
}
}
}
return cnt;
}
2019-03-08 23:06:28 +08:00
}
```
2019-03-27 20:57:37 +08:00
## 2. ThreeSumBinarySearch
2019-03-08 23:06:28 +08:00
2019-04-21 12:19:08 +08:00
将数组进行排序,对两个元素求和,并用二分查找方法查找是否存在该和的相反数,如果存在,就说明存在和为 0 的三元组。
2019-03-08 23:06:28 +08:00
应该注意的是,只有数组不含有相同元素才能使用这种解法,否则二分查找的结果会出错。
2019-03-27 20:57:37 +08:00
该方法可以将 ThreeSum 算法增长数量级降低为 O(N<sup>2</sup>logN)。
2019-03-08 23:06:28 +08:00
```java
2019-03-27 20:57:37 +08:00
public class ThreeSumBinarySearch implements ThreeSum {
@Override
public int count(int[] nums) {
Arrays.sort(nums);
int N = nums.length;
int cnt = 0;
for (int i = 0; i < N; i++) {
for (int j = i + 1; j < N; j++) {
int target = -nums[i] - nums[j];
int index = BinarySearch.search(nums, target);
// 应该注意这里的下标必须大于 j否则会重复统计。
if (index > j) {
cnt++;
}
}
}
return cnt;
}
2019-03-08 23:06:28 +08:00
}
```
```java
2019-03-27 20:57:37 +08:00
public class BinarySearch {
public static int search(int[] nums, int target) {
int l = 0, h = nums.length - 1;
while (l <= h) {
int m = l + (h - l) / 2;
if (target == nums[m]) {
return m;
} else if (target > nums[m]) {
l = m + 1;
} else {
h = m - 1;
}
}
return -1;
}
2019-03-08 23:06:28 +08:00
}
```
2019-03-27 20:57:37 +08:00
## 3. ThreeSumTwoPointer
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
更有效的方法是先将数组排序,然后使用双指针进行查找,时间复杂度为 O(N<sup>2</sup>)。
2019-03-08 23:06:28 +08:00
2019-06-04 23:31:42 +08:00
同样不适用与数组存在重复元素的情况。
2019-03-08 23:06:28 +08:00
```java
2019-03-27 20:57:37 +08:00
public class ThreeSumTwoPointer implements ThreeSum {
@Override
public int count(int[] nums) {
int N = nums.length;
int cnt = 0;
Arrays.sort(nums);
for (int i = 0; i < N - 2; i++) {
int l = i + 1, h = N - 1, target = -nums[i];
while (l < h) {
int sum = nums[l] + nums[h];
if (sum == target) {
cnt++;
l++;
h--;
} else if (sum < target) {
l++;
} else {
h--;
}
}
}
return cnt;
}
2019-03-08 23:06:28 +08:00
}
```
2019-03-27 20:57:37 +08:00
# 倍率实验
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
如果 T(N) \~ aN<sup>b</sup>logN那么 T(2N)/T(N) \~ 2<sup>b</sup>
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
例如对于暴力的 ThreeSum 算法,近似时间为 \~N<sup>3</sup>/6。进行如下实验多次运行该算法每次取的 N 值为前一次的两倍,统计每次执行的时间,并统计本次运行时间与前一次运行时间的比值,得到如下结果:
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
| N | Time(ms) | Ratio |
| :---: | :---: | :---: |
| 500 | 48 | / |
| 1000 | 320 | 6.7 |
| 2000 | 555 | 1.7 |
| 4000 | 4105 | 7.4 |
| 8000 | 33575 | 8.2 |
| 16000 | 268909 | 8.0 |
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
可以看到T(2N)/T(N) \~ 2<sup>3</sup>,因此可以确定 T(N) \~ aN<sup>3</sup>logN。
2019-03-08 23:06:28 +08:00
```java
2019-03-27 20:57:37 +08:00
public class RatioTest {
public static void main(String[] args) {
int N = 500;
int loopTimes = 7;
double preTime = -1;
while (loopTimes-- > 0) {
int[] nums = new int[N];
StopWatch.start();
ThreeSum threeSum = new ThreeSumSlow();
int cnt = threeSum.count(nums);
System.out.println(cnt);
double elapsedTime = StopWatch.elapsedTime();
double ratio = preTime == -1 ? 0 : elapsedTime / preTime;
System.out.println(N + " " + elapsedTime + " " + ratio);
preTime = elapsedTime;
N *= 2;
}
}
2019-03-08 23:06:28 +08:00
}
```
```java
2019-03-27 20:57:37 +08:00
public class StopWatch {
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
private static long start;
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
public static void start() {
start = System.currentTimeMillis();
}
2019-03-08 23:06:28 +08:00
2019-03-27 20:57:37 +08:00
public static double elapsedTime() {
long now = System.currentTimeMillis();
return (now - start) / 1000.0;
}
2019-03-08 23:06:28 +08:00
}
```
2019-03-27 20:57:37 +08:00
2019-06-10 11:23:18 +08:00
# 微信公众号
微信公众号 CyC2018 提供了该项目的离线阅读版本,后台回复 "下载" 即可领取。也提供了一份技术面试复习大纲,不仅系统整理了面试知识点,而且标注了各个知识点的重要程度,从而帮你理清多而杂的面试知识点,后台回复 "大纲" 即可领取。我基本是按照这个大纲来进行复习的,对我拿到了 BAT 头条等 Offer 起到很大的帮助。你们完全可以和我一样根据大纲上列的知识点来进行复习,就不用看很多不重要的内容,也可以知道哪些内容很重要从而多安排一些复习时间。
2019-06-09 22:59:34 +08:00
<img width="580px" src="https://cs-notes-1256109796.cos.ap-guangzhou.myqcloud.com/other/公众号海报2.png"></img>