龙空技术网

算法-001-时间复杂度和空间复杂度分析

我辈中人 50

前言:

眼前我们对“分类算法的时间复杂度”都比较看重,我们都想要学习一些“分类算法的时间复杂度”的相关内容。那么小编在网摘上收集了一些关于“分类算法的时间复杂度””的相关知识,希望兄弟们能喜欢,同学们一起来了解一下吧!

从广义上讲,数据结构就是指一组数据的存储结构。算法就是操作数据的一组方法。

从狭义上讲,数据结构指:数组、链表、栈、队列、散列表、二叉树、堆、跳表、图、 Trie 树。算法:递归、排序、二分查找、搜索、哈希算法、贪心算法、分治算法、回溯算法、动态规划、字符串匹配算法。

数据结构和算法是相辅相成的。数据结构是为算法服务的,算法要作用在特定的数据结构之上。

<必须学会>

10 个数据结构:数组、链表、栈、队列、散列表、二叉树、堆、跳表、图、 Trie 树;

10 个基本算法:递归、排序、二分查找、搜索、哈希算法、贪心算法、分治算法、回溯算法、动态规划、字符串匹配算法。

数据结构和算法本身解决的是“快”和“省”的问题,即如何让代码运行得更快,如何让代码更省存储空间。

1 时间复杂度分析

假设每行代码执行的时间都一样,我们可以计算出执行时间 T(n) 与每行代码的执行次数成正比。

1 int cal(int n) {2 		int sum = 0;3 		int i = 1;4 		for (; i <= n; ++i) {5 				sum = sum + i;6 		}7 		return sum;8 }

T(n)=2n+2

第 2 、 3 行代码分别需要 1 个 unit_time 的执行时间,第 4 、 5 行都运行了 n 遍,所以需要2n*unit_time 的执行时间,所以这段代码总的执行时间就是 (2n+2)*unit_time 。可以看出来,所有代码的执行时间 T(n) 与每行代码的执行次数成正比。

1 int cal(int n) {2 		int sum = 0;3 		int i = 1;4 		int j = 1;5 		for (; i <= n; ++i) {6 				j = 1;7 				for (; j <= n; ++j) {8						 sum = sum + i * j;9 				}10 		}11 }

T(n)=3+2n+2n^2

第 2 、 3 、 4 行代码,每行都需要 1 个 unit_time 的执行时间,第 5 、 6 行代码循环执行了 n 遍,需要2n * unit_time 的执行时间,第 7 、 8 行代码循环执行了 n 遍,所以需要 2n * unit_time 的执行时间。所以,整段代码总的执行时间 T(n) = (2n +2n+3)*unit_time 。

执行时间 T(n) 与每行代码的执行次数成正比。T(n)=O(f(n)), n表示数据规模大小,f(n) 表示每行代码执行的次数总和。因为这是一个公式,所以用 f(n) 来表示。公式中的 O,表示代码的执行时间 T(n) 与 f(n) 表达式成正比。

所以,第一个例子中的 T(n) = O(2n+2) ,第二个例子中的 T(n) = O(2n +2n+3) 。这就是大 O 时间复杂度表示法。大 O 时间复杂度实际上并不具体表示代码真正的执行时间,而是表示代码执行时间随数据规模增长的变化趋势,所以,也叫作渐进时间复杂度( asymptotic time complexity ),简称时间复杂度。

当 n 很大时,你可以把它想象成 10000 、 100000 。而公式中的低阶、常量、系数三部分并不左右增长趋势,所以都可以忽略。我们只需要记录一个最大量级就可以了,如果用大 O 表示法表示刚讲的那两段代码的时间复杂度,就可以记为: T(n) = O(n) ; T(n) = O(n ^2) 。

时间复杂度分析技巧

1. 只关注循环执行次数最多的一段代码

大 O 这种复杂度表示方法只是表示一种变化趋势。我们通常会忽略掉公式中的常量、低阶、系数,只需要记录一个最大阶的量级就可以了。所以,我们在分析一个算法、一段代码的时间复杂度的时候,也只关注循环执行次数最多的那一段代码就可以了。这段核心代码执行次数的 n的量级,就是整段要分析代码的时间复杂度。

2. 加法法则:总复杂度等于量级最大的那段代码的复杂度

3. 乘法法则:嵌套代码的复杂度等于嵌套内外代码复杂度的乘积

也就是说,假设 T1(n) = O(n) , T2(n) = O(n^2 ) ,则 T1(n) * T2(n) = O(n^3 ) 。

复杂度量级

常量阶O(1)对数阶O(logn)线性阶O(n)线性对数阶O(nlogn)平方阶O(n^2) 立方阶O(n^3) k次方阶O(n^k)指数阶O(2n)阶乘阶O(n!)

多项式量级和非多项式量级。其中,非多项式量级只有两个: O(2^n ) 和 O(n!) 。当数据规模 n 越来越大时,非多项式量级算法的执行时间会急剧增加,求解问题的执行时间会无限增长。所以,非多项式时间复杂度的算法其实是非常低效的算法。

扩展1

能用多项式时间算法解决的问题被称为P问题( Polynomial)。我们把时间复杂度为非多项式量级的算法问题叫作 NP ( Non-Deterministic Polynomial ,非确定多项式)问题.

参考:

随着问题规模n的增长,计算量的增长速度是非常恐怖的。这类问题被称为NP问题(Non-deterministic Polynomial),意思是“不确定是否能用多项式时间解决”。有些科学家认为,所有的NP问题终究都可以在多项式时间内解决,只是我们暂时还没有找到方法;也有些科学家认为,某些NP问题永远无法在多项式时间内解决。在NP问题之间,也可以存在归约关系。我们把众多的NP问题层层归约,必定会得到一个或多个“终极问题”,这些归约的终点就是所谓的NPC问题(NP-complete),也可以翻译成PC完全问题。上面所讲的旅行商问题,被科学家证明属于NPC问题。

旅行商问题所描述的是这样一个场景:有一个商品推销员,要去若干个城市推销商品。该推销员从一个城市出发,需要经过所有城市后,回到出发地。每个城市之间都有道路连通,且距离各不相同,推销员应该如何选择路线,使得总行程最短呢?

扩展2

对数我们可能忘记了,这里重新记一下

计算下面代码的时间复杂度?

1 i=1;2 while (i <= n) {3 i = i * 2;4 }

可以得出第2行代码,2x = n , x 就是执行次数 , x=log2n , 所以这段代码时间复杂度为O(log2n) = O(logn * C) C 表示系数,去掉后就是O(logn)

2 空间复杂度分析

时间复杂度的全称是渐进时间复杂度,表示算法的执行时间与数据规模之间的增长关系。类比一下,空间复杂度全称就是渐进空间复杂度( asymptotic space complexity ),表示算法的存储空间与数据规模之间的增长关系。

void print(int n) { 		int i = 0; 		int[] a = new int[n]; 		for (i; i <n; ++i) { 				a[i] = i * i; 		} 		for (i = n-1; i >= 0; --i) { 				print out a[i] 		}}

跟时间复杂度分析一样,我们可以看到,第 2 行代码中,我们申请了一个空间存储变量 i ,但是它是常量阶的,跟数据规模 n 没有关系,所以我们可以忽略。第 3 行申请了一个大小为 n 的 int 类型数组,除此之外,剩下的代码都没有占用更多的空间,所以整段代码的空间复杂度就是 O(n) 。

我们常见的空间复杂度就是 O(1) 、 O(n) 、 O(n ) ,像 O(logn) 、 O(nlogn) 这样的对数阶复杂度平时都用不到。而且,空间复杂度分析比时间复杂度分析要简单很多。所以,对于空间复杂度,掌握刚我说的这些内容已经足够了。

3 最好、最坏、平均、均摊时间复杂度分析

3.1 最好、最坏情况时间复杂度

// n 表示数组 array 的长度int find(int[] array, int n, int x) {				 int i = 0;				 int pos = -1; 					for (; i < n; ++i) { 								if (array[i] == x) {										 pos = i; 										break; 								} 					} 					return pos;}

因为,要查找的变量 x 可能出现在数组的任意位置。如果数组中第一个元素正好是要查找的变量x ,那就不需要继续遍历剩下的 n-1 个数据了,那时间复杂度就是 O(1) 。但如果数组中不存在变量x ,那我们就需要把整个数组都遍历一遍,时间复杂度就成了 O(n) 。所以,不同的情况下,这段代码的时间复杂度是不一样的。

为了表示代码在不同情况下的不同时间复杂度,我们需要引入三个概念:最好情况时间复杂度、最坏情况时间复杂度平均情况时间复杂度

平均时间复杂度又该怎么分析呢?我还是借助刚才查找变量 x 的例子来给你解释。每一种情况执行次数相加除以所有情况

要查找的变量 x 在数组中的位置,有 n+1 种情况:在数组的 0 ~ n-1 位置中和不在数组中。我们把每种情况下,查找需要遍历的元素个数累加起来,然后再除以 n+1 ,就可以得到需要遍历的元素个数的平均值,即:

平均时间复杂度=运行总次数 / n+1种情况

我们知道,时间复杂度的大 O 标记法中,可以省略掉系数、低阶、常量,所以,咱们把刚刚这个公式简化之后,得到的平均时间复杂度就是 O(n) 。

3.2 扩展-加权平均值计算

平均时间复杂度的全称应该叫加权平均时间复杂度或者期望时间复杂度。

3.3 均摊时间复杂度

// array 表示一个长度为 n 的数组// 代码中的 array.length 就等于 nint[] array = new int[n];int count = 0;void insert(int val) { if (count == array.length) { int sum = 0; for (int i = 0; i < array.length; ++i) { 			sum = sum + array[i]; } array[0] = sum; count = 1; } array[count] = val; ++count;}

假设数组的长度是 n ,根据数据插入的位置的不同,我们可以分为 n 种情况,每种情况的时间复杂度是 O(1) 。除此之外,还有一种 “ 额外 ” 的情况,就是在数组没有空闲空间时插入一个数据,这个时候的时间复杂度是 O(n) 。而且,这 n+1 种情况发生的概率一样,都是 1/(n+1) 。所以,根据加权平均的计算方法,我们求得的平均时间复杂度就是:

1/(n+1)+1/(n+1)+1/(n+1)+…+n/(n+1) = O(1)

我们还是继续看在数组中插入数据的这个例子。每一次 O(n) 的插入操作,都会跟着 n-1 次 O(1) 的插入操作,所以把耗时多的那次操作均摊到接下来的 n-1 次耗时少的操作上,均摊下来,这一组连续的操作的均摊时间复杂度就是 O(1) 。这就是均摊分析的大致思路。你都理解了吗?

最理想的情况下,数组中有空闲空间,我们只需要将数据插入到数组下标为 count 的位置就可以了,所以最好情况时间复杂度为 O(1) 。最坏的情况下,数组中没有空闲空间了,我们需要先做一次数组的遍历求和,然后再将数据插入,所以最坏情况时间复杂度为 O(n) 。

对一个数据结构进行一组连续操作中,大部分情况下时间复杂度都很低,只有个别情况下时间复杂度比较高,而且这些操作之间存在前后连贯的时序关系,这个时候,我们就可以将这一组操作放在一块儿分析,看是否能将较高时间复杂度那次操作的耗时,平摊到其他那些时间复杂度比较低的操作上。而且,在能够应用均摊时间复杂度分析的场合,一般均摊时间复杂度就等于最好情况时间复杂度。

标签: #分类算法的时间复杂度 #算法的时间复杂度是指___ #动态规划的时间复杂度和空间复杂度 #for嵌套if时间复杂度