《算法的时间复杂度和空间复杂度.docx》由会员分享,可在线阅读,更多相关《算法的时间复杂度和空间复杂度.docx(7页珍藏版)》请在课桌文档上搜索。
1、算法的时间简单度和空间简单度总结通常,对于一个给定的算法,我们要做两项分析。第一是从数学上证明算法的正确性,这一步主要用到形式化证明的方法及相关推理模式,如循环不变式、数学归纳法等。而在证明算法是正确的基础上,其次部就是分析算法的时间简单度。算法的时间简单度反映了程序执行时间随输入规模增长而增长的量级,在很大程度上能很好反映出算法的优劣与否。因此,作为程序员,把握基本的算法时间简单度分析方法是很有必要的。算法执行时间需通过依据该算法编制的程序在计算机上运行时所消耗的时间来度量。而度量一个程序的执行时间通常有两种方法。一、事后统计的方法这种方法可行,但不是一个好的方法。该方法有两个缺陷:一是要想
2、对设计的算法的运行性能进行评测,必需先依据算法编制相应的程序并实际运行;二是所得时间的统计量依靠于计算机的硬件、软件等环境因素,有时简洁掩盖算法本身的优势。二、事前分析估算的方法因事后统计方法更多的依靠于计算机的硬件、软件等环境因素,有时简洁掩盖算法本身的优劣。因此人们经常采纳事前分析估算的方法。在编写程序前,依据统计方法而算法进行估算。一个用高级语言编写的程序在计算机上运行时所消耗的时间取决于下列因素:(1).算法采纳的策略、方法;(2).编译产生的代码质量;(3).问题的输入规模:(4).机器执行指令的速度。一个算法是由掌握结构(挨次、分支和循环3种)和原操作(指固有数据类型的操作)构成的
3、,则算法时间取决于两者的综合效果。为了便于比较同一个问题的不同算法,通常的做法是,从算法中选取一种对于所争论的问题(或算法类型)来说是基本操作的原操作,以该基本操作的重复执行的次数作为算法的时间量度。1、时间简单度(1)时间频度一个算法执行所耗费的时间,从理论上是不能算出来的,必需上机运行测试才能知道。但我们不行能也没有必要对每个算法都上机测试,只需知道哪个算法花费的时间多,哪个算法花费的时间少就可以了。并且一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。一个算法中的语句执行次数称为语句频度或时间频度。记为T(n)。(2)时间简单度在刚才提到的时间频
4、度中,n称为问题的规模,当n不断变化时,时间频度T(n)也会不断变化。但有时我们想知道它变化时呈现什么规律。为此,我们引入时间简单度概念。一般状况下,算法中基本操作重复执行的次数是问题规模n的某个函数,用T(n)表示,若有某个帮助函数f(n),使得当n趋近于无穷大时,T(n)f(n)的极限值为不等于零的常数,则称f(n)是T(n)的同数量级函数。记作T(n)=O(f(n),称O(f(n)为算法的渐进时间简单度,简称时间简单度。此外,上面公式中用到的LandaU符号其实是由德国数论学家保罗巴赫曼(PaUlBachmann)在其1892年的著作解析数论首先引入,由另一位德国数论学家艾德蒙朗道(Ed
5、mUndLandaU)推广。LandaU符号的作用在于用简洁的函数来描述简单函数行为,给出一个上或下(确)界。在计算算法简单度时一般只用到大O符号,Landau符号体系中的小。符号、。符号等等比较不常用。这里的0,最初是用大写希腊字母,但现在都用大写英语字母O;小。符号也是用小写英语字母0,符号则维持大写希腊字母0。T(n)=0(f(n)表示存在一个常数C,使得在当n趋于正无穷时总有Tm)C*f(n)。简洁来说,就是T(n)在n趋于正无穷时最大也就跟f(n)差不多大。也就是说当n趋于正无穷时T(n)的上界是CT(n)。其虽然对f(n)没有规定,但是一般都是取尽可能简洁的函数。例如,O(2n2+
6、n+1)=0(3n2+n+3)=0(7n2+n)=0(n2),一般都只用0(n2)表示就可以了。留意到大。符号里隐蔽着一个常数C,所以f(n)里一般不加系数。假如把T(Ci)当做一棵树,那么O(f(n)所表达的就是树干,只关怀其中的主干,其他的细枝末节全都抛弃不管。在各种不同算法中,若算法中语句执行次数为一个常数,则时间简单度为0(1),此外,在时间频度不相同时,时间简单度有可能相同,如T(n)=n2+3n+4与T(n)=4n2+2n+1它们的频度不同,但时间简单度相同,都为0(n2).按数量级递增排列,常见的时间简单度有:常数阶0(1),对数阶O(IOg2项线性阶O(n),线性对数阶O(nl
7、og2),平方阶0(n2),立方阶0(n3),.,k次方阶0(nk),指数阶0(7)。随着问题规模n的不断增大,上述时间简单度不断增大,算法的执行效率越低。从图中可见,我们应当尽可能选用多项式阶OG)的算法,而不盼望用指数阶的算法。常见的算法时间简单度由小到大依次为:。Vo(IOg27)VO(n)VO(nlog2Z7)VO(n2)O(3).O(2n)O(n!)一般状况下,对一个问题(或一类算法)只需选择一种基本操作来争论算法的时间简单度即可,有时也需要同时考虑几种基本操作,甚至可以对不同的操作给予不同的权值,以反映执行不同操作所需的相对时间,这种做法便于综合比较解决同一问题的两种完全不同的算法
8、。(3)求解算法的时间简单度的详细步骤是:找出算法中的基本语句;算法中执行次数最多的那条语句就是基本语句,通常是最内层循环的循环体。计算基本语句的执行次数的数量级;只需计算基本语句执行次数的数量级,这就意味着只要保证基本语句执行次数的函数中的最高次累正确即可,可以忽视全部低次累和最高次第的系数。这样能够简化算法分析,并且使留意力集中在最重要的一点上:增长率。用大O记号表示算法的时间性能。将基本语句执行次数的数量级放入大。记号中。假如算法中包含嵌套的循环,则基本语句通常是最内层的循环体,假如算法中包含并列的循环,则将并列循环的时间简单度相加。例如:javaviewplaincopy1. for(
9、i=l;i=n;i+)2. x+j3. for(i=l;i=n;i+)4. for(j=l;j=n;j+)5.x+;第一个for循环的时间简单度为0(n),其次个for循环的时间简单度为0(n2),则整个算法的时间简单度为O(n+n2)=O(n2).O(I)表示基本语句的执行次数是一个常数,一般来说,只要算法中不存在循环语句,其时间简单度就是0(1)。其中O(IOg2办0(n)、O(nlog2办0(n2)和O(n3)称为多项式时间,而0(7)和0(n!)称为指数时间,计算机科学家普遍认为前者(即多项式时间简单度的算法)是有效算法,把这类问题称为P(POIynOmiaI,多项式)类问题,而把后者
10、(即指数时间简单度的算法)称为NP(Non-DeterministicPolynomial,非确定多项式)问题。一般来说多项式级的简单度是可以接受的,许多问题都有多项式级的解也就是说,这样的问题,对于个规模是n的输入,在Mk的时间内得到结果,称为P问题。有些问题要简单些,没有多项式时间的解,但是可以在多项式时间里验证某个猜想是不是正确。比如问4294967297是不是质数?假如要直接入手的话,那么要把小于4294967297的平方根的全部素数都拿出来,看看能不能整除。还好欧拉告知我们,这个数等于641和6700417的乘积,不是素数,很好验证的,顺便麻烦转告费马他的猜想不成立。大数分解、Ham
11、ilton回路之类的问题,都是可以多项式时间内验证一个“解”是否正确,这类问题叫做NP问题。(4)在计算算法时间简单度时有以下几个倚洁的程序分析法则:(1) .对于一些简洁的输入输出语句或赋值语句,近似认为需要O(I)时间(2) .对于挨次结构,需要依次执行一系列语句所用的时间可采纳大0下“求和法则”求和法则:是指若算法的2个部分时间简单度分别为T1(n)=0(f(n)和T2(n)=0(g(n),则T1(n)+T2(n)=0(max(f(n),g(n)特殊地,若T1(m)=0(f(m),T2(n)=O(g(n),WJT1(m)+T2(n)=O(f(m)+g(n)(3) .对于选择结构,如if语
12、句,它的主要时间耗费是在执行then字句或else字句所用的时间,需留意的是检验条件也需要C)(I)时间.对于循环结构,循环语句的运行时间主要体现在多次迭代中执行循环体以及检验循环条件的时间耗费,一般可用大0下乘法法则乘法法则:是指若算法的2个部分时间简单度分别为T1(n)=O(f(n)和T2(n)=O(g(n),则TT2=O(f(n)*g(n)(5).对于简单的算法,可以将它分成几个简洁估算的部分,然后采用求和法则和乘法法则技术整个算法的时间简单度此外还有以下2个运算法则:(1)若g(n)=O(f(n),则O(f(n)+O(g(n)O(f(n);(2)O(Cf(n)=O(f(n),其中C是一
13、个正常数(5)下面分别对几个常见的时间简单度进行示例说明:、0(1)Temp=i;i=j;j=temp;以上三条单个语句的频度均为1,该程序段的执行时间是一个与问题规模n无关的常数。算法的时间简单度为常数阶,记作T(n)=0(1)留意:假如算法的执行时间不随着问题规模n的增加而增长,即使算法中有上千条语句,其执行时间也不过是一个较大的常数。此类算法的时间简单度是0(1).、0(n2)2.1. 交换i和j的内容javaviewplaincopy1. sum=:(一次)2. for(i=l;i=n;i+)(n+l次)3. for(j=l;j=n;j+)(n2次)4. sum+:(n2次)解:由于。
14、(2n2+n+1)=n2(。即:去低阶项,去掉常数项,去掉高阶项的常参得到),所以T(n)=0(n2);2.2.javaviewplaincopy1. for(i=l;in;i+)2. 3. y=y+l;4. for(j=0;j=(2*n);j+)5. x+;6. )解:语句1的频度是n-1语句2的频度是(n-1)*(2n+1)=2n2n1f(n)=2n2-1+(n-1)=2n2-2;又(2n2-2)=2该程序的时间简单度T(n)=O(n2).一般状况卜.,对步进循环语句只需考虑循环体中语句的执行次数,忽视该语句中步长加1、终值判别、掌握转移等成分,当有若干个循环语句时,算法的时间简单度是由嵌
15、套层数最多的循环语句中最内层语句的频度f(n)打算的。、0(n)javaviewplaincopy1. a=0;2. b=l;3. for(i=lji=nji+)4. 5. s=a+b;6. b=a;7. a=s;8. 解:语句1的频度:2,语句2的频度:n,语句3的频度:n-1,语句4的频度:n-1,语句5的频度:n-1,T(n)=2+n+3(n-1)=4n-1=0(n).(4)、O(log2)javaviewplaincopy1. i=l;2. while(i=n)3. i=i*2;解:语句1的频度是1,设语句2的频度是f(n),则:2Af(n)=n;f(n)=log2n取最大值f(n)=
16、log2,T(n)=O(log2n)、0(n3)javaviewplaincopy1.for(i=0;in;i+)23. for(j=0;ji;j+)4. 5. for(k=0;kj;k+)6. x=x+2;7. 8. )解:当i=m,j=k的时候,内层循环的次数为k当i=m时,j可以取0,1,.,m-1,所以这里最内循环共进行了0+1+.+m-1=(m-1)m2次所以,i从0取到n,则循环共进行了:0+(11)*12+.+(n-1)n2=n(n+1)(n1)6所以时间简单度为O(n3)(5)常用的算法的时间简单度和空间简单度鄂序法平均时间最差情形稳定度额外空间备注冒泡0(n2)0(6稳定0(
17、1)册时较好I交换0(n2)0(n2)不稳定0(1)n小时较好至择0(/0(n2)不稳定O(I)n小时较好插入I0(n2)OGd|稳定O(I)_大部分己排序时较好基数OQogRB)OQoB)稳定0(n)B是真数(0面R是基数(个十百)ShdlO(nlogn)0(ns)ls2不稳定O(I)_逐所选分组悌丁O(nlogn)。的不稔定O(nlogn)n大时较好归并O(nlogn)O(nlogn)稳定0一n大时较好堆O(nlogn)O(nlogn)不稳定0(1)“大时较好一个阅历规章:其中C是一个常量,假如一个算法的简单度为C.Iog2,n、n*log2,那么这个算法时间效率比较高,假如是/,3n,n
18、!,那么略微大一些的n就会令这个算法不能动了,居于中间的几个则差强人意。算法时间简单度分析是一个很重要的问题,任何一个程序员都应当娴熟把握其概念和基本方法,而且要擅长从数学层面上探寻其本质,才能精确理解其内涵。2、算法的空间简单度类似于时间简单度的争论,一个算法的空间简单度(SPaCeCOmPIeX计y)S(n)定义为该算法所耗费的存储空间,它也是问题规模n的函数。渐近空间简单度也经常简称为空间简单度。空间简单度(SPaCeCOrnPIeXity)是对一个算法在运行过程中临时占用存储空间大小的量度。一个算法在计算机存储器上所占用的存储空间,包括存储算法本身所占用的存储空间,算法的输入输出数据所
19、占用的存储空间和算法在运行过程中临时占用的存储空间这三个方面。算法的输入输出数据所占用的存储空间是由要解决的问题打算的,是通过参数表由调用函数传递而来的,它不随本算法的不同而转变。存储算法本身所占用的存储空间与算法书写的长短成正比,要压缩这方面的存储空间,就必需编写出较短的算法。算法在运行过程中临时占用的存储空间随算法的不同而异,有的算法只需要占用少量的临时工作单元,而且不随问题规模的大小而转变,我们称这种算法是“就地进行的,是节约存储的算法,如这一节介绍过的几个算法都是如此;有的算法需要占用的临时工作单元数与解决问题的规模n有关,它随着n的增大而增大,当n较大时,将占用较多的存储单元,例如将在第九章介绍的快速排序和归并排序算法就属于这种状况。如当一个算法的空间简单度为一个常量,即不随被处理数据量n的大小而转变时,可表示为。(1);当一个算法的空间简单度与以2为底的n的对数成正比时,可表示为O(IOg2n);当一个算法的空I司简单度与n成线性比例关系时,可表示为0(n)若形参为数组,则只需要为它安排一个存储由实参传送来的一个地址指针的空间,即一个机器字长空间;若形参为引用方式,则也只需要为其安排存储一个地址的空间,用它来存储对应实参变量的地址,以便由系统自动引用实参变量。