排序算法第一篇-排序算法介绍

2021-06-21 1269

排序算法第一篇-排序算法介绍

在面试中，现在无论大小公司都会有算法的。其中排序算法也是一种很常见的面试题。比如冒泡，快排等。这些，排序算法自己看了一次又一次，可是过一段时间，又忘掉了。所以，这次就把算法是怎么推导出来的，详细记录下来。看看这次多久还会忘记。

本文主要介绍排序算法的分类、时间复杂度、空间复杂。为了后面的学习做准备的。

通过本文学习，将收获到：排序算法分几类？什么是算法的时间复杂度？是怎么算出来的？什么是算法的空间复杂度？常见的时间复杂度比较。

如果这些您都已经知道了，可以不用耽误时间看了。

约定：

文中的n2表示的是n的2次方(n²),n^2也是表示n的2次方；

n3表示的是n的3次方；

n^k表示的是n的k次方；

long2n表示的是以2为底的对数。

本文出自：凯哥Java(微信：kaigejava)学习Java版数据结构与算法笔记。

一：介绍

排序又称排序算法(Sort Algorithm),排序是将一组数据，依据指定的顺序进行排序的过程。

二：分类

排序的分类分为两大类

2.1：内部排序

内部排序是指将需要处理的所有数据一次性都加载到内存中进行排序的。

如：冒泡、快排等这些算法都是内部排序的

2.2：外部排序

数据量过大，无法全部加载到内存中，需要借助于外部存储进行排序的。

如：数据库中数据8个G，内存只有4个G的这种。

2.3：参加分类如下图：

编辑

三：算法的时间复杂度

3.1：分类

衡量一个程序(算法)执行时间有两种方法

3.1.1：事后统计的方法

所谓的事后统计方法，顾名思义，就是程序(算法)已经写完了，运行后得到的结果。

这种方法虽然是可行的，但是有两个问题：

①：要想对设计的算法运行的性能进行评估，需要实际运行该程序(浪费时间)；

②：运行所得的时间统计严重依赖于机器的硬件、软件等环境因为。

这种方法有个严苛的要求：要在同一台机器在相同状态(软硬件)下运行，才能比较哪个算法更快。

3.1.2：事前估算的方法

通过分析某个算法的时间复杂度来判断哪个算法更优。

3.2：时间频度

概念：一个算法花费的时间与算法中语句执行的次数成正比。哪个算法中语句执行次数多，那么这个算法所花费的时间就多(这不废话吗)。

一个算法中语句执行次数称为语句频度或时间频度。记为：T(n).

(复杂的概念是，时间频度：一个算法执行所消耗的时间，从理论上是不能算出来的，想要具体数值，必须要将程序上机运行测试才能知道。但是我们不可能也没必要对每个算法都上机进行测试的，只需要知道哪个算法花费的时间多，哪个算法花费的时间少就可以了。并且一个算法花费的时间与算法中语句执行的次数成正比的，哪个算法中语句执行次数多，那么这个程序花费的时间就多。一个算法中的语句执行次数称为语句频度或者时间频度，记为：T(n))

例如：我们知道的技术从1到100所有数字的和。这个就有两种算法。分别如下：

①：使用for循环，从1到100循环出来，然后累加出来。代码如下：

编辑

根据上面概念(注意对概念的理解,total和end这两行相对于for循环来说，可以忽略。后面我们还会详细讲解还会忽略哪些)，我们来看下这个算法的时间频度是多少呢？

在for循环中，实际需要执行101次(+1的原因是因为，在for循环的时候，需要做最后一次判断，才能推出。因此n个数的计算一共是n+1次操作)。所以其时间频度就是：T(n)=n+1;

我们再来看看第二种算法：

编辑

是不是很简单，只要一行代码就执行完成了。所以第二种算法的T(n)=1了。是不是很快呢？

时间频度是不是一眼就看出来了？是不是不用在代码运行下来比较运行时间了？

(ps：从上面简单的从1到100求和算法中，我们是不是感受到算法的魅力了？感受到编程之美了？)

3.3：时间复杂度

在上面3.2中提到的时间频度中,n称为问题的规模，当n不断变化的时候，时间频度T(n)也会不断变化。但是有时我们想知道它在变化的时候呈现什么样的规律呢？为此，我们引入了时间复杂度概念。

一般情况下，算法中基本操作重复执行的次数是问题规模n的某个函数，用T(n)表示。若有某个辅助函数f(n)，是的当n趋近于无穷大的时候，T(n)/f(n)的极限值为不等于零的藏书，则称为f(n)是T(n)的同数量级函数。记作T(n)=O(f(n)),称O(f(n))为算法的渐进的时间复杂度。简称时间复杂度。这就是大O法。

在计算时间复杂度的时候，我们会忽略以下几个数据值

3.3.1：忽略常数项

比如上面，我们计算1到100的第一种算法中，有两行int total=0；和 int end = 100;这两行代码，这个数值是2，我们一般计算时间复杂度的时候，会忽略这个常数项的。为什么呢？请看下面四个函数，随着n的增大而增大运行时间。

T(n) = 2n+20

T(n) = 2*n

T(n)=3n+10

T(n)=3*n

请看下图随这n的增大锁呈现的规律：

编辑

我们来看看，把这些数据使用折线图展示：

编辑

图例说明：上面两个是3*n及3n+10的，下面两个是2n及2n+10的

从上面两个图表中我们可以得到以下结论：

①：2n+20和2*n随着n的增加，执行曲线无限接近(折线图中下面两个)，常量值20可以忽略了

②：3n+10和3*n随着n的增加，执行曲线无限接近(折线图中上面两个)，常量值10可以忽略了

所以，综上所述，在计算程序(算法)时间复杂度的时候,常量值是可以忽略的

3.3.2：忽略低次项

请看下面四个函数，随着n的增大又会呈现什么规律吗？

T(n)=2n^2+3n+10

T(n)=2n^2

T(n)=n^2+5n+20

T(n)=n^2

说明：n^2表示n的2次方

我们来看看随着n的增加，运行所消耗的时间。如下图：

编辑

把上面数据，用折线图表示，如下图：

编辑

图例说明：上面两个是2n^2及2n^2+3n+10，下面两个是n^2及 n^2+5n+20

从上面两个图中我们可以得到如下结论：

①：2n^2+3n+10和2n^2随着n的增大，执行曲线无限接近，可以忽略低次项及常量项：3n+10

②：n^2+5n+20和n^2随着n的增大，执行曲线无限接近，可以忽略低次项及常量项：5n+20

综上所述，我们可以得到结论：在计算程序(算法)时间复杂度的时候，低次项(3n=3*n^1比n^2项数少)是可以忽略的

3.3.3：忽略系数

我们在来看看下面四个函数，看看它们随着n的增大呈现出什么样的规律

T(n)=3n^2+2n

T(n)=5n^2+7n

T(n)=n^3+5n

T(n)=6n^3+4n

随着n的增加，运行时间所消耗耗时如下图：

编辑

折线图如下：

编辑

从上图可以得到如下：

①：随着n值变大，5n^2+7n和3n^2+2n，执行曲线重合，说明这种情况下，系数5和3可以忽略；

②：n^3+5n和6n^3+4n，执行曲线分离，说明多少次防是关键

3.3.4：总结：

计算时间复杂度的时候忽略常数项、忽略低次项、忽略系数
T(n)不同，但时间复杂度可能相同。

如：T(n)=n2+7n+6与T(n)=3n^2+2n+2它们的T(n)不同，但时间复杂相同，都为O(n^2).

计算时间复杂度的方法
- 用常数1代替运行时间中的所有加法常数T(n)=n^2+7n+6 =>T(n)=n^2+7n+1
- 修改后的运行次数函数中，只保留最高阶项T(n)=n^2+7n+1 => T（n）=n^2
- 去除最高阶项的系数T(n)=n^2 =>T(n)=n^2 => O(n^2)

3.4：常见的时间复杂度

常数阶O(1)
对数阶O(log2n)
线性阶O(n)
线性对数阶O(nlog2n)
平方阶O(n^2)
立方阶O(n^3)
K次方阶(n^k)
指数阶O(2^n)

各个时间复杂度复杂度折线图如下图：

编辑

总结：

常见算法时间复杂度由小到大依次为：

O(1)<O(log2n)<O(n)<O(nlong2n)<O(n^2)<O(n^3)<O(n^K)<O（2^n）。随着问题规模n的不断增大，上述时间复杂度不断增大,算法的执行效率也越低；

从上图折线图中，我们可以看出，程序(算法)尽可能的避免使用指数阶段的算法。

3.5：常见算法时间复杂度举例

3.5.1：常数阶O(1)

无论代码执行多少行，只要是没有循环等复杂结构，那这个代码的时间复杂度就是O(1)

(计算时间复杂度的时候，忽略常数项)

代码demo:

编辑

上述代码在执行的时候，消耗的时间并不是随着某个变量的增长而增长，那么无论这类代码有多长，即使有有几万几十万行，都是可以用O(1)来表示它的时间复杂度。

3.5.2：对数阶O(log2n)

代码敬上：

编辑

说明：

在while循环里面，没吃都是将i*2的。n的值是固定的，所以在i乘完之后，i距离n就越来越近了。假设循环x次之后，i就大于n了，此时这个循环就退出了。也就是说2的x次方等于n了。那么x=log2n。也就是说当循环了log2n次以后，代码就结束了。因此这个代码的时间复杂度就是

O(log2n)。

O(log2n)的这个2时间上是随着代码变化的。如果i = i*3，那么时间复杂度就是O(log3n)

回顾下log的理解(这是初中知识点)：

如果a的x次方等于N（a>0,且a≠1），那么熟x就叫做以a为底的对数(logarithm)，记作x=logaN.

其中，a叫做对数的底数，N叫做真数，x叫做“以a为底N的对数”。

3.5.3：线性阶O(n)

代码如下：

编辑

说明：

这段代码，for循环里面的代码会执行n次。因此它所消耗的时间随着n的变化而变化的，因此这类代码都是可以用O(n)来表示它的时间复杂度。

3.5.4：线性对数阶O(nlogn)

代码如下：

编辑

说明：

线性对数阶O(nlogN)其实非常容易理解的。将时间复杂度为O(logn)的代码循环了N次的话，那么它的时间复杂度就是n*O(logn)，也就是O(nlogN)

3.5.5：平方阶O(n2)

代码：

编辑

说明：

平方阶O(n2)就容易理解了。如果把O(n)的代码再嵌套循环一遍，它的时间复杂度就是O(n2)，

上图中的代码起始就是嵌套了2层n循环，它的时间复杂度就是O(n*n)，即时O(n2)。如果将其中一层循环的n修改成m，那么它的时间复杂度就变成了O(m*n).

3.5.6：立方阶O(n3)、K次方阶O(n^k)

说明：参考上面的O(n2)去理解就好了。O(n3)起始就相当于是三层n循环了。其他的一次类推。

3.6：平均时间复杂度和最坏时间复杂度

平均时间复杂度：

是指所有可能的输入实例均以概率出现的情况下，该算法的运行时间

最坏时间复杂度：

是指在最坏情况下的时间复杂度称为最坏时间复杂度。一般讨论时间复杂度均是最坏情况下的时间复杂度。

这样做的原因：最坏情况下的时间复杂度是算法在任何输入实例上运行时间的界限。这就保证了算法的运行时间不会比最坏情况更长了。

平均时间复杂度和最坏时间复杂度是否一致，和算法有关。具体如下图：

排序算法	平均时间	最坏情况	稳定度	额外空间	备注
冒泡	O(n^2)	O(n^2)	稳定	O(1)	n小的时候比较好
交换	O(n^2)	O(n^2)	不稳定	O(1)	n小的时候比较好
选择	O(n^2)	O(n^2)	不稳定	O(1)	n小的时候比较好
插入	O(n^2)	O(n^2)	稳定	O(1)	大部分已经排序时比较好
基数	O(logRB)	O(logRB)	稳定	O(n)	B是真书(0-9) R是基数(个十百)
Shell(希尔)	O(nlogn)	O(n^s) 1<s<2	不稳定	O(1)	s是所选分组
快排	O(nlogn)	O(n^2)	不稳定	O(nlogn)	n大时候较好
归并	O(nlogn)	O(nlogn)	稳定	O(1)	n大时候较好
堆	O(nlogn)	O(nlogn)	不稳定	O(1)	n大时候较好

四：算法的空间复杂度

空间复杂度介绍

类似于时间复杂度的讨论。一个算法的空间复杂度(Space Complexity)定义为该算法锁消耗的存储空间，它也是问题规模n的函数；
空间复杂度是对一个算法在运行过程中临时占用存储空间大小的量度。有的算法需要占用临时工作单元数与解决问题的规模n有关。它们随着n的增大而增大，当n较大的时候，将占用较多的存储单元(存储空间)。例如：在快排(快速排序)和归并排序算法就属于这种情况。
在做算法分析的时候，主要讨论的是时间的复杂度。因为从用户的使用体验上来看，更看重的是程序执行的速度的快慢。一般缓存产品(比如Redis)和技术排序算法本质就是拿空间换时间的。

下节预告：

下节我们将讲讲冒泡排序和选择排序。使用的是图解+代码一步一步推导出来演示的。欢迎大家一起学习。

微信关注我们

原文链接：https://blog.roncoo.com/article/1406797281697861634

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Apache ShardingSphere 5.0.0-beta 重要特性介绍

Apache ShardingSphere 5.0.0-beta 已完成基本构建，预计本周内正式发行。下面介绍此版本将带来的重要变化。 1. 亮点功能全新定义的分布式数据库操作语言—DistSQL SQL 是一种用于存取数据以及查询、更新和管理关系数据库系统的数据库查询和程序设计语言。1986 年 10 月，美国国家标准学会将 SQL 作为关系式数据库管理系统的标准语言。现有通用数据库系统在其实践过程中都对 SQL 规范作了部分改写和扩充，具有更高灵活性和更丰富的功能，使其适用于自身的数据库系统。 DistSQL（Distributed SQL）是 Apache ShardingSphere 提出的，特有的一种内置 SQL 语言，能够提供标准 SQL 之外的增量功能操作能力。DistSQL 让用户可以像操作数据库一样操作 ShardingSphere，使其从面向开发人员的框架和中间件转变为面向运维人员的基础设施产品。在 ShardingSphere 中， DistSQL 目前主要划分为 RDL、RQL 和 SCTL 三种具体类型： RDL（Resource & Rule ...

2021-06-24

956

JVM学习第一篇思考：一个Java代码是怎么运行起来的-上篇作为一个使用Java语言开发的程序员，我们都知道，要想运行Java程序至少需要安装JRE(安装JDK也没问题)。我们也知道我们Java程序员编写的程序代码文件是*.java的，而JRE运行的是*.class的文件。所以，我们需要将java文件编译成class文件然后才可以。那么，你有没有想过，一个java文件是怎么运行起来的呢？中间都经历了哪些环节呢？我们都知道JVM是Java虚拟机，那么，有没有思考过JVM的内存模型是什么呢？我们new出来的对象，声明不同类型的变量又是存放在JVM哪个位置呢？本文是凯哥(凯哥Java:kaigejava)学习JVM系列教程第一篇。欢迎大家一起学习本文目标：通过本文学习后，希望大家对JVM类加载过程有个了解。编辑上面程序很简单。那么，有没有想过上面代码怎么运行的呢？选中main方法，然后ruan as...，编译后，运行输出。这个流程我想大家都很熟悉的。那么对应的流程应该是什么样的呢？如下图：编辑在Run的时候，先将.java文件编译成.class文件。然后，在通过类加载器，...

2021-06-24

1249

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

排序算法第一篇-排序算法介绍

一：介绍

二：分类

2.1：内部排序

2.2：外部排序

2.3：参加分类如下图：

三：算法的时间复杂度

3.1：分类

3.1.1：事后统计的方法

3.1.2：事前估算的方法

3.2：时间频度

3.3：时间复杂度

3.3.1：忽略常数项

3.3.2：忽略低次项

3.3.3：忽略系数

3.3.4：总结：

3.4：常见的时间复杂度

3.5：常见算法时间复杂度举例

3.5.1：常数阶O(1)

3.5.2：对数阶O(log2n)

3.5.3：线性阶O(n)

3.5.4：线性对数阶O(nlogn)

3.5.5：平方阶O(n2)

3.5.6：立方阶O(n3)、K次方阶O(n^k)

3.6：平均时间复杂度和最坏时间复杂度

四：算法的空间复杂度

Apache ShardingSphere 5.0.0-beta 重要特性介绍

JVM学习第一篇思考：一个Java代码是怎么运行起来的-上篇

相关文章

发表评论

资源下载

优质分享App

Mario

腾讯云软件源

Sublime Text

欢迎您来访！