算法与数据结构之查找和排序-低调大师

算法与数据结构之查找和排序

2019-03-01 963

必备知识点

时间复杂度

时间复杂度是用来估算算法运行速度的一种方式，通常采用大O表示法。
需要注意以下几点：

1、时间复杂度指的不是算法运行的时间，而是算法运行的增速。
2、时间复杂度是估算，一些非必要的会省略。
3、通常表示为O(n)，其中n为操作数。

快速判断时间复杂度的方法：

4、如果发现循环数减半，那么复杂度就是logn。
5、有几次循环就是n的几次方，不要在意具体循环几次。

递归

递归比较容易理解，有以下两个特征:

调用自身

有终止条件

#递归实现斐波那契数列
def fibnacci(n):
    if n=0 or  n=1:
        return 1
    else:
        return fibnacci(n-1)+fibnacci(n-2)  #这就是递归的精髓，把复杂重复的运算抽丝剥茧，每递归一次就简化一次

#斐波那契数列可以用更简单的方法实现
def fibnacci(n):
    a=b=c=1
    for i in range(2,n+1):
        c=a+b
        a=b
        b=c
    return c

#递归实现汉诺塔
def hanoi(n, A, B, C):
    if n > 0:
        hanoi(n-1, A, C, B)
        print('%s->%s' % (A, C))
        hanoi(n-1, B, A, C)

查找

简单查找

简单查找就是按顺序查找，直到查到指定元素，时间复杂度为O(n)。

二分查找

二分查找是对简单查找的一种优化，但是操作的只能是有序数组，就是通过中间值和需求数比较，通过比较结果来改变左右范围。
需要注意的是，不要通过切片改变列表，那样会加大空间复杂度。
尾递归的定义：尾递归就是所有递归语句都是在函数的最后出现的，正常是相当于循环的复杂度，但是python内没有优化。

def bin_search(li, val):
    low = 0
    high = len(li)-1
    while low <= high: # 只要候选区不空,继续循环
        mid = (low + high) // 2
        if li[mid] == val:
            return mid
        elif li[mid] < val:
            low = mid + 1
        else: # li[mid] > val
            high = mid - 1
    return -1

一个小技巧

主要思想为:新建列表作为索引,如果一个数的索引存在,说明这个数也存在.

lis = [2,4,6,7]
n = 3　　　　　　　　　　　 #查找n
lst = [0,0,0,0,0,0,0,0]   #创建一个元素均为0的列表,元素个数为lis中最大的数字加1
li = [0,0,1,0,1,0,1,1]  #把 lis 中对应的数字值变为1
if li[3] == 1:
    print("存在")
else:
    print("不存在")

排序

排序算法是有稳定和不稳定之分。
稳定的排序就是保证关键字相同的元素，排序之后相对位置不变，所谓关键字就是排序的凭借，对于数字来说就是大小。

排序算法的关键点是分为有序区和无序区两个区域。

冒泡排序

冒泡排序思路：

比较列表中相邻的两个元素，如果前面的比后边的大，那么交换这两个数。
这就会导致每一次的冒泡排序都会使有序区增加一个数，无序区减少一个数。
可以认为得到一个排序完毕的列表需要n次或者n-1次。n-1次是因为最后一次不需要进行冒泡了，当然n或n-1的得到的列表是一样的。
冒泡排序是稳定的。

#基础冒泡
def bubble_sort(li):
    for i in range(len(li)-1):  #第一层循环代表处于第几次冒泡
        for j in range(len(li)-i-1):    #第二层循环代表无序区的范围
            if li[j]>li[j+1]:
                li[j],li[j+1]=li[k+1],li[j]

如果考虑冒泡的最好情况，也就是冒泡没有进行到n次的时候就已经不出现j>j+1了，那么排序已经进行完毕。

def bubble_sort(li):
    for i in range(len(li)-1):  #第一层循环代表处于第几次冒泡
        a= 1
        for j in range(len(li)-i-1):    #第二层循环代表无序区的范围
            if li[j]>li[j+1]:
                li[j],li[j+1]=li[k+1],li[j]
                a=2
        if a=1:
            break

选择排序

选择排序的思路：

一次遍历找出最小值，放到第一个位置。
再一次遍历找最小值，在放到无序区第一个位置。
与冒泡一样是进行n或n-1次
每次都会让有序区增加一个元素，无序区减少一个元素。那么进行第i次的时候，它的第一位置的索引就是i。注意是无序区。
选择排序是不稳定的，跨索引交换(对比于相邻)就是不稳定的。

def select_sort(li):
    for i in range(len(li)-1):
        min_pos=i   #第几次，无序区的第一个位置的索引就为几减一
        for j in range(i+1,len(li)):
            if li[j]<li[min_pos]:   #min_pos会随着循环变换值
                min_pos=j
        li[i],li[min_pos]=li[min_pos],li[i]

插入排序

插入排序的思路：

在最开始有序区就把列表的第一个元素就放入有序区（这种有序是相对有序）。
在无序区第一个位置取出一个元素与有序区本来存在的元素进行比较，根据大小插入。
插入排序需要n-1次得出结果。
每次进行插入比较就是一步步的往前进行比较，也就是位置所以要一次次的减1，可能出现位置在最前面也就是插入位置索引为0，也可能是在中间，所以有两种情况。

def insert_sort(li):
    for i in range(1,len(li)):  #i表示需要进行插入的元素的位置
        j=i-1   #j的初始位置，也就是无序区第一个元素的位置
        while j!=-1 and li[j]>li[i]:#只要能够与无序区元素进行比较,循环就不停止          
        #跳出循环的情况只有是有序区进行比较的元素没了，但是跳出循环时与li[j]<=li[i]时执行的语句是一样的，都是li[j+1]=li[i]，所以进行一个合并，减少代码量
            li[j+1]=li[j]   #进行比较的有序区索引加一
            j-=1    #进行比较元素的索引减一
        li[j+1]=li[i]   #也就是成为0号元素

快速排序

快排思路:

取第一个元素,使元素归位。
归位的意义为列表分为两部分,左边都比该元素小,右边都比该元素大。
递归，进行多次归位。
快速排序的时间复杂度为 nlogn。

def _quick_sort(li,left,right):
    if left<right:  #待排序区域至少有两个元素，left和right指的是索引
        mid = partition(li,left,right)
        _quick_sort(li,left,mid-1)
        _quick_sort(li,mid+1,right)
        
def quick_sort(li): #包装一下,因为循环不能直接递归,会非常慢
    _quick_sort(li,0,len[li]-1)
    
def partition(li,left,right):        #此函数的意义是归位
    tmp=li[left]        #left为第一个元素的索引，也就是需要进行归位的元素的索引
    while left<right:
        #注意，小的在左边，大的在右边
        while li[right]>tmp and left<right: #当right的值小于tmp是退出
            right-=1    #进行下一个right
        li[left]=li[right]    #把left位置放比tmp小的right
        while li[left]<=tmp and left<right:
            left+=1
        li[right]=li[left]  #把right位置放比tmp大的left
    li[left]=tmp        #把tmp放在left=right时剩下的位置
    return left

堆排序

知识储备：

树是一种数据结构，可以通过递归定义。
树是由n个节点构成的集合
如果n=0，那么是一颗空树。
如果n>0，那么存在一个根节点，其他的节点都可以单拎出来作为一个树。
根节点，就是回溯后存在的节点。
叶子节点，就是没有下层节点的节点。
树的深度可以粗略认为就是节点最多的分支有几个节点
度，度就是一个节点由几个分支，也就是说有几个子节点。
父节点和子节点索引的关系，若父节点的索引为i，左子节点索引为2i+1，右子节点的索引为2i+2，子节点找父节点，i=(n-1)//2
二叉树：度最多有两个的树。
满二叉树：一个二叉树，每一层的节点数都是最大值，也就是2，那么它就是满二叉树。
完全二叉树：叶子节点只能出现在最下层和次下层，并且最下面一层的节点都集中在该层最左侧，满二叉树是一种特殊的完全二叉树。

二叉树的存储方式：

链式存储，在之后的数据结构博客介绍。
顺序存储，顺序存储就是列表。结构就是从上到下从左到右。
堆：堆是一颗完全二叉树，分为大根堆和小根堆：
大根堆就是任何的子节点都比父节点小。
小根堆就是任何一个子节点都比父节点大。
堆的向下调整性质：当根节点的左右子树都是堆，那么就可以将其通过向下调整来建立一个堆
向下调整就是把根节点单独拿出来，让它子节点尽行大小比较，然后把根节点插入到子节点位置，子节点成为新的根节点，如此递归，直到满足堆的定义。
堆排序也就是优先队列，进行多次向下调整，得出一个根堆，然后根据索引从后往前挨个输出节点。
向下调整

def sift(li,low,high):

    i=low   #相对根节点
    j=2*i+1     #它的左子节点位置
    tmp=li[i]   #根节点元素大小
    while j<=high:
        if j<high and li[j]<li[j+1]:    #先判断左右节点大小,j<high是因为可能出现没有有节点的情况
            j+=1
        if tmp <li[j]:      #再判断左节点或有节点与根节点的大小
            li[i]=li[j]     #把左右节点移动到根节点
            i=j             #把相对根节点移动到下一层
            j=2*i+1         #新的子节点索引
        else:
            break
    li[i]=tmp               #最后把原来的根节点放到索引i上

从堆中取出节点元素

def heap_sort(li):
    for low in range(len(li)//2-1,-1,-1):   #构造堆，low的取值是倒序，从后面到0
        sift(li,low,len(li)-1)      #high被假设是固定的，因为它为最小对结果不会影响。
    for high in range(len(li)-1,-1,-1): #取出时high一直是动态的,让取出的low不参加之后的调整，也就是构建新堆的过程
        li[0],li[high]=li[high],li[0]   #把得出的无序区最后一个值，放到根结点处进行构建新堆
        sift(li,0,high-1)   #

python的heapq内置模块

nlargest，nsmallest 前几个最大或最小的数
heapify(li) 构造堆
heappush 向堆里提交然后构造堆
heappop 弹出最后一个元素

归并排序

归并排序思路：

一次归并：含义就是给定一个列表，分为两段有序，让它成为一个整体有序的列表。
一次归并的方法：把两段有序列表，两两比较，把较小的那个元素拿出来，若一方元素数量为0，那么就将另一方所有元素取出。
归并排序：先分解后合并，分解为单个元素，那么单个元素就是有序的，然后再两两一次归并，得到有序列表。
也就是把归并排序看成多次的一次归并。

def merge(li, low, mid, high):  #mid为两段有序分界线左边第一个数的索引
    # 列表两段有序: [low, mid] [mid+1, high]
    i = low     #i指向左半边列表进行比较的元素
    j = mid + 1 #j指向右半边列表进行比较的元素
    li_tmp = [] #比较出较小的元素暂存的位置
    while i <= mid and j <= high:   #当左右两侧比较的元素都不为空时
        if li[i] <= li[j]:  #左边小，左边元素拿到暂存li_tmp中，左边指针向右移动
            li_tmp.append(li[i])
            i += 1
        else:               #右边小，右边元素拿到li_tmp中，右边元素的指针向左移动
            li_tmp.append(li[j])
            j += 1
    while i <= mid:     #将剩余的元素都拿到li_tmp中
        li_tmp.append(li[i])
        i += 1
    while j <= high:
        li_tmp.append(li[j])
        j += 1
    for i in range(low, high+1):    #把li_tmp中的元素放到li中
        li[i] = li_tmp[i-low]
    # 也可以这样移动： li[low:high+1] = li_tmp

def _merge_sort(li, low, high): #排序li从low到high的范围
    if low < high:
        mid = (low + high) // 2 #开始递归分散
        _merge_sort(li, low, mid)
        _merge_sort(li, mid+1, high)
        merge(li, low, mid, high)   #合并

希尔排序

希尔排序思路：

希尔排序是一种分组插入排序算法。
首先去一个整数d1=n/2,将元素分为d1个组，每组相邻量元素之间的距离为d1，在各组内直接插入排序。
接下来，去第二个元素d2=d1/2，重复上一步，直到di=1。
即所有元素在同一组内进行直接插入排序。
希尔排序每次都会让列表更加接近有序，在那过程中不会使某些元素变得有序。

def shell_sort(li):
    gap = len(li) // 2
    while gap > 0:
        for i in range(gap, len(li)):
            tmp = li[i]
            j = i - gap
            while j >= 0 and tmp < li[j]:
                li[j + gap] = li[j]
                j -= gap
            li[j + gap] = tmp
        gap /= 2

作者：崔园樟

微信关注我们

原文链接：https://blog.roncoo.com/article/1101337039110533121

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

高并发编程之高并发场景：秒杀（无锁、排他锁、乐观锁、redis缓存的逐步演变）

环境：jdk1.8；spring boot2.0.2；Maven3.3摘要说明：在实际开发过程中往往会出现许多高并发场场景，秒杀，强红包，抢优惠卷等；其中：秒杀场景的特点就是单位时间涌入用户量极大，商品数少，且要保证不可超量销售；秒杀产品的本质就是减库存；秒杀场景常用的解决方案有限流、削峰、拓展等本篇以秒杀场景为依据来主要从代码开发的角度阐述从无锁——》排他锁——》共享锁——》缓存中间件的一步步升级来不断完善及优化；同时也针对整体架构提出一些优化方案；步骤：1.准备高并发测试工具类引入高并发编程的工具类：java.util.concurrent.CountDownLatch（发令枪）来进行模拟大批量用户高并发测试；java.util.concurrent.CountDownLatch（发令枪）：一个同步辅助类，控制一组线程的启动，当一组线程未完全准备好之前控制准备好一个或多个线程一直等待。犹如倒计时计数器，调用CountDownLatch对象的countDown方法就将计数器减1，当计数到达0时，则意味着这组线程完全准备好。此时通知所有等待者即整组线程同时开始执行。 package c...

2019-02-28

1622

一、RedisCluster集群简介 Redis Cluster是Redis官方提供的分布式解决方案，在3.0版本后推出的，有效地解决了Redis分布式的需求，当一个节点挂了可以快速的切换到另一个节点，当遇到单机内存、并发等瓶颈时，可以采用分布式方案要解决问题。二、集群原理 Redis Cluster集群采用了P2P的模式，完全去中心化，Redis把所有的Key分成了16384个slot，每个Redis实例负责其中一部分slot，集群中的所有信息（节点、端口、slot等），都通过节点之间定期的数据交换而更新，Redis客户端可以在任意一个Redis实例发出请求，如果所需数据不在该实例中，通过重定向命令引导客户端访问所需的实例。其结构特点：1、所有的redis节点彼此互联(PING-PONG机制),内部使用二进制协议优化传输速度和带宽。2、节点的fail是通过集群中超过半数的节点检测失效时才生效。3、客户端与redis节点直连,不需要中间proxy层.客户端不需要连接集群所有节点,连接集群中任何一个可用节点即可。4、redis-cluster把所有的物理节点映射到[0-16383]sl...

2019-03-06

979

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。