Python网络编程 —— 线程-低调大师

Python网络编程 —— 线程

2018-06-21 477

个人独立博客：www.limiao.tech
微信公众号：TechBoard

线程的概念

线程就是在程序运行过程中，执行程序代码的一个分支，每个运行的程序至少都有一个线程

单线程执行

import time


def sing():
    for i in range(3):
        print("唱歌...%d" % i)
        time.sleep(1)

def dance():
    for i in range(3):
        print("跳舞...%d" % i)
        time.sleep(1)

if __name__ == '__main__':
    sing()
    dance()

运行结果：

唱歌...0
唱歌...1
唱歌...2
跳舞...0
跳舞...1
跳舞...2

***Repl Closed***

多线程执行

多线程的执行需要导入threading模块

参数说明：

Thread([group[,target[,name[,args[,kwargs]]]]])
- group: 线程组，目前只能使用None
- target: 执行的目标任务名
- args: 以元组的方式给执行任务传参
- kwargs: 以字典方式给执行任务传参
- name: 线程名，一般不用设置

多线程完成多任务

# 多线程执行
import time, threading


def sing():
    # 获取当前进程
    print(threading.current_thread())
    for i in range(3):
        
        print("唱歌...%d" % i)
        time.sleep(1)

def dance():
    print(threading.current_thread())
    for i in range(3):

        print("跳舞...%d" % i)
        time.sleep(1)

if __name__ == '__main__':
    sing_thread = threading.Thread(target=sing)
    dance_thread = threading.Thread(target=dance)

    sing_thread.start()
    dance_thread.start()

运行结果：

<Thread(Thread-1, started 8520)>
唱歌...0
<Thread(Thread-2, started 4604)>
跳舞...0
唱歌...1
跳舞...1
唱歌...2
跳舞...2

***Repl Closed***

多线程执行带有参数的任务

import time, threading


def sing(num):
    for i in range(num):
        print("唱歌...%d" % i)
        time.sleep(1)


def dance(num):
    for i in range(num):
        print("跳舞...%d" % i)
        time.sleep(1)


if __name__ == '__main__':
    sing_thread = threading.Thread(target=sing, args=(3,))

    dance_thread = threading.Thread(target=dance, kwargs={"num": 3})

    sing_thread.start()
    dance_thread.start()

运行结果：

唱歌...0
跳舞...0
跳舞...1
唱歌...1
跳舞...2
唱歌...2

***Repl Closed***

查看获取线程列表

import time, threading


def sing():
    for i in range(5):
        print("唱歌...%d" % i)
        time.sleep(1)


def dance():
    for i in range(5):
        print("跳舞...%d" % i)
        time.sleep(1)


if __name__ == '__main__':
    # 获取当前程序活动线程的列表
    thread_list = threading.enumerate()
    print("111:", thread_list, len(thread_list))

    sing_thread = threading.Thread(target=sing)

    dance_thread = threading.Thread(target=dance)

    thread_list = threading.enumerate()
    print("222:", thread_list, len(thread_list))

    # 启动线程
    sing_thread.start()
    dance_thread.start()

    # 只有线程启动了，才能加入到活动线程列表中
    thread_list = threading.enumerate()
    print("333:", thread_list, len(thread_list))

运行结果：

111: [<_MainThread(MainThread, started 11864)>] 1
222: [<_MainThread(MainThread, started 11864)>] 1
唱歌...0
跳舞...0
333: [<_MainThread(MainThread, started 11864)>, <Thread(Thread-1, started 892)>, <Thread(Thread-2, started 6444)>] 3
跳舞...1
唱歌...1
跳舞...2
唱歌...2
唱歌...3
跳舞...3
唱歌...4
跳舞...4

***Repl Closed***

注意

线程之间执行是无序的

import time, threading


def task():
    time.sleep(1)
    print("当前线程：", threading.current_thread().name)

if __name__ == '__main__':

    for _ in range(5):
        sub_thread = threading.Thread(target=task)
        sub_thread.start()

运行结果：

当前线程： Thread-5
当前线程： Thread-2
当前线程： Thread-3
当前线程： Thread-1
当前线程： Thread-4

***Repl Closed***

主线程会等待所有的子线程结束后才结束

# 主线程会等待所有的子线程结束后才会结束
import time, threading


# 测试主线程是否会等待子线程执行完成以后程序再退出
def show_info():
    for i in range(5):
        print("test:", i)
        time.sleep(1)


if __name__ == '__main__':
    sub_thread = threading.Thread(target=show_info)
    sub_thread.start()

    # 主线程延时5秒
    time.sleep(10)
    print("over")

运行结果：

test: 0
test: 1
test: 2
test: 3
test: 4
over

***Repl Closed***

守护主线程

import time, threading


def show_info():
    for i in range(5):
        print("test：", i)
        time.sleep(1)

if __name__ == '__main__':
    # 设置成守护主线程，主线程退出后子线程直接销毁不再执行子线程的代码
    sub_thread = threading.Thread(target=show_info, daemon=True)
    

    sub_thread.start()
    
    time.sleep(10)
    print("over")

运行结果：

test： 0
test： 1
test： 2
test： 3
test： 4
over

***Repl Closed***

自定义线程

import threading


# 自定义线程类
class MyThread(threading.Thread):
    # 通过构造方法取接受任务的参数
    def __init__(self, info1, info2):
        # 调用父类的构造方法
        super().__init__()
        self.info1 = info1
        self.info2 = info2


    # 定义自定义线程相关的任务
    def test1(self):
        print(self.info1)


    def test2(self):
        print(self.info2)

    # 通过run方法执行相关任务
    def run(self):
        self.test1()
        self.test2()


# 创建自定义线程
my_thread = MyThread("测试1", "测试2")

# 启动
my_thread.start()

运行结果：

测试1
测试2

***Repl Closed***

总结：

自定义线程不能指定target，因为自定义线程里面的任务都统一在run方法里面执行
启动线程统一调用start方法，不要直接调用run方法，因为这样不是使用子线程去执行任务

多线程共享全局变量

import time, threading


# 定义全局变量
my_list = list()

# 写入数据任务
def write_data():
    for i in range(5):
        my_list.append(i)
        time.sleep(1)
    print("write_data:", my_list)

# 读取数据任务
def read_data():
    print("read_data:", my_list)

if __name__ == '__main__':
    # 创建写入数据的线程
    write_thread = threading.Thread(target=write_data)
    # 创建读取数据的线程
    read_thread = threading.Thread(target=read_data)

    write_thread.start()

    # 主线程等待写入线程执行完成以后代码再继续往下执行
    write_thread.join()
    print("开始读取数据...")
    read_thread.start()

运行结果：

write_data: [0, 1, 2, 3, 4]
开始读取数据...
read_data: [0, 1, 2, 3, 4]

***Repl Closed***

多线程同时对全局变量进行操作,导致数据可能出现错误

import threading


# 定义全局变量
g_num = 0

# 循环一次给全局变量加1
def sum_num1():
    for i in range(1000000):
        global g_num
        g_num += 1
    print("sum1:", g_num)

# 循环一次给全局变量加1
def sum_num2():
    for i in range(1000000):
        global g_num
        g_num += 1
    print("sum2:", g_num)

if __name__ == '__main__':
    # 创建两个线程
    first_thread = threading.Thread(target=sum_num1)
    second_thread = threading.Thread(target=sum_num2)

    first_thread.start()
    second_thread.start()

运行结果：

sum1: 1491056
sum2: 1528560

***Repl Closed***

通过上面运行结果，得出：多线程同时对全局变量操作数据发生了错误

原因分析：两个线程first_thread和second_thread都要对全局变量g_num(默认是0)进行加1运算，但是由于是多线程同时操作，，有可能出现下面的情况：

1.在g_num=0时，first_thread取得g_num=0.此时系统把first_thread调度为"sleeping"状态，把second_thread转换为"running"状态,t2也获得g_num=0

2.然后second_thread对得到的值进行加1并赋给g_num,使得g_num=1

3.然后系统又把second_thread调度为"sleeping",把first_thread转为"running".线程t1又把之前得到的0加1后赋值给g_num.

4.这样导致虽然first_thread和second_thread都对g_num加1，但结果仍然是g_num=1。

全局变量数据错误的解决办法

线程同步：保证同一时刻只能有一个线程去操作全局变量同步，就是协同步调，按预定的先后次序进行运行

线程同步的方式：

1.线程等待（join）

2.互斥锁

线程等待实现方式：

import threading


# 定义全局变量
g_num = 0

# 循环一次给全局变量加1
def sum_num1():
    for i in range(1000000):
        global g_num
        g_num += 1
    print("sum1:", g_num)

# 循环一次给全局变量加1
def sum_num2():
    for i in range(1000000):
        global g_num
        g_num += 1
    print("sum2:", g_num)

if __name__ == '__main__':
    # 创建两个线程
    first_thread = threading.Thread(target=sum_num1)
    second_thread = threading.Thread(target=sum_num2)

    first_thread.start()
    first_thread.join()

    second_thread.start()

运行结果：

sum1: 1000000
sum2: 2000000

***Repl Closed***

结论：多个线程同时对同一个全局变量进行操作，会有可能出现资源竞争数据错误的问题

线程同步方式可以解决资源竞争数据错误问题，但是这样有多任务变成了单任务

互斥锁

对共享数据进行锁定，保证同一时刻只能有一个线程去操作

抢到锁的线程先执行，没有抢到锁的线程需要等待，等锁用完后需要释放，然后其它等待的线程再去抢这个锁，哪个线程抢到，那个线程再执行

具体哪个线程抢到这个锁，我们决定不了，是由CPU调度决定的

线程同步能够保证多个线程安全访问竞争资源，最简单的同步机制是引入互斥锁

互斥锁为资源引入的一个状态：锁定/非锁定

某个线程要更改共享数据时，先将其锁定，此时资源的状态为"锁定"，其他线程不能更改；直到该线程释放资源，将资源的状态变成"非锁定"，其他的线程才能再次锁定该资源。互斥锁保证了每次只有一个线程进行写入操作，从而保证了多线程情况下数据的正确性。

创建锁：

a = threading.Lock()

锁定

a.acquire()

释放

a.release()

注意：

1.如果这个锁之前时没有上锁的，那么acquire不会堵塞

2.如果在调用acquire对这个锁上锁之前，它已经被其它线程上了锁，那么此时acquire会堵塞，直到这个锁被解锁为止

# 使用互斥锁完成2个线程对同一个全局变量各加100万次的操作
import threading


# 定义全局变量
g_num = 0

# 创建全局互斥锁
lock = threading.Lock()

# 循环一次给全局变量加1
def sum_num1():
    # 上锁
    lock.acquire()
    for i in range(1000000):
        global g_num
        g_num += 1

    print("sun1:", g_num)

    # 释放锁
    lock.release()

# 循环一次给全局变量加1
def sum_num2():
    # 上锁
    lock.acquire()
    for i in range(1000000):
        global g_num
        g_num += 1

    print("sum2:", g_num)

    # 释放锁
    lock.release()

if __name__ == '__main__':
    # 创建线程
    first_thread = threading.Thread(target=sum_num1)
    second_thread = threading.Thread(target=sum_num2)

    # 启动线程
    first_thread.start()
    second_thread.start()

运行结果：

sun1: 1000000
sum2: 2000000

***Repl Closed***

注意

加上互斥锁，哪个线程抢到这个锁我们决定不了，哪个线程抢到锁哪个线程先执行，没有抢到的线程需要等待

加上互斥锁多任务瞬间变成单任务，性能会下降，也就是说同一时刻只能有一个线程去执行

使用互斥锁的目的

能够保证多个线程访问共享数据不会出现资源竞争及数据错误

上锁、解锁过程

当一个线程调用锁的acquire()方法获得锁时，锁就进去了"locked"状态。

每次只有一个而线程可以获得锁，如果此时另一个线程试图获得这个锁，该线程就会变为"blocked"状态，称为"阻塞"，直到拥有锁的线程调用锁的release()方法释放锁之后，锁进入"unlocked"状态。

线程调度程序从处于同步阻塞状态的线程中选择一个来获得锁，并使得该线程进入运行"running"状态

死锁

一直等待对方释放锁的情景就是死锁

根据下标在列表中取值，但是要保证同一时刻只能有一个线程去取值

# 死锁示例：
import time, threading

# 创建互斥锁
lock = threading.Lock()

def get_value(index):
    # 上锁
    lock.acquire()
    print(threading.current_thread().name)
    my_list = [3, 6, 8, 1]
    # 判断下标释放越界
    if index >= len(my_list):
        print("下标越界：", index)
        
        return
    value = my_list[index]
    print(value)
    time.sleep(1)
    # 释放锁
    lock.release()

if __name__ == '__main__':
    # 模拟大量线程去执行取值操作

    for i in range(30):
        sub_thread = threading.Thread(target=get_value, args=(i,))
        sub_thread.start()

避免死锁：

# 死锁示例：
import time, threading

# 创建互斥锁
lock = threading.Lock()

def get_value(index):
    # 上锁
    lock.acquire()
    print(threading.current_thread().name)
    my_list = [3, 6, 8, 1]
    # 判断下标释放越界
    if index >= len(my_list):
        print("下标越界：", index)
        lock.release()
        return
    value = my_list[index]
    print(value)
    time.sleep(1)
    # 释放锁
    lock.release()

if __name__ == '__main__':
    # 模拟大量线程去执行取值操作

    for i in range(30):
        sub_thread = threading.Thread(target=get_value, args=(i,))
        sub_thread.start()

小结：使用互斥锁的时候需要注意死锁的问题，要在合适的地方注意释放锁

死锁一旦发生就会造成应用的停止响应

个人独立博客：www.limiao.tech
微信公众号：TechBoard

微信关注我们

原文链接：https://yq.aliyun.com/articles/651680

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Java面试必看之Integer.parseInt() vs Integer.valueOf()

Integer.parseInt() 和 Integer.valueOf() 都是用来将String转换为Int的，但是为什么Java会提供两个这样的方法呢，他们如果是同样的操作，岂不是多此一举？我们来深挖Java源代码一探究竟。 Integer.parseInt()，返回一个原子类型int. Integer.valueOf(), 返回的是封装的Integer对象。我们来看一下Integer.parseInt() 的源码实现： public static int parseInt(String s) throws NumberFormatException { return parseInt(s,10); } public static int parseInt(String s, int radix) throws NumberFormatException { /* * WARNING: This method may be invoked early during VM initialization * before IntegerCache is initialized....

2018-06-22

472

手机验证登录分为三个API接口，分别为：获取图片验证码、获取手机短信验证码、登录。 1.获取图片验证码：通过工具类生成图片验证码，将随机验证码的数字保存到session中，将图片验证码转为base64码放到对应的entity字段里。 2.获取手机短信验证码：判断手机号不能为空、手机号的格式、手机号在数据中必须存在，定义6位随机数做为短信验证码，先将验证码保存到redis中（60秒时效），然后再发送到对应的手机号中。 3.登录：首先检验随机验证码、短信验证码不能为空，从session中获取随机验证码进行校验（验证码忽略大小写），校验成功后就开始继续从session获取短信验证码并做校验，短信验证码验证成功后就开始进入到系统并修改登录次数、登录时间、获取下载数、个人信息等。 package com.chinamobile.cmss.share.controller; import java.util.Map; import javax.servlet.http.HttpServletRequest; import javax.servlet.http.HttpServletRespon...

2018-06-22

603

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。