您现在的位置是：首页 > 文章详情

Python网络编程（基础总结入门经典）

日期：2018-08-17点击：466收藏

Linux下文件类型：

bcd -lsp

b（块、设备文件）

c（字符设备文件）

d（目录）

-（普通文件）

l（链接文件）

s（套接字文件）

p（管道文件）

kill -sig pid：通过pid发送信号杀死指定进程

kill -l：查看操作系统内所所有sig信号

ps -aux ---> STAT表示进程状态

信号：

SIGHUP 断开链接

SIGINT Ctrl + c

SIGQUIT Ctrl + \

SIGTSTP Ctrl + z

SIGKILL 终止进程且不能被处理

SIGSTOP 暂停进程且不能被处理

SIGALRM 时钟信号

SIGCHLD 子进程改变状态时父进程会收到此信号

OSI七层模型 -----> 网络通信的标准化流程

应用层：提供用户服务，具体的内容由特定的程序规定

表示层：提供数据的加密和压缩优化

会话层：确定建立应用链接，选择传输服务

传输层：提供数据传输服务，进行流量控制

网络层：路由选着，网络互联

链路层：提供链路交换，具体消息的发送

物理层：物理硬件，接口，网卡的规定

网络协议：

应用层：TFTP（文件传输）、HTTP（超文本传输协议）、DNS（域名解析）、SMTP（邮件传输）

传输层：TCP、UDP

网络层：IP

物理层：IEEE

IP地址

本地使用：127.0.0.1 或 “localhost”

网络地址：“0.0.0.0” 或 “172.168.40.53”

IPv4：点分十进制例如：192.168.1.3 取值0~255（32位）

IPv6： 128位

socket模块：

ifconfig：查看本机IP （ens33：本地IP lo：本地回还）

ipconfig：windoes中

socket.gethostname() ：获取本机主机名

socket.gethostbyname('tedu') ：利用主机名获取ip

socket.gethostbyname('localhost')：获取本地ip

socket.gethostbyaddr('127.0.0.1') 访问主机IP地址

socket.inet_aton('192.168.1.2') IP十六进制转换

socket.inet_ntoa(b'\xc0\xa8\x01\02') IP十进制转换

socket.getservbyname('ssh') 获取应用程序的端口

创建TCP服务端套接字：

sockfd.socket（sock_family = AF_INET,

sock_tpye = SOCK_STREAM,

proto = 0）

sockfd.bind（addr）绑定地址

sockfd.listen(n) 设置监听套接字

connfd，addr = sockfd.accept（）等待接受客户端链接

data = connfd.recv（buffersize）接收消息

connfd.send（data）发送消息

sockfd.close（）关闭套接字

创建TCP客户端套接字：

sockfd.socket（sock_family = AF_INET,

sock_tpye = SOCK_STREAM,

proto = 0）

sockfd.bind（addr）绑定地址

sockfd.connect（addr）链接服务端

data = connfd.recv（buffersize）接收消息

connfd.send（data）发送消息

sockfd.close（）关闭套接字

创建UDP客户端套接字：

sockfd.socket（sock_family = AF_INET,

sock_tpye = SOCK_DGRAM,

proto = 0）

sockfd.bind（addr）绑定地址

data = sockfd.recvfrom（buffersize）接收消息

sockfd.sendto（data, addr）发送消息

sockfd.close（）关闭套接字

创建UDP客户端套接字：

sockfd.socket（sock_family = AF_INET,

sock_tpye = SOCK_DGRAM,

proto = 0）

data = sockfd.recvfrom（buffersize）接收消息

sockfd.sendto（data, addr）发送消息

sockfd.close（）关闭套接字

创建本地套接字服务端：

sockfd = socket（AF_UNIX, SOCK_STREAM）创建本地套接字对象

sockfd.bind（file）绑定套接字文件

sockfd.listen(3) 监听

connfd,addr = sockfd.accept() 等待链接

connfd.recv(buffersize) 接收消息

connfd.send(data) 发送消息

sockfd.close() 关闭套接字

创建本地套接字客户端：

sockfd = socket（AF_UNIX, SOCK_STREAM）创建本地套接字对象

sockfd.connect(sock_file) 链接服务端

connfd.recv(buffersize) 接收消息

connfd.send(data) 发送消息

sockfd.close() 关闭套接字

套接字属性：

sockfd.type 返回套接字类型

sockfd.family 返回地址类型

套接字方法：

sockfd.fileno（）获取套接字的文件描述符

sockfd.getsockname（）获取套结字绑定的地址

sockfd.getpeername（）获取链接套接字客户端的地址

sockfd.setsockopt（level，optname， value）设置端口可立即重用

sockfd.setblocking(False) 将套接字设置为非阻塞状态

sockfd.settimeout（sec）设置套接字的超时时间

select模块： IO多路复用，阻塞等待监控的IO事件发生

rs， ws， xs = select（rlist，等待处理的IO

wlist 想要主动处理的IO

xlist[，出错希望去处理的IO

timeout]）超时检测

p = select.poll 创建poll对象

p.register(s， POLLIN | PLLERR) 注册关注的IO

events = p.poll（）监控关注的IO事件

multiprocessing模块： 创建进程对象

Process(target，要绑定的函数

name，给进程起的名称

args，元组给target函数位置传参

kwargs) 字典给target函数键值传参

p.start() 启动进程terget绑定函数

p.join([timeout]) 阻塞等待子进程退出

p.name 获取进程名（属性）

p.daemon 设置为True主进程结束杀死所有子进程（必须start（）前设置）

p.is_alive() 判断进程是处于alive状态（存活）

p.pid 获取创建进程的pid号（属性）

pool = pool（x）创建进程池对象（进程池大小）

pool.apply_async(fun, 要执行的函数(异步执行)

args, 以元组形式为fun传参

kwds) 以字典形式为fun传参

pool.apply(fun, args, kwds) (同步执行)

r = pool.map(fun,range(6)) 将要执行的事件放入进程池

pool.close() 关闭进程池

pool.join() 回收进程池

fd1，fd2 = Pipe(duplex=True) 创建管道（Flase：fd1只读，fd2只写）

fd.recv（）从管道读取信息空则阻塞

fd.send（data）向管道写入内容满则阻塞

q = Queue（maxsize=0）创建队列对象（存放多少条消息）

q.put（data, 存入消息（支持Python数据类型）

[block, 默认阻塞 False：非阻塞

timeout]） block为True是表示超时检测

data = q.get([block,timeout]) 取出消息

q.full（）判断队列是否为满

q.empty() 判断队列是否为空

q.qsize() 获取队列中消息的数量

q.close() 关闭队列

shm = Value（ctype，创建共享内存共享空间

obj） ctype字符串：（C语言数据类型），obj初始数据

shm.value 表示共享内存的值（可以赋值）

shm = Array（ctype，obj）创建共享内存共享空间

sem = Semaphore（num）创建信号量

sem.acquire（）将信号量减1 0时阻塞

sem.release（）将信号量加1

sem.get_value（）获取当前信号量的值（数量）

e = Event（）创建Event事件对象

e.wait（[timeout]）阻塞进程直到事件对象被set

e.set.() 让事件对象变为被设置状态

e.clear（）使事件对象清除设置状态

e.is_set（）判断当前事件是否被set

Lock = Lock（）创建锁对象

lock.acquire（）上锁

lock.release() 解锁

threading 模块： 创建线程对象

threshold. Thread（target，线程函数

name, 线程名字

args, 元组给线程函数位置传参

kwargs）字典给线程函数位置传参

t.start（）启动线程

t.join（）回收线程

t.name 线程名

t.daemon = True 主线程退出分支线程也退出

t.setDaemon(True) 主线程退出分支线程也退出

t.isDaemon 查看daemon值

t.setName（“name”）设置线程名称

t.is_alive（）查看线程状态

threading.currentThread() 获取当前进程对象

e = threading. Event() 创建Event事件对象

e.wait([timeout]) 事件阻塞

e.set（）设置事件

e.clear（）清除事件

lock = threading. Lock（）创建锁对象

lock.acquire() 上锁

lock.release() 解锁

socketserver集成并发模块：

StreamRequestHandler 处理tcp请求

DatagramRequestHandler 处理udp请求

ForkingMixIn 创建多进程

ThreadingMixIn 创建多线程

TCPServer 创建tcp server

UDPServer 创建udp server

ForkingTCPServer ForkingMixIn + TCPServer

ForkingUDPServer ForkingMixIn + UDPServer

ThreadingTCPServer ThreadingMixIn + TCPServer

ThreadingUDPServer ThreadingMixIn + UDPServer

signal模块：

signal.alarm（sec）设置时钟信号给自己SIGALRM信号

signal.pause（）阻塞进程，等待一个信号

signal.signal（sig，要处理的信号

handler）处理方法（SIG_DFL：默认 SIG_IGN：忽略 func：自定义函数）

sys模块补充：

sys.argv 获取从命令行获取的参数内容列表

sys.stdin 0 标准输入IO文件描述符

sys.stdout 1 标准输出IO文件描述符

sys.stderr 2 错误IO文件描述符

sys.exit（[status]）退出一个进程（状态：退出提示字符串）

字符串方法补充：

S.splitlines 按行分隔

os模块补充：

os.path.exists（file）判断一个文件是否存在

os.remove（file）删除文件

os.unlink（file）删除文件

pid = os.fork() 创建进程失败-1 成功0

os.getpid（）获取进程的PID号

os.getppid（）获取父进程的PID

os.exit（status）退出一个进程（状态：整数默认0）

pid,status = os.wait() 塞等待处理子进程的退出

os.WEXITSTATUS(status) 获取原来退出状态

pid,status = os.waitpid(pid,option) 阻塞等待处理子进程的退出

os.path.getsize('./1.txt') 读取文件的大小

os.kill（pid，sig）发送一个信号给某个进程

os.listdir(path) 获取指定目录文件列表

os.path.isfile() 判断一个文件是否为普通文件

os.path.isdir() 判断一个文件是否为目录

传输层服务：

面向连接的传输服务 （tcp协议）：

传输特征：

可靠的数据传输：

可靠性：无失序、无差错、无重复、无丢失、无重复

在数据传输前和传输后需要建立连接和断开链接

面向传输服务建立连接的过程：‘三次握手’

1.客户端向服务器发送链接请求

2.服务器接受到请求进行确认，返回确认报文

3.客户端收到服务器回复最终确认链接

面向传输服务断开链接的过程：‘四次挥手’

1.主动方发送报文，告知被动方要断开链接

2.被动方回复报文，表示已经接受到请求，准备断开

3.被动方再次发送报文，表示准备处理就绪，可以断开

4.主动方发送确认报文，断开链接

应用情况：

适用于传输较大的内容或文件，网络良好，

需要保证传输可靠性的情况

e.g. 信息聊天，文件上传下载，邮件，网页获取

面向无连接的传输服务 （udp协议）：

不保证传输的可靠性

没有建立连接和断开的过程

数据的收发比较自由

适用情况：

网络情况较差，对可靠性要求不高，收发消息的两端

e.g.：网络视频，群聊，广播等

收发函数特性：

recv特征：

如果建立的另一端链接被断开，则recv立即返回空字符串

recv是从接受缓冲区取出内容，当缓冲区为空则阻塞

recv如果一次接受不完缓冲区的内容，下次执行会自动接受

send特征：

如果发送的另一端不存在则会产生pipe...异常

send是从发送缓冲区发送内容当缓冲区为满则堵塞

http协议：

超文本传输协议

用途：

网站中浏览区器网页的获取，基于网站事物数据传输

编写基于http协议的数据传输

特点：

1.应用层协议，传输层使用tcp服务

2.简单、灵活，可以使用多种编程语言操作

3.无状态的协议，既不用记录用户的输入内容

4.http1.1 ---> http2.0（还没发布）技术的成熟和稳定性

http请求（request）：

1.请求格式：

1）请求行：说明具体的请求类别和内容

GET /index.html /HTTP/1.1

请求类别请求内容协议版本

2）请求类别：

GET：获取网络资源

POST：提交一定的附加数据

HEAD：获取相应头

PUT：更新服务器资源

DELETE：删除服务器资源

CONNECT：未使用

TRACE：用于测试

OPTIONS：获取服务器性能信息

2.请求头：对请求的具体描述

Accept：text/html

每一个键值对占一行，描述了一个特定信息

3.空行

4.请求体：具体的参数或提交的内容

get参数或者post提交的内容

http响应（response）：

1.响应格式：

1）响应行:反馈具体的响应情况

HTTP/1.1 20 OK

版本协议响应码附加信息

3）响应码：

1xx：提示信息，表示请求已经接收

2xx：响应成功

3xx：响应需要定向

4xx：客户端错误

5xx：服务器端错误

3）常见响应码：

200 成功

404 请求内容不存在

401 没有访问权限

500 服务器未知错误

503 服务器暂时无法执行

2.响应头：对响应内容的具体描述

3.空行

4.响应体：

将客户端请求内容进行返回

IO多路复用

定义：

通过一个监测，可以同时监控多个IO事件的行为，

当那个IO可以执行，让这个IO事件发生

同时监控多个IO事件，当哪个IO事件准备就绪就执行哪个IO事件

此时形成多个IO时间都可以操作的现象，不必逐个等待执行

IO准备就绪：

IO事件即将发生时的临界状态是不可逆转的

在程序中存在的IO事件中选择要监测的事件

创建监测，将监测的IO事件注册

等待监测的IO事件发生，判断是什么事件

处理相应的IO

poll方法实现IO多路复用：

1.创建poll对象：

p = select.poll

2.注册关注的IO：

p.register(s， POLLIN | PLLERR)

不关注：

p.unregister(s)

事件类别：

POLLIN POLLOUT POLLERR POLLHUP POLLPRI

rlist wlist xlist 断开紧急处理

3.监控IO：

events = p.poll（）

功能：监控关注的IO事件

返回值：

返回发生IO事件

events是一个列表[(fileno, evnet), (), ()....]

每个就绪IO对应一个元组（描述符，就绪事件）

IO地图：{s.fileno():s}

4.处理IO事件

位运算：

按照二进制位进行位运算操作

& 按为与 |按位或 ^按位异或

<< 左异 >>右移

11 1011

14 1110

& 1010 有0得0

| 1111 有1得1

^ 0101 相同为0不同为1

11 << 2 == 44 右侧补零（乘2乘2次）

14 >> 2 == 3 挤掉右侧的数字（地板除2除2次）

使用：

1.在低层硬件时操作寄存器

2.做标志位的过滤

多任务编程：

意义：

充分利用计算机资源，同时运行多个任务，

提高程序整体的运行效率

定义：

通过程序利用计算机的多个核心达到同时执行多个任务的目的

因此达到提升程序运行效率的目的

实施方案：

多进程编程

多线程编程

并行：

多个计算机核心在同时处理多个任务，

这时多个任务之间是并行关系

并发：

同时运行多个任务，内核在多个任务之间的不断切换，

达到多个任务都会执行的处理效果

此时多个任务之间的并发关系

程序：

是一个可执行文件，是静态的，只占有磁盘

不占用计算机运行资源

进程：

程序在计算机中的一次执行过程

是一个动态过程，占有一定的计算机资源

有一定的生命周期

注：

同一个程序不同的运行过程是不同的进程，

因为分配的资源和生命周期都不同

进程的创建过程：

1.用户启动一个程序，或是调用接口发起进程创建

2.操作系统接收用户请求分配计算机资源创建进程

3.操作系统将一定状态的进程提供给用户使用

4.用户利用操作提供的进程完成任务

CPU时间片：

如果有个进程占有CPU此时我们称为该进程占有CPU的时间片

多个进程任务或轮流占有CPU时间片并形成并发效果

进程信息（process）

PCB（进程控制块）：

进程创建后会自动在内存中产生一个空间存放进程信息

进程信息：

进程ID 进程占有内存的位置创建时间、创建位置

查看系统进程信息：ps -aux

PID（process ID）：

在操作系统中每个进程都有唯一的PID值是由系统分配的

进程特征：

进程是操作系统分配资源的最小单元

每个进程拥有自己独立的运行空间（4个G的虚拟内存空间）

进程之间相互独立各不影响

进程的状态：

三态：

就绪状态：

进程具备执行条件，等待系统分配处理器资源进入运行态

运行态：

进程占有CPU处于运行状态

等待态：

进程暂时不具备运行条件，需要阻塞等待

五态：

在三态的基础上增加新建和终止态

新建：

创建一个新的程序，获取系统资源的过程

终止：

进程执行结束，释放资源的过程

ps -aux ---> STAT表示进程状态：

D 等待态阻塞不可中断等待态

S 等待态睡眠可中断等待态

T 等待态暂停暂停执行

R 运行态（就绪态）

Z 僵尸

+ 前台进程（在终端运行）

< 有较高优先级的进程

N 较低优先级的进程

s 回话组

l 有进程链接

进程的优先级：

top 查看进程运行态优先级

取值范围：-20~19 -20最高

nice：

以指定的优先级运行一个程序

nice -9 ./hello.py 以9的优先级运行

sudo nice --9 ./hello.py 以-9优先级运行

首行添加 #! /usr/bin/python3 指定执行器

执行：./hello.py

修改程序权限添加可执行权限

chmod 775 hello.py

孤儿进程：

当父进程先于子进程退出，此时子进程就会成为孤儿进程。

* 孤儿进程会被系统指定进程收养，即系统进程会成为孤儿

进程新的父进程。系统进程会自动处理孤儿进程退出状态

僵尸进程：

子进程先于父进程退出，父进程没有处理子进程的退出状态，此时子进程就会成为僵尸进程

* 僵尸进程会滞留部分PCB信息在内存中，大量的僵尸进

程会消耗系统的内存资源，所以要尽量避免僵尸进程产生

如何避免僵尸进程产生？

* 父进程先退出

* 父进程处理子进程退出状态

* 创建二级子进程

进程池技术：

产生原因：

如果有大量的任务需要多进程完成，而调用周期比较短且需要频繁创建

此时可能产生大量进程频繁创建销毁的情况消耗计算机资源较大

使用方法：

1.创建进程池，在池内放入适当数量的进程

2.将事件封装成函数。放入到进程池

3.事件不断运行，直到所有放入进程池事件运行完成

4.关闭进程池，回收进程

同步互斥机制

目的：

解决对共有资源产生的资源争夺

临界资源：

多个进程或线程都可以操作的资源

临界区：

操作临界资源的代码段

同步：

同步是一种合作关系，为完成某个任务，

多进程或者多个线程之间形成的一种协调

按照约定执行，相互告知，共同完成任务

互斥：

互斥是一种制约关系，当一个进程或者线程

进入临界区操作资源时采用上锁的方式，

阻止其他进程操作，直到解锁后才能让出资源

多线程：

什么是线程（thread）？

线程也是一种多任务编程方式，可以使用计算机的多核资源

线程被称为轻量级的进程

线程的特征：

1.一个进程可以包含多个线程

2.线程是计算机内核使用的最小单位

3.线程也是一个运行过程，也要消耗计算机资源

4.多个线程共享共用进程的资源

5.线程也有自己的特征属性，TID、指令集、线程栈

6.多个线程之间独立运行互不干扰空间不独立（都消耗进程空间）

7.线程的创建删除消耗的资源要小于进程线程/进程（1/20）

线程通信：

多个线程共用线程空间，所以进程的全局变量对进程内线程均可见

线程的通信方法就是使用去全局变量通信

注：

线程间使用全局变量进程通信时，全局变量为共享资源

往往需要同步互斥机制

进程和线程的区别和联系：

1.两者都是多任务编程的方式都能够使用计算机的多核

2.进程的创建和删除要比线程消耗更多的计算机资源

3.进程空间独立，数据安全性好，有专门的进程间的通信方法

4.线程使用全局变量，更加简单，但需要同步互斥操作

5.一个进程可以包含多个线程，线程共享进程空间资源

6.进程线程都独立执行，有自己的特有属性

使用情况：

1.一个进程中并发任务比较多，比较简单，适合使用多线程

2.如果数据程序比较复杂，特别是可能多个任务通信比较多的时候

要考虑使用线程同步互斥的复杂性

3.多个任务存在明显差异，和功能分离的时候没有必要一定写入到一个进程中

4.使用Python要考虑到GIL的问题

Pyhthon线程GIL问题：

GIL （全局解释器锁）

Python --->支持线程操作--->出现IO同步互斥--->加锁--->超级锁，给解释器加锁

后果：

同一时刻一个解释器只解释一个线程

此时其他线程需要等待。大大降低了Python线程的执行效率

只能实现并发不能实现并行

Python GIL问题解决方案：

1.修改c解释器

2.尽量使用多进程进行并行操作

3.Python线程尽量用在高延迟多阻塞的IO情形

3.不使用CPython 使用C#、JAVA 做的得解释器

网络服务器基础：

循环服务器：：

单进程程序，循环接受客户请求，处理请求，处理完毕后再接受下一次请求

特点：

每次只能处理一个客户端请求，如果客户端长期占有服务器则无法处理其他客户端

请求

优点：

实现简单，占用资源少

缺点：

无法同时处理多个客户端，体验差

使用情况：

任务短暂，可以快速完成，udp比tcp更适合循环

并发服务器：

能够同时处理多个客户端任务请求

IO并发：

IO多路复用协程

优点：

可以实现IO并发操作，占用系统资源少

缺点：

不能够监控CPU密集的情况，并不能有长期阻塞

多进程/线程并发：

为每个客户端单独提供一个进程或线程，处理客户端请求

优点：

客户端可以长期占有服务器

缺点：

消耗计算机资源比较多

原文链接：https://yq.aliyun.com/articles/626177

关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有，本站原创内容转载请注明来源。

Java分享

Python网络编程（基础总结入门经典）

快速将log4j.xml 转换为 logback.xml

[雪峰磁针石博客]MD5值重复文件多进程检查工具check_md5.py - 性能测试工具开发

相关文章

文章评论

文章二维码

点击排行

推荐阅读

最新文章

Java分享

Python网络编程（基础总结 入门经典）

快速将log4j.xml 转换为 logback.xml

[雪峰磁针石博客]MD5值重复文件多进程检查工具check_md5.py - 性能测试工具开发

相关文章

文章评论

文章二维码

点击排行

推荐阅读

最新文章

Python网络编程（基础总结入门经典）