kube-apiserver限流机制原理

2024-04-07 375

本文分享自华为云社区《kube-apiserver限流机制原理》，作者：可以交个朋友。

背景

apiserver是kubernetes中最重要的组件，一旦遇到恶意刷接口或请求量超过承载范围，apiserver服务可能会崩溃，导致整个kubernetes集群不可用。所以我们需要对apiserver做限流处理来提升kubernetes的健壮性。

k8s-apiserver限流能力发展过程

apiserver限流能力的发展分为两个阶段：

kubernetes 1.18版本之前kube-apiserver只是将请求分成了变更类型(create、update、delete、patch)和非变更类型(get、list、watch)，并通过启动参数设置了两种类型的最大并发数。

--max-requests-inflight　 　　　　    ## 限制同时运行的非变更类型请求的个数上限，0表示无限制。 
--max-mutating-requests-inflight　  ## 限制同时运行的变更类型请求的个数上限。0 表示无限制。

此时的apiserver限流能力较弱，若某个客户端错误的向kube-apiserver发起大量的请求时，必然会阻塞kube-apiserver，影响其他客户端的请求，因此高阶的限流APF就诞生了。

kubernetes1.18版本之后APF（ APIPriorityAndFairness ）成为kubernetes的默认限流方式。 APF以更细粒度的方式对请求进行分类和隔离，根据优先级和公平性进行处理。

--enable-priority-and-fairness   ##  该值作为APF特性开关，默认为true 
--max-requests-inflight、--max-mutating-requests-inflight    ## 当开启APF时，俩值相加确定kube-apiserver的总并发上限

两个阶段限流能力对比

限流能力	1.18版本前	1.18版本后(APF)
颗粒度	仅根据是否变更做分类	可以根据请求对象、请求者身份、命名空间等做分类
隔离性	一个坏用户可能堵塞整个系统	为请求分配固定队列，坏请求只能撑爆其使用的队列
公平性	会出现饿死	用公平性算法从队列中取出请求
优先级	无	有特权级别，可让重要请求不被限制

APF关键资源介绍

APF通过FlowSchema 和 PriorityLevelConfiguration两个资源配置限流策略。

FlowSchema：解决老版本分类颗粒度粗的问题。根据rules字段匹配请求，匹配规则包含：请求对象、执行操作、请求者身份和命名空间

apiVersion: flowcontrol.apiserver.k8s.io/v1beta2 
kind: FlowSchema                 # 一个kubernetes集群中可以定义多个FlowSchema 
metadata: 
  name: myfl 
spec: 
  distinguisherMethod:           # 可选值为：ByNamespace或ByUser，用于把请求分组。属于同组的请求会分配到固定的queue中，如果省略该参数，则该FlowSchema匹配的所有请求都将视为同一个分组。
    type: ByUser 
  matchingPrecedence: 90         # 数字越小代表FlowSchema的匹配顺序越在前，取值范围：1~10000。 
  priorityLevelConfiguration:    # FlowSchema关联的priorityLevelConfiguration 
    name: mypl 
  rules:
  - nonResourceRules:            # 匹配非资源型：匹配接口URL 
    - nonResourceURLs: 
      - '*' 
    resourceRules:               # 匹配资源型：匹配apigroup、namespace、resources、verbs 
    - apiGroups: 
      - '*' 
      namespaces: 
      - '*' 
      resources: 
      - '*' 
      verbs: 
      - get 
      - create 
      - list 
      - update 
    subjects:                   # 匹配请求者主体：可选Group、User、ServiceAccount 
    - group: 
        name: '*' 
      kind: Group 
    - kind: User 
      user: 
        name: '*' 
    - kind: ServiceAccount 
      serviceAccount: 
        name: myserviceaccount 
        namespace: demo

PriorityLevelConfiguration：解决老版本隔离性差的问题和优先级问题，并定义了限流细节（总队列数、队列长度、是否可排队）。当请求与某个FlowSchema匹配后，该请求会关联FlowSchema中指定的PriorityLevelConfiguration资源，每个PriorityLevelConfiguration相互隔离，且能承受的并发请求数也不一样

apiVersion: flowcontrol.apiserver.k8s.io/v1beta2 
kind: PriorityLevelConfiguration          ## 每个PriorityLevelConfiguration有自己独立的限流配置， PriorityLevelConfiguration之间是完全隔离的。 
metadata: 
  name: mypl 
spec: 
  type: Limited                           # 设置是否为特权级别，如果为Exempt则不进行限流，如果为Limited则进行限流 
  limited: 
    assuredConcurrencyShares: 2           # 值越大，PriorityLevelConfiguration的并发上限越高。若当前并发执行数未达到并发上限，则PL处于空闲状态。 
    limitResponse:                        # 定义如何处理当前无法被处理的请求 
      type: Queue                         # 类型，Queue或者Reject，Reject直接返回429并拒绝，Queue将请求加入队列 
      queuing: 
        handSize: 1                       # 根据ByNamespace或ByUser对请求分组，每个分组对应queues的数量， 
        queueLengthLimit: 20              # 此PriorityLevelConfiguration中每个队列的长度 
        queues: 2                         # 此PriorityLevelConfiguration中的队列数

一个FlowSchema只能关联一个priorityLevelConfiguration，多个FlowSchema可以关联同一个priorityLevelConfiguration

PriorityLevelConfiguration并发上限 = assuredConcurrencyShares / 所有assuredConcurrencyShares之和 * apiserver总并发数

APF处理过程

请求与集群中的FlowSchema列表按照顺序依次匹配，每个FlowSchema的matchingPrecedence字段决定其在列表中的顺序，matchingPrecedence字段值越小，越靠前，越先进行匹配请求。

根据FlowSchema资源中的rules规则进行匹配，匹配方式可以是 “请求的资源类型”、“请求的动作类型”、“请求者的身份”、“请求的命名空间” 等多个维度。

若请求与某个FlowSchema成功匹配，匹配就会结束。FlowSchema关联着一个PriorityLevelConfiguration，每个PriorityLevelConfiguration中包含许多queue，根据FlowSchema.spec.Distinguisher字段将请求进行"分组"，根据分组来分配queue，分配queue数量由PriorityLevelConfiguration资源的handSize字段决定，如果省略该参数，则该FlowSchema匹配的所有请求都将视为同一个"分组"。

每个PriorityLevelConfiguration资源都有独立的并发上限，assuredConcurrencyShares字段为apiserver总并发数的权重占比，值越大分配的并发上限就越高，当PriorityLevelConfiguration达到并发上限后，请求会根据所属的"分组"写入固定的queue中，请求被阻塞等待。请求与queue的固定关联可以让恶意用户只影响其使用的queue，而不会影响同PriorityLevelConfiguration中的其他queue。

当PriorityLevelConfiguration未达到并发上限时，fair queuing算法从所有queue中选择一个合适的queue取出请求，解除请求的阻塞，执行这个请求。fair queuing算法能保证同一个 PriorityLevelConfiguration 中的所有queue被处理机会平等。

APF实战

kubernetes原生自带了一些FlowSchema和PriorityLevelConfiguration规则，我们选择一个查看，如下图：

下面我们创建新的APF规则：当请求对象是apf命名空间中的deployment，则进行"apfpl"限流规则。

apiVersion: flowcontrol.apiserver.k8s.io/v1beta2 
kind: FlowSchema 
metadata: 
  name: apffl 
spec: 
  matchingPrecedence:  150 
  priorityLevelConfiguration: 
    name: apfpl                           ## 关联名为apfpl的PriorityLevelConfiguration 
  rules: 
    - resourceRules: 
      - apiGroups: 
          - apps 
        clusterScope: true 
        namespaces: 
          - apf                           ## 匹配apf命名空间 
        resources: 
          - deployments                   ## 匹配操作deployment的请求 
        verbs: 
          - '*'                           ## 匹配任意操作类型 
      subjects: 
        - kind: Group 
          group: 
            name: '*'                     ## 匹配任意组身份  
--- 
apiVersion: flowcontrol.apiserver.k8s.io/v1beta2 
kind: PriorityLevelConfiguration 
metadata: 
  name: apfpl 
spec: 
  limited: 
    assuredConcurrencyShares: 2             
    limitResponse:                         ## 设置限流处理细节 
      queuing: 
        handSize: 1  
        queueLengthLimit: 20                 
        queues: 2  
      type: Queue 
  type: Limited                             ## 对请求做限流处理

接着在apf命名空间和default命名空间分别创建deployment进行测试。apf_fs为请求被分类到的 FlowSchema 的名称，apf_pl为该请求的优先级名称。查看apiserver日志信息，见下图：

循环操作deployment，我们可以使用命令查看是否触发限流等待

kubectl get --raw /debug/api_priority_and_fairness/dump_priority_levels

返回waitingRequests非0，则代表触发最大并发数，有请求被限流进入等待队列。PriorityLevelConfiguration资源不为空闲表示已达到并发上限

点击关注，第一时间了解华为云新鲜技术~

微信关注我们

原文链接：https://my.oschina.net/u/4526289/blog/11050972

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

干货！Docker镜像综合管理

添加图片注释，不超过 140 字（可选） 1 批量删除镜像 # 查看当前本地的镜像 docker images # 列出当前本地所有镜像明细 docker images -a # 列出当前本地镜像的id docker images -aq # 列出当前本地镜像的结果字符串 echo `docker images -aq` # 批量删除本地的镜像（慎用） docker rmi `docker images -aq` # 批量删除容器（慎用） docker rm `docker ps -aq` 添加图片注释，不超过 140 字（可选） 2 导出镜像场景：默认运行 centos 镜像，提供 vim，运行该容器后，在容器内安装 vim，然后提交该镜像，将导出该镜像为压缩文件，可以发给其他人使用 # 运行镜像生成容器 docker run -it centos:7.8.2003 bash # 使用 vim 命令 vim # 安装 vim 命令依赖包 yum install vim -y 添加图片注释，不超过 140 字（可选）原因是启用的 fir...

2024-04-03

442

编者按：自 2023 年以来，RAG 已成为基于 LLM 的人工智能系统中应用最为广泛的架构之一。由于诸多产品的关键功能（如：领域智能问答、知识库构建等）严重依赖RAG，优化其性能、提高检索效率和准确性迫在眉睫，成为当前 RAG 相关研究的核心问题。如何高效准确地从PDF等非结构化数据中提取信息并加以利用，是其中一个亟待解决的重要问题。本文比较分析了多种解决方案的优缺点，着重探讨了这一问题的应对之策。文章首先介绍了基于规则的解析方法，如pypdf，指出其无法很好地保留文档结构。接着作者评估了基于深度学习模型的解析方法，如 Unstructured 和 Layout-parser ，阐述了这种方法在提取表格、图像和保留文档布局结构等方面的优势，但同时也存在一些局限性。对于具有双列（double-column）等复杂布局的 PDF 文档，作者提出了一种经过改进的重排序算法。此外，作者还探讨了利用多模态大模型直接从 PDF 文档中提取信息的可能性。这篇文章系统地分析了 PDF 文档解析中的各种挑战，并给出了一系列解决思路和改进算法，为进一步提高非结构化数据解析的质量贡献了有价值的见解，...

2024-04-07

385

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。