最佳实践系列丨Docker EE 大规模部署指南（一）-低调大师

最佳实践系列丨Docker EE 大规模部署指南（一）

2018-06-05 660

本文首发自“Docker公司”公众号（ID：docker-cn）
编译丨小东
每周一、三、五与您不见不散！

此参考架构将帮助您规划大规模 Docker 企业版部署。它涉及核心 Docker EE 平台、Universal Control Plane 以及 Docker Trusted Registry。请使用本指南来帮助确定 Docker EE 部署的硬件和基础架构规模，并确定针对您的具体工作负载的最佳配置。

您将学到的知识

对于 Docker EE、Universal Control Plane （UCP）和 Docker Trusted Registry （DTR），本指南涵盖了：

哪些应用场景参数很可能会影响规模要求；
基于实际测试的已知规模限制；
确保良好性能和未来增长余地的最佳实践；

Docker EE 与 Docker Universal Control Plane

本节论述实现优化性能和增长潜力的基础 Docker EE 平台和 Universal Control Plane 配置。

管理节点的数量

对于生产集群，建议的管理节点数量是 3 个或 5 个。3 管理节点集群可以容许损失 1 个管理节点，而 5 管理节点集群可以容许 2 个管理节点暂时故障。具有更多管理节点的集群可以容许更多管理节点发生故障，但是增加管理节点也会增加维护开销和按 Docker Swarm Raft 法定多数提交集群状态的开销。在某些情况下，拥有较多管理节点（例如 5 个或 7 个）的集群可能（在集群更新延迟和吞吐量方面）不如只有 3 个管理节点但其他规格类似的集群。

一般而言，增加管理节点数量不会加快集群操作速度（在某些情况下，反而会使速度变慢），不会增加集群最大更新操作吞吐量，也不会增强集群能够管理的工作节点总数。

即使在管理节点发生故障，失去法定多数的情况下，集群上的服务和任务也会继续运行，并且保持稳态稳定（只不过在没有法定多数的情况下，无法更新集群状态）。因此，Docker 建议将投资花在个别管理节点故障后快速恢复的能力上（例如用于快速添加替换管理节点的自动化/脚本），而不要规划具有大量管理节点的集群。

1 个管理节点的集群应该仅用于测试和试验，因为损失管理节点就会导致集群损失。

请查看文档来获取关于 Swarm 管理节点和工作节点配置的详细信息。

管理节点大小和类型

生产集群中的管理节点最好拥有至少 16GB 的 RAM 和 4 个 vCPU。Docker 进行的测试表明，拥有 16GB RAM 的管理节点即使用在有 100 个工作节点和众多服务、网络及其他元数据的集群中，也不会受限于内存大小。

生产集群中的管理节点应该_始终_对 /var/lib/docker/swarm 挂载点使用 SSD。Docker 在此目录中存储 swarm 集群状态，并且会在集群状态更新时进行众多小更新的读写。SSD 将确保以尽可能小的延迟提交更新。建议在用于测试和试验的集群中也使用 SSD 来确保良好性能。

提高 CPU 速度和数量，以及改善管理节点之间的网络延迟，也会提高集群性能。

工作节点大小和数量

对于工作节点而言，Docker 组件和代理程序的开销并不大 – 通常小于 1GB 内存。确定工作节点大小和数量的过程与您当前确定应用或 VM 环境大小的过程类似。例如，您可以确定负载下的应用内存工作集，并考虑每个应用需要多少从节点（确保任务失败时的耐用性和/或吞吐量）。这样一来，您对集群中各工作节点需要的总内存量就有了一个认识。

请记住，在工作节点发生故障时（或者您清空某个节点以进行升级或维修时），Docker Swarm 会自动重新调度任务，所以别忘了留出余地，使任务能够再平衡到其他节点。

还要记住的是，Docker 容器与虚拟机不同，与在容器外运行相比，在容器中运行应用所增加的内存或 CPU 开销极小或为零。如果将应用从各个 VM 移动到容器中，或者将许多应用合并到一个 Docker EE 集群中，那么您为此使用的资源将比当前使用的少得多。

任务分割和限制资源使用

在生产集群中，切勿在管理节点上运行工作负载。这是 Docker Universal Control Plane (UCP) 中的一种可配置的管理节点设置。

如果在集群上部署的任务和服务具有差异很大的资源概要，而且您希望对不同的任务（例如具有不同的磁盘、内存或 CPU 特征）使用不同的节点类型，可以使用节点标记和服务约束来控制 Swarm 对特定服务的任务调度。

您还可以将节点加入集合以及基于用户帐户和团队控制访问。如果某些团队或个人经常要部署的应用会消耗许多资源，或者具有对其他团队运行的任务产生不利影响的扰邻特征，用这种方法可以有效隔离他们所管理的任务。请参见 RBAC 知识库文章了解关于如何使用 Docker 企业版设计团队和项目结构的示例。

资源约束

Docker EE 支持对容器和服务任务应用资源限制。Docker 建议在创建服务时使用 --reserve-memory=和 --limit-memory=参数。这些参数让 Docker EE 可以根据预期的内存消耗，更好地在工作节点上打包任务。

此外，分配一个全局（每节点 1 个实例）“幽灵”服务也许是个好主意，它可以在每个节点上保留一部分（例如 2GB）内存，供非 Docker 系统服务使用。因为 Docker Swarm 当前不会考虑非 Docker 管理的工作负载所消耗的工作节点内存，所以这个方法很有意义：

docker service create --name system-reservation --reserve-memory 2G --limit-memory 2G --reserve-cpu 1 --mode global nginx:latest

(nginx 在此服务中实际上不执行任何工作。)（可以使用任何不会消耗大量内存或 CPU 的小镜像取代 nginx）。

请查看关于容器资源约束和为服务保留内存或 CPU 的文档。

磁盘空间

对于生产集群，您需要关注几个影响工作节点磁盘空间使用的因素：

工作节点上使用中的 Docker 容器镜像；
为容器创建的本地 Docker 存储卷；
工作节点上存储的容器日志；
工作节点上存储的 Docker 引擎日志；
容器写入的临时数据；

工作节点上的容器镜像

要确定该为使用中的镜像分配多少空间，请尝试将一些应用放入容器，然后查看产生的镜像有多大。请注意，Docker 镜像包括多个层，如果有多个容器使用同一个层（对于 ubuntu 之类的 OS 层或 openjdk 之类的语言框架层来说很常见），在任何一个节点或 Docker Trusted Registry 上只会存储和使用该层的一个副本。层共享也意味着部署应用的新版本通常只会使节点上被占用的空间增加相对较小的幅度（因为只有容纳应用的最上数层发生更改）。

请注意，Docker Windows 容器镜像往往会变得比 Linux 容器镜像大。

为了持续监视使用中的容器镜像存储，应该尽量确保应用镜像从通用的基础镜像衍生。还可考虑运行定期脚本或 Cron 作业来修剪不使用的镜像，特别是在节点要处理许多镜像更新的情况下（例如比较频繁地发生部署的构建服务器或测试系统）。请参见关于镜像修剪的文档获取详细信息。

日志

对于生产集群，Docker 建议使用日志记录驱动或其他第三方服务聚合容器日志。只有 json-file（可能还包括 journald）日志驱动会导致容器日志在节点上累积，在这种情况下，要注意轮替或删除旧的容器日志。请参见日志记录设计与最佳实践获取详细信息。

Docker 引擎日志存储在工作节点和管理节点上。产生的引擎日志数量根据工作负载和引擎设置而变。例如，debug 日志级别会导致系统写入更多日志。应该使用 logrotate 之类的实用程序管理引擎日志（压缩并最终删除）。

Overlay 网络和网格路由

Docker EE 附带受支持的内置 Overlay 网络驱动，用于实现配合 Docker Swarm 使用的多主机网络。Overlay 网络会造成与封装网络流量和管理 IP 地址及其他跟踪网络任务和服务的元数据有关的开销。

Docker EE 客户如果有网络吞吐量要求非常高或者工作负载动态性极高（集群或服务的更新频率很高）的应用，应该考虑尽量降低对开箱即用的 Docker Overlay 网络和网格路由的依赖。要达到这一目的，有多种方法：

使用主机模式发布取代网格路由；
使用 macvlan 驱动，它的性能可能好于默认驱动；
使用非 Docker 服务发现机制（例如 Consul）；
考虑使用 dnsrr 取代 vip 服务端点；

如果 Overlay 网络由使用基于 VIP 的端点模式创建（默认）的服务所使用，则网络大小不应该超过 /24 个含 256 个 IP 地址的区块（默认）。用户不应该通过增加 IP 区块大小来绕过此限制，而应该使用 dnsrr 端点模式或使用多个较小的 Overlay 网络。

还应注意的是，如果对一个 Overlay 网络分配了大量任务，例如有许多任务关联到该网络或者网络上的服务扩展到许多从节点，那么 Docker EE 可能会遇到 IP 枯竭的问题。在因为节点故障而重新调度任务时，也可能出现该问题。当前如果发生节点故障，Docker 会等待 24 小时以释放 Overlay IP 地址。可通过在 Docker 守护进程日志中查找 failed to allocate network IP for task 消息来诊断该问题。

HTTP 网格路由

含有 Universal Control Plane 的 Docker 企业版附带内置的 HTTP 网格路由功能。HTTP 网格路由因为增加了网络跳数和路由控制，会增加一些开销，应该仅用于管理对外部暴露的服务的网络。对于在 Docker 上托管的服务之间的网络和路由，只须使用标准的内置 Docker Overlay 网络即可获得最佳性能。

微信关注我们

原文链接：https://yq.aliyun.com/articles/600049

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

从零开始Docker化你的Node.js应用

背景给你一台新买的服务器(CentOS)，相关账户及密码，一个基于Node.js开发的web应用源码包(zip)，要求你在新机器上使用Docker的方式把应用部署起来。此时的你，并没有搞清楚什么是容器/镜像，也没记住几个相关的Linux命令，该怎么办？本文将帮助你摆脱困境方案流程为达到最终目的，先来梳理一波流程：把源码zip包上传至服务器登录服务器解压zip包安装最新Docker 设置国内镜像加速器编写Dockerfile 构建镜像编写启动容器脚本执行脚本，检查部署情况下面将详细描述如何操作文中服务器操作系统为CentOS 7，如果你的服务器不相符，操作细节可能会略有不同，需要另行查阅相关资料 rsync传输假设: 服务器地址为${ip} 帐户为${user} 密码为${pass} 源码包为${zip} zip包放到服务器的目录为${path} 则在本机源码包同级目录下，使用scp命令，把zip包传输至服务器的示例如下 rsync -avzP ./${zip} ${user}@${ip}:${path} # 后面会提示输入密码复制代码 ssh登录承接上...

2018-06-05

653

基于微服务架构和Docker容器技术的PaaS云平台建设目标是给我们的开发人员提供一套服务快速开发、部署、运维管理、持续开发持续集成的流程。平台提供基础设施、中间件、数据服务、云服务器等资源，开发人员只需要开发业务代码并提交到平台代码库，做一些必要的配置，系统会自动构建、部署，实现应用的敏捷开发、快速迭代。在系统架构上，PaaS云平台主要分为微服务架构、Docker容器技术、DveOps三部分，这篇文章重点介绍微服务架构的实施。实施微服务需要投入大量的技术力量来开发基础设施，这对很多公司来说显然是不现实的，别担心，业界已经有非常优秀的开源框架供我们参考使用。目前业界比较成熟的微服务框架有Netflix、Spring Cloud和阿里的Dubbo等。Spring Cloud是基于Spring Boot的一整套实现微服务的框架，它提供了开发微服务所需的组件，跟Spring Boot一起使用的话开发微服务架构的云服务会变的很方便。Spring Cloud包含很多子框架，其中Spring Cloud Netflix是其中的一套框架，在我们的微服务架构设计中，就使用了很多Spring Clou...

2018-06-05

683

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。