搜索[k8s]结果-低调大师优秀个人博客

精选列表

搜索[k8s]，共3940篇文章

学习kubernetes，从快速搭建k8s集群开始

> 本系列文章，我们将在Ubuntu Server 18.04上搭建k8s环境进行入门学习。

2021-06-18

### 今日课程推荐： Kubernetes容器编排技术零基础入门和企业实践：https://edu.51cto.com/course/24884.html ### 开篇今天我们来说说Deployment， Deployment一个非常重要的功能就是实现了 Pod 的“水平扩展/收缩”，比如我们应用更新了，我们只需要更新我们的容器镜像，然后修改 Deployment 里面的 Pod 模板镜像，那么 Deployment 就会用滚动更新（Rolling Update）的方式来升级现在的 Pod，这个能力是非常重要的，因为对于线上的服务我们需要做到不中断服务，所以滚动更新就成了必须的一个功能。我们可以通俗的理解就是每个 Deployment 就对应集群中的一次部署，这样就更好理解了。 ### Deployment Deployment 资源对象的格式和 ReplicaSet 几乎一致，如下资源对象就是一个常见的 Deployment 资源类型：（nginx-deploy.yaml） ``` apiVersion: apps/v1 kind: Deployment metadata: name: nginx-deploy namespace: default spec: replicas: 3 # 期望的 Pod 副本数量，默认值为1 selector: # Label Selector，必须匹配 Pod 模板中的标签 matchLabels: app: nginx template: # Pod 模板 metadata: labels: app: nginx spec: containers: - name: nginx image: nginx ports: - containerPort: 80 ``` 我们这里只是将类型替换成了 Deployment，我们可以先来创建下这个资源对象： ``` $ kubectl apply -f nginx-deploy.yaml deployment.apps/nginx-deploy created $ kubectl get deployment NAME READY UP-TO-DATE AVAILABLE AGE nginx-deploy 3/3 3 3 58s ``` 创建完成后，查看 Pod 状态： ``` $ kubectl get pods -l app=nginx NAME READY STATUS RESTARTS AGE nginx-deploy-85ff79dd56-7r76h 1/1 Running 0 41s nginx-deploy-85ff79dd56-d5gjs 1/1 Running 0 41s nginx-deploy-85ff79dd56-txc4h 1/1 Running 0 41s ``` 到这里我们发现和之前的 RS 对象是否没有什么两样，都是根据spec.replicas来维持的副本数量，我们随意查看一个 Pod 的描述信息： ``` $ kubectl describe pod nginx-deploy-85ff79dd56-txc4h Name: nginx-deploy-85ff79dd56-txc4h Namespace: default Priority: 0 PriorityClassName: Node: ydzs-node1/10.151.30.22 Start Time: Sat, 16 Nov 2019 16:01:25 +0800 Labels: app=nginx pod-template-hash=85ff79dd56 Annotations: podpreset.admission.kubernetes.io/podpreset-time-preset: 2062768 Status: Running IP: 10.244.1.166 Controlled By: ReplicaSet/nginx-deploy-85ff79dd56 ...... Events: Type Reason Age From Message ---- ------ ---- ---- ------- Normal Scheduled default-scheduler Successfully assigned default/nginx-deploy-85ff79dd56-txc4h to ydzs-node1 Normal Pulling 2m kubelet, ydzs-node1 Pulling image "nginx" Normal Pulled 117s kubelet, ydzs-node1 Successfully pulled image "nginx" Normal Created 117s kubelet, ydzs-node1 Created container nginx Normal Started 116s kubelet, ydzs-node1 Started container nginx ``` 我们仔细查看其中有这样一个信息Controlled By: ReplicaSet/nginx-deploy-85ff79dd56，什么意思？是不是表示当前我们这个 Pod 的控制器是一个 ReplicaSet 对象啊，我们不是创建的一个 Deployment 吗？为什么 Pod 会被 RS 所控制呢？那我们再去看下这个对应的 RS 对象的详细信息如何呢： ``` $ kubectl describe rs nginx-deploy-85ff79dd56 Name: nginx-deploy-85ff79dd56 Namespace: default Selector: app=nginx,pod-template-hash=85ff79dd56 Labels: app=nginx pod-template-hash=85ff79dd56 Annotations: deployment.kubernetes.io/desired-replicas: 3 deployment.kubernetes.io/max-replicas: 4 deployment.kubernetes.io/revision: 1 Controlled By: Deployment/nginx-deploy Replicas: 3 current / 3 desired Pods Status: 3 Running / 0 Waiting / 0 Succeeded / 0 Failed ...... Events: Type Reason Age From Message ---- ------ ---- ---- ------- Normal SuccessfulCreate 4m52s replicaset-controller Created pod: nginx-deploy-85ff79dd56-7r76h Normal SuccessfulCreate 4m52s replicaset-controller Created pod: nginx-deploy-85ff79dd56-d5gjs Normal SuccessfulCreate 4m52s replicaset-controller Created pod: nginx-deploy-85ff79dd56-txc4h ``` 其中有这样的一个信息：Controlled By: Deployment/nginx-deploy，明白了吧？意思就是我们的 Pod 依赖的控制器 RS 实际上被我们的 Deployment 控制着呢，我们可以用下图来说明 Pod、ReplicaSet、Deployment 三者之间的关系： ![deployment.png](https://s2.51cto.com/images/20210610/1623293371427285.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=) 通过上图我们可以很清楚的看到，定义了3个副本的 Deployment 与 ReplicaSet 和 Pod 的关系，就是一层一层进行控制的。ReplicaSet 作用和之前一样还是来保证 Pod 的个数始终保存指定的数量，所以 Deployment 中的容器 restartPolicy=Always 是唯一的就是这个原因，因为容器必须始终保证自己处于 Running 状态，ReplicaSet 才可以去明确调整 Pod 的个数。而 Deployment 是通过管理 ReplicaSet 的数量和属性来实现水平扩展/收缩以及滚动更新两个功能的。 ### 水平伸缩水平扩展/收缩的功能比较简单，因为 ReplicaSet 就可以实现，所以 Deployment 控制器只需要去修改它缩控制的 ReplicaSet 的 Pod 副本数量就可以了。比如现在我们把 Pod 的副本调整到 4 个，那么 Deployment 所对应的 ReplicaSet 就会自动创建一个新的 Pod 出来，这样就水平扩展了，我们可以使用一个新的命令 kubectl scale 命令来完成这个操作： ``` $ kubectl scale deployment nginx-deploy --replicas=4 deployment.apps/nginx-deployment scaled ``` 扩展完成后可以查看当前的 RS 对象： ``` $ kubectl get rs NAME DESIRED CURRENT READY AGE nginx-deploy-85ff79dd56 4 4 3 40m ``` 可以看到期望的 Pod 数量已经变成 4 了，只是 Pod 还没准备完成，所以 READY 状态数量还是 3，同样查看 RS 的详细信息： ``` $ kubectl describe rs nginx-deploy-85ff79dd56 Name: nginx-deploy-85ff79dd56 Namespace: default Selector: app=nginx,pod-template-hash=85ff79dd56 ...... Events: Type Reason Age From Message ---- ------ ---- ---- ------- Normal SuccessfulCreate 40m replicaset-controller Created pod: nginx-deploy-85ff79dd56-7r76h Normal SuccessfulCreate 40m replicaset-controller Created pod: nginx-deploy-85ff79dd56-d5gjs Normal SuccessfulCreate 40m replicaset-controller Created pod: nginx-deploy-85ff79dd56-txc4h Normal SuccessfulCreate 17s replicaset-controller Created pod: nginx-deploy-85ff79dd56-tph9g ``` 可以看到 ReplicaSet 控制器增加了一个新的 Pod，同样的 Deployment 资源对象的事件中也可以看到完成了扩容的操作： ``` $ kubectl describe deploy nginx-deploy Name: nginx-deploy Namespace: default ...... OldReplicaSets: NewReplicaSet: nginx-deploy-85ff79dd56 (4/4 replicas created) Events: Type Reason Age From Message ---- ------ ---- ---- ------- Normal ScalingReplicaSet 43m deployment-controller Scaled up replica set nginx-deploy-85ff79dd56 to 3 Normal ScalingReplicaSet 3m16s deployment-controller Scaled up replica set nginx-deploy-85ff79dd56 to 4 ``` ### 滚动更新如果只是水平扩展/收缩这两个功能，就完全没必要设计 Deployment 这个资源对象了，Deployment 最突出的一个功能是支持滚动更新，比如现在我们需要把应用容器更改为 nginx:1.21.0 版本，修改后的资源清单文件如下所示： ``` apiVersion: apps/v1 kind: Deployment metadata: name: nginx-deploy namespace: default spec: replicas: 3 selector: matchLabels: app: nginx minReadySeconds: 5 strategy: type: RollingUpdate # 指定更新策略：RollingUpdate和Recreate rollingUpdate: maxSurge: 1 maxUnavailable: 1 template: metadata: labels: app: nginx spec: containers: - name: nginx image: nginx:1.21.0 ports: - containerPort: 80 ``` 后前面相比较，除了更改了镜像之外，我们还指定了更新策略： ``` minReadySeconds: 5 strategy: type: RollingUpdate rollingUpdate: maxSurge: 1 maxUnavailable: 1 ``` 1. minReadySeconds：表示 Kubernetes 在等待设置的时间后才进行升级，如果没有设置该值，Kubernetes 会假设该容器启动起来后就提供服务了，如果没有设置该值，在某些极端情况下可能会造成服务不正常运行，默认值就是0。 2. type=RollingUpdate：表示设置更新策略为滚动更新，可以设置为Recreate和RollingUpdate两个值，Recreate表示全部重新创建，默认值就是RollingUpdate。 3. maxSurge：表示升级过程中最多可以比原先设置多出的 Pod 数量，例如：maxSurage=1，replicas=5，就表示Kubernetes 会先启动一个新的 Pod，然后才删掉一个旧的 Pod，整个升级过程中最多会有5+1个 Pod。 4. maxUnavaible：表示升级过程中最多有多少个 Pod 处于无法提供服务的状态，当maxSurge不为0时，该值也不能为0，例如：maxUnavaible=1，则表示 Kubernetes 整个升级过程中最多会有1个 Pod 处于无法服务的状态。现在我们来直接更新上面的 Deployment 资源对象： ``` $ kubectl apply -f nginx-deploy.yaml ``` **record 参数** 我们可以添加了一个额外的 --record 参数来记录下我们的每次操作所执行的命令，以方便后面查看。更新后，我们可以执行下面的 kubectl rollout status 命令来查看我们此次滚动更新的状态： ``` $ kubectl rollout status deployment/nginx-deploy Waiting for deployment "nginx-deploy" rollout to finish: 2 out of 3 new replicas have been updated... ``` 从上面的信息可以看出我们的滚动更新已经有两个 Pod 已经更新完成了，在滚动更新过程中，我们还可以执行如下的命令来暂停更新： ``` $ kubectl rollout pause deployment/nginx-deploy deployment.apps/nginx-deploy paused ``` 这个时候我们的滚动更新就暂停了，此时我们可以查看下 Deployment 的详细信息： ``` $ kubectl describe deploy nginx-deploy Name: nginx-deploy Namespace: default CreationTimestamp: Sat, 16 Nov 2019 16:01:24 +0800 Labels: Annotations: deployment.kubernetes.io/revision: 2 kubectl.kubernetes.io/last-applied-configuration: {"apiVersion":"apps/v1","kind":"Deployment","metadata":{"annotations":{},"name":"nginx-deploy","namespace":"default"},"spec":{"minReadySec... Selector: app=nginx Replicas: 3 desired | 2 updated | 4 total | 4 available | 0 unavailable StrategyType: RollingUpdate MinReadySeconds: 5 RollingUpdateStrategy: 1 max unavailable, 1 max surge ...... OldReplicaSets: nginx-deploy-85ff79dd56 (2/2 replicas created) NewReplicaSet: nginx-deploy-5b7b9ccb95 (2/2 replicas created) Events: Type Reason Age From Message ---- ------ ---- ---- ------- Normal ScalingReplicaSet 26m deployment-controller Scaled up replica set nginx-deploy-85ff79dd56 to 4 Normal ScalingReplicaSet 3m44s deployment-controller Scaled down replica set nginx-deploy-85ff79dd56 to 3 Normal ScalingReplicaSet 3m44s deployment-controller Scaled up replica set nginx-deploy-5b7b9ccb95 to 1 Normal ScalingReplicaSet 3m44s deployment-controller Scaled down replica set nginx-deploy-85ff79dd56 to 2 Normal ScalingReplicaSet 3m44s deployment-controller Scaled up replica set nginx-deploy-5b7b9ccb95 to 2 Deployment RollingUpdate ``` ![deploymentrollupdate.png](https://s2.51cto.com/images/20210610/1623293719449640.png?x-oss-process=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=) 我们仔细观察 Events 事件区域的变化，上面我们用 kubectl scale 命令将 Pod 副本调整到了 4，现在我们更新的时候是不是声明又变成 3 了，所以 Deployment 控制器首先是将之前控制的 nginx-deploy-85ff79dd56 这个 RS 资源对象进行缩容操作，然后滚动更新开始了，可以发现 Deployment 为一个新的 nginx-deploy-5b7b9ccb95 RS 资源对象首先新建了一个新的 Pod，然后将之前的 RS 对象缩容到 2 了，再然后新的 RS 对象扩容到 2，后面由于我们暂停滚动升级了，所以没有后续的事件了，大家有看明白这个过程吧？这个过程就是滚动更新的过程，启动一个新的 Pod，杀掉一个旧的 Pod，然后再启动一个新的 Pod，这样滚动更新下去，直到全都变成新的 Pod，这个时候系统中应该存在 4 个 Pod，因为我们设置的策略maxSurge=1，所以在升级过程中是允许的，而且是两个新的 Pod，两个旧的 Pod： ``` $ kubectl get pods -l app=nginx NAME READY STATUS RESTARTS AGE nginx-deploy-5b7b9ccb95-k6pkh 1/1 Running 0 11m nginx-deploy-5b7b9ccb95-l6lmx 1/1 Running 0 11m nginx-deploy-85ff79dd56-7r76h 1/1 Running 0 75m nginx-deploy-85ff79dd56-txc4h 1/1 Running 0 75m ``` 查看 Deployment 的状态也可以看到当前的 Pod 状态： ``` $ kubectl get deployment NAME READY UP-TO-DATE AVAILABLE AGE nginx-deploy 4/3 2 4 75m ``` 这个时候我们可以使用kubectl rollout resume来恢复我们的滚动更新： ``` $ kubectl rollout resume deployment/nginx-deploy deployment.apps/nginx-deploy resumed $ kubectl rollout status deployment/nginx-deploy Waiting for deployment "nginx-deploy" rollout to finish: 2 of 3 updated replicas are available... deployment "nginx-deploy" successfully rolled out ``` 看到上面的信息证明我们的滚动更新已经成功了，同样可以查看下资源状态： ``` $ kubectl get pod -l app=nginx NAME READY STATUS RESTARTS AGE nginx-deploy-5b7b9ccb95-gmq7v 1/1 Running 0 115s nginx-deploy-5b7b9ccb95-k6pkh 1/1 Running 0 15m nginx-deploy-5b7b9ccb95-l6lmx 1/1 Running 0 15m $ kubectl get deployment NAME READY UP-TO-DATE AVAILABLE AGE nginx-deploy 3/3 3 3 79m ``` 这个时候我们查看 ReplicaSet 对象，可以发现会出现两个： ``` $ kubectl get rs -l app=nginx NAME DESIRED CURRENT READY AGE nginx-deploy-5b7b9ccb95 3 3 3 18m nginx-deploy-85ff79dd56 0 0 0 81m ``` 从上面可以看出滚动更新之前我们使用的 RS 资源对象的 Pod 副本数已经变成 0 了，而滚动更新后的 RS 资源对象变成了 3 个副本，我们可以导出之前的 RS 对象查看： ``` $ kubectl get rs nginx-deploy-85ff79dd56 -o yaml apiVersion: apps/v1 kind: ReplicaSet metadata: annotations: deployment.kubernetes.io/desired-replicas: "3" deployment.kubernetes.io/max-replicas: "4" deployment.kubernetes.io/revision: "1" creationTimestamp: "2019-11-16T08:01:24Z" generation: 5 labels: app: nginx pod-template-hash: 85ff79dd56 name: nginx-deploy-85ff79dd56 namespace: default ownerReferences: - apiVersion: apps/v1 blockOwnerDeletion: true controller: true kind: Deployment name: nginx-deploy uid: b0fc5614-ef58-496c-9111-740353bd90d4 resourceVersion: "2140545" selfLink: /apis/apps/v1/namespaces/default/replicasets/nginx-deploy-85ff79dd56 uid: 8eca2998-3610-4f80-9c21-5482ba579892 spec: replicas: 0 selector: matchLabels: app: nginx pod-template-hash: 85ff79dd56 template: metadata: creationTimestamp: null labels: app: nginx pod-template-hash: 85ff79dd56 spec: containers: - image: nginx imagePullPolicy: Always name: nginx ports: - containerPort: 80 protocol: TCP resources: {} terminationMessagePath: /dev/termination-log terminationMessagePolicy: File dnsPolicy: ClusterFirst restartPolicy: Always schedulerName: default-scheduler securityContext: {} terminationGracePeriodSeconds: 30 status: observedGeneration: 5 replicas: 0 ``` 我们仔细观察这个资源对象里面的描述信息除了副本数变成了replicas=0之外，和更新之前没有什么区别吧？大家看到这里想到了什么？有了这个 RS 的记录存在，是不是我们就可以回滚了啊？而且还可以回滚到前面的任意一个版本，这个版本是如何定义的呢？我们可以通过命令 rollout history 来获取： ``` $ kubectl rollout history deployment nginx-deploy deployment.apps/nginx-deploy REVISION CHANGE-CAUSE 1 2 ``` 其实 rollout history 中记录的 revision 是和 ReplicaSets 一一对应。如果我们手动删除某个 ReplicaSet，对应的rollout history就会被删除，也就是说你无法回滚到这个revison了，同样我们还可以查看一个revison的详细信息： ``` $ kubectl rollout history deployment nginx-deploy --revision=1 deployment.apps/nginx-deploy with revision #1 Pod Template: Labels: app=nginx pod-template-hash=85ff79dd56 Containers: nginx: Image: nginx Port: 80/TCP Host Port: 0/TCP Environment: Mounts: Volumes: ``` 假如现在要直接回退到当前版本的前一个版本，我们可以直接使用如下命令进行操作： ``` $ kubectl rollout undo deployment nginx-deploy ``` 当然也可以回退到指定的revision版本： ``` $ kubectl rollout undo deployment nginx-deploy --to-revision=1 deployment "nginx-deploy" rolled back ``` 回滚的过程中我们同样可以查看回滚状态： ``` $ kubectl rollout status deployment/nginx-deploy Waiting for deployment "nginx-deploy" rollout to finish: 1 old replicas are pending termination... Waiting for deployment "nginx-deploy" rollout to finish: 1 old replicas are pending termination... Waiting for deployment "nginx-deploy" rollout to finish: 1 old replicas are pending termination... Waiting for deployment "nginx-deploy" rollout to finish: 2 of 3 updated replicas are available... Waiting for deployment "nginx-deploy" rollout to finish: 2 of 3 updated replicas are available... deployment "nginx-deploy" successfully rolled out ``` 这个时候查看对应的 RS 资源对象可以看到 Pod 副本已经回到之前的 RS 里面去了。 ``` $ kubectl get rs -l app=nginx NAME DESIRED CURRENT READY AGE nginx-deploy-5b7b9ccb95 0 0 0 31m nginx-deploy-85ff79dd56 3 3 3 95m ``` 不过需要注意的是回滚的操作滚动的revision始终是递增的： ``` $ kubectl rollout history deployment nginx-deploy deployment.apps/nginx-deploy REVISION CHANGE-CAUSE 2 3 ``` ### 保留旧版本在很早之前的 Kubernetes 版本中，默认情况下会为我们暴露下所有滚动升级的历史记录，也就是 ReplicaSet 对象，但一般情况下没必要保留所有的版本，毕竟会存在 etcd 中，我们可以通过配置 spec.revisionHistoryLimit 属性来设置保留的历史记录数量，不过新版本中该值默认为 10，如果希望多保存几个版本可以设置该字段。

2021-06-10

1.20版本k8s简单部署教程

systemd/system/multi-user.target.wants/kubelet.serviceto/usr/lib/systemd/system/kubelet.service. 6、所有节点配置k8s

2021-04-02

详细讲解如何对K8S权限进行优化

背景一直以来在内网开发、测试环境的K8S web控制台使用的是rancher面板。

2021-03-22

grpc-java k8s下的负载均衡

本文旨在，在容器化的网络环境下，通过测验寻找一种改造成本最小的实现负载均衡的途径现状在 k8s 的网络环境下，一个 grpc 的服务，同一个 namespace 下，可以直接通过 service 访问

2021-03-16

k8s pod被驱逐问题分析及解决

出现这个问题，很容易理解，内网集群，在集群安装过程中，镜像是通过复制过来的，但是执行docker images|grep k8s发现k8s的镜像全不在了，难道有人为删除，要不然镜像为什么会无缘无故消失呢

2020-11-09

K8s之Ingress-nginx原理及配置

但是，这种方式有一个弊端，就是当新生成一个pod服务就需要创建对应的service将其映射到节点端口，当运行的pod过多时，我们节点暴露给client端的端口也会随之增加，这样我们整个k8s群集的危险系数就会增加

2020-08-23

K8s中优雅停机和零宕机部署

创建、删除 Pod 是 K8s 中最常见的任务之一。本文介绍了 Pod 在响应创建、删除请求时发生的内部流程，还讨论了如何在 Pod 启动或关闭时防止断开连接，以及如何正常关闭长时间运行的任务。

2020-08-18

GitOps初阶指南：将DevOps扩展至K8S

本文转自Rancher Labs 在过去十年的编程中，出现了一些革命性的转变。其中之一是源于围绕DevOps的实践，它将开发和运维团队整合到一个共享的工作流程中，此外还有持续集成和持续交付（CI/CD），通过CI/CD，Devops团队可以向代码库提供持续的更新。另一个变革来自于从单体代码库到基于云的微服务的迁移，这些微服务运行在由Kubernetes等编排平台管理的容器中。即使有Kubernetes这样的平台来编排协调，在集群系统或云端运行的基于容器的应用程序依旧可能是复杂的、难以调配和管理的。GitOps是一套新兴的实践，旨在通过应用Devops和CI/CD世界的技术来简化这一管理任务。 GitOps的关键是基础设施即代码（IaC）的理念，它采用与DevOps用于提供应用程序一样的方法来提供基础设施。所以，不仅是应用，还有底层的主机和网络都被描述在文件中，这些文件可以像版本控制系统中的其他代码一样，然后由自动化流程来将现实世界的应用与这些文件中描述的应用进行融合。用GitOps的说法，版本控制系统中的代码是关于应用在生产中应该是什么样子的唯一真相来源（single source of truth）。定义GitOps Weaveworks是在GitOps概念普及方面贡献最大的公司。稍后我们会详细介绍Weaveworks在其中扮演的角色，但首先，我们先来看看该公司对GitOps的定义，它有两个方面： Kubernetes和其他云原生技术的运维模式，为统一部署、管理和监控容器化集群和应用提供了一套最佳实践。 GitOps是一条通往管理应用的开发者体验之路；在这里，端到端的CI/CD流水线和Git workflow可以同时应用于运维和开发。换句话说，GitOps是一套特定的实践，旨在管理Kubernetes和类似的平台。随着越来越多的开发团队采用DevOps实践，并将代码迁移到云端，GitOps也将会适合更广泛的应用。但要了解GitOps的秘诀和它所能解决的问题，我们需要谈谈它的组成部分。 Git定义在GitOps中Git指的是由Linus Torvalds在2005年开发的极为流行的分布式版本控制系统。Git是一个工具，它允许开发者团队在一个应用程序代码库上共同工作，存储各种代码分支，在将它们合并到生产代码之前，他们可以对这些代码进行修补。Git 的一个关键概念是拉取请求，即开发人员正式要求将他们正在编写的一些代码整合到代码库的另一个分支中。 Git 拉取请求为团队成员提供了一个协作和讨论的机会，然后再就是否应该将新代码添加到应用程序中达成共识。Git 还会存储旧版本的代码，如果出了问题，可以很容易地回滚到上一个好的版本，并可以让你快速查看两次修改之间的变化。Git 最为人所知的部分可能是作为GitHub 这一云端托管版本控制系统的底层，但 Git 本身也是一个开源软件，可以部署在任何地方，无论是公司内部的服务器还是你的PC。需要注意的是，虽然我们通常认为Git是一个计算机编程工具，但实际上取决于你如何使用它。Git 很乐意将任何文本文件作为你的 “代码库”，例如，它可以被作者用来记录合作作品的编辑情况。这一点很重要，因为GitOps的核心代码库大多由声明式配置文件而非可执行代码组成。在我们继续之前，最后要强调一件事——尽管名字中就有 “Git”，但GitOps实际上并不必要使用Git。已经投入使用其他版本控制软件（如Subversion）的团队也可以实现GitOps。但在Devops领域，Git被广泛用于实现CI/CD，所以大多数GitOps项目最终都会使用Git。什么是CI/CD流程？关于CI/CD的完整解释其实不在本文讨论的范围内，但是因为CI/CD是 GitOps 工作的核心，因此我们需要对其进行简单的介绍。CI/CD中的一半持续集成是由版本控制仓库（如Git）实现的。开发者可以对代码库进行持续的小改进，而不是每隔几个月或几年就推出巨大的、单一的新版本。持续部署这一块是通过被称为流水线（pipeline）的自动化系统来实现的，这些流水线可以构建、测试和部署新的代码到生产中。同样，我们在这里一直在谈论代码，这通常会让人联想到用C语言、Java或JavaScript等编程语言编写的可执行代码。但在GitOps中，我们所管理的 “代码” 主要是由配置文件组成的。这不是一个小细节，而是GitOps工作的核心。正如我们所说，这些配置文件是描述我们的系统应该是什么样子的 “唯一真理来源（single source of truth）”。它们是声明式的，而不是指导性的。这意味着，配置文件不会说 “启动十台服务器”，而会简单地说 “这个系统包括十台服务器”。 GitOps方程中的CI那一半允许开发人员快速推出对这些配置文件的调整和改进；当自动化软件代理竭尽全力确保应用程序的实时版本能够反映配置文件中的描述时，CD这一部分会以GitOps语言趋向于声明式模型。 GitOps和Kubernetes 正如我们所提到的，GitOps的概念最初是围绕管理Kubernetes应用而出现的。通过我们现在对GitOps的了解，让我们重温一下Weaveworks的GitOps讨论，看看他们是如何描述如何对基于GitOps原则管理的Kubernetes进行更新的。下面是对整个流程的总结：一个开发者为一个新功能提出Git 拉取请求。审查和批准代码，然后将其合并到主代码库中。合并会触发 CI/CD 流水线、自动测试和重建新代码，并将其部署到仓库。软件代理注意到更新，从仓库中提取新代码，并更新配置仓库中的配置文件（用YAML编写）。 Kubernetes集群中的软件代理根据配置文件，检测到集群已经过时，拉取更改，并部署新功能。 Weaveworks和GitOps 显然，这里的第4步和第5步做了很多繁重的工作。将Git仓库中的 "真理来源 "与现实世界中的Kubernetes应用进行神奇同步的软件代理，就是让GitOps成为可能的魔法。正如我们所说，在GitOps术语中，让实时系统更像配置文件中描述的理想系统的过程叫做融合。当实时系统和理想系统不同步时，那就是分歧。理想情况下，融合可以通过自动化流程来实现，但自动化所能做的事情是有限度的，有时人工干预是必要的。我们在这里用通用术语描述了这个过程，但事实上，如果你真的去看Weaveworks的页面，我们提到的 “软件代理” 是该公司Weave Cloud平台的一部分。“GitOps” 这个词是由Weaveworks的CEO Alexis Richardson创造的，它的部分作用是让Weaveworks平台对已经沉浸在DevOps和CI/CD世界的开发者有吸引力。但Weaveworks从未宣称自己垄断了GitOps，GitOps更多的是一种理念和一套最佳实践，而不是某种具体的产品。正如提供CI/CD解决方案的公司CloudBees的博客所指出的那样，GitOps代表了一种开放的、厂商中立的模式，它是针对亚马逊、谷歌和微软等大型云厂商推出的管理型专有Kubernetes解决方案而开发的。CloudBees提供了自己的GitOps解决方案，这个领域的另一些玩家也是如此。 GitOps和DevOps Atlassian是一家为敏捷开发者制造了许多工具的公司，它有一篇关于GitOps的历史和目的的深度博文（https://www.atlassian.com/git/tutorials/gitops ），值得你花时间去了解。在他们看来，GitOps代表了作为devops的理念的逻辑延伸。具体来说，GitOps是对基础架构即代码（IaC）这一概念的阐述，而基础架构本身就是DevOps环境下产生的一种思想。在Atlassian看来，GitOps弥补了现有DevOps技术与分布式、云托管应用的特殊需求之间的关键差距，现有DevOps技术是为了解决系统管理问题而发展起来的。各个云厂商提供的自动融合是GitOps的特别之处。虽然GitOps今天仍然专注于Kubernetes，但我们希望我们已经明确了它如何适用于更广泛的分布式、基于云的应用世界。开源安全厂商WhiteSource的一篇博文概述了GitOps的优势：可观察性：GitOps系统为复杂的应用提供了监控、日志、跟踪和可视化功能，因此开发人员可以看到什么地方出现了故障，在哪里出现了故障。版本控制和变更管理：很明显，这是使用Git这样的版本控制系统的一个关键优势。有缺陷的更新可以轻松回滚。易于采用：GitOps建立在许多开发人员已经掌握的开发技能之上。提高生产力：GitOps 可以像开发项目和 CI/CD 那样提高工作效率。审计：有了Git，每一个操作都可以追踪到一个特定的提交，这样就可以很容易地追踪到错误的原因。即使你不使用Kubernetes，GitOps也很有可能迟早会成为你工作流程的一部分。

2020-07-30

让 K8S 在 GFW 内愉快的航行

前言 K8S(kubernetes) 日渐火爆，但由于出自Google，对国内的用户及其的不友好。

2020-05-09

使用kubeadm快速部署K8S V1.18

install docker-ce docker-ce-cli containerd.io #systemctl enable docker #systemctl start docker 4、所有节点安装K8S

2020-05-09

如何让你的k8s集群更安全

也就是刚才所提到的，如果你使用了这个默认配置，整个K8s集群等于是向所有人都开放了，这是个非常严重的问题。

2020-04-05

Kubernetes(K8s) 安装（使用kubeadm安装Kubernetes集群）

Kubernetes(K8s) 安装（使用kubeadm安装Kubernetes集群）概述：这篇文章是为了介绍使用kubeadm安装Kubernetes集群（可以用于生产级别）。

2020-04-04

K8S 生态周报 | 首个 Docker 官方 Action 发布

云栖号资讯：【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯，还在等什么，快来！首个 Docker 官方 GitHub Action 发布了从去年 Docker 将企业服务相关的业务出售给 Mirantis 之后，Docker 将重心放在助力开发者体验上，并为此做了一系列的努力。包括 1 月份发布了 Docker Desktop v2.2 ，提供了 WSL2 的新架构，以及新的交互式 Desktop Dashboard 等特性。本周又发布了首个 Docker GitHub Action，简化了 CI/CD 的流程。这其实也是从另一个角度来推进 DockerHub 的普及（比预期的晚了一些）。DockerHub 上一直都有构建 Docker 镜像的功能，但我个人感觉体验并不够好，从一般意义上来说，它不够灵活；另外我感觉它的调度略慢了一点（虽然现在在优化中了）。但本次发布的 Docker GitHub Action 可以让用户可以更灵活的通过 GitHub Action 来定义自己的 workflow，并将镜像推送至镜像仓库。这里的镜像仓库并没有和 DockerHub 强制绑定，用户可以自定义镜像仓库的地址。使用示例如下，完整的项目可参考 docker-github-action 。需要额外注意的是，如果你的仓库是公开的，请注意将自己的用户名密码等设置为 secrets ，可参考下方示例，以防泄漏。 name: Build and push Docker images uses: docker/build-push-action@v1.0 with: # Username used to log in to a Docker registry. If not set then no login will occur username: ${{ secrets.DOCKER_USERNAME }} # Password or personal access token used to log in to a Docker registry. If not set then no login will occur password: ${{ secrets.DOCKER_TOKEN }} # Docker repository to tag the image with repository: ${{ secrets.DOCKER_USERNAME }}/${{ secrets.DOCKER_PROJECT }} # Automatically tags the built image with the git reference as per the readme tag_with_ref: true # Automatically tags the built image with the git short SHA as per the readme tag_with_sha: true # Path to run docker build from path: . # Name of the Dockerfile (Default is 'path/Dockerfile') dockerfile: Dockerfile # Always attempt to pull a newer version of the image always_pull: true # Adds labels with git repository information to the built image add_git_labels: true # Whether to push the image push: true 此外 Visual Studio Code Docker extension 1.0 也在本周发布了！据说比之前版本的都好用，使用 vsc 的小伙伴可以尝试下。 etcd v3.4.5 发布 etcd 本周发布的 v3.4.5 包含了一些： 11704 在 server 端的日志中记录了 /health 的检查结果，主要是为了便于在 etcd 挂掉时分析根因； 11694 修复了一个在处理 metrics 可能引起的异常; 其他变更，请参考其 ReleaseNote Trivy 授权协议变更为 Apache-2.0 Aqua Security 开源的 trivy 是一款镜像漏洞安全扫描程序，对 CI 友好。可能有些小伙伴不太了解 Aqua Security 这家公司，但大多数人都或多或少用过或者了解过它的一些开源项目： kubectl-who-can kube-bench kube-hunter 近期，trivy 的授权协议从 AGPL v3 修改成了 Apache-2.0，这个事情的意义在于，更多的厂商或者公司可以不用担心 trivy 自身的授权协议，可以在自己的产品或者环境中集成使用 trivy 了！目前包括 Harbor，Docker 及 Mirantis Docker Enterprise 等正在或者将使用 trivy 作为其默认镜像安全扫描工具。但需要注意的是，trivy 使用的数据源有些是还是禁止商用来着。上游进展这是一个对 Kubernetes v1.16 的修复，将一系列主线中的修复都合并到了 v1.16 。这里专门提到它，是因为如果你集群中有很多节点变 NotReady 时，可能会导致 control plane 超载，出现不可用的情况。主要的修正都在 NodeLifecycleController 上，建议想要使用或者正在 v1.16 版本的用户关注下此问题（如果集群规模不大，那受此问题影响的可能性比较小），详情请查看 #88959。项目推荐 Reloader 是一个 Kubernetes controller ，它会 watch ConfigMap 或 Secrets，然后对使用这些资源的 Pod 执行滚动升级。注意它只兼容 Kubernetes v1.9 及以上。如果有相关需求的小伙伴可以进行尝试。【云栖号在线课堂】每天都有产品技术专家分享！课程地址：https://yqh.aliyun.com/zhibo 立即加入社群，与专家面对面，及时了解课程最新动态！【云栖号在线课堂社群】https://c.tb.cn/F3.Z8gvnK 原文发布时间：2020-03-24本文作者：张晋涛本文来自：“掘金”，了解相关信息可以关注“掘金”

2020-03-25

使用K8s遇难题？Istio来帮您！

如果你正在使用容器，特别是Kubernetes，那么你应该也听说过Istio。对于初学者来说，Istio是Kubernetes的服务网格（service mesh）。所谓服务网格，它是一个网络层，并且可以动态管理服务流量，然后以安全的方式进行管理。如何充分使用Istio，这不是一篇博客文章能阐述清楚的。因此，在本文中我将介绍一些它的特性，更重要的是，你可以通过这篇文章，了解到一些方法来自动化解决某些实际问题。 Istio可以让你使用一组自定义Kubernetes资源来管理网络流量，并且可以帮助你保护和加密服务之间以及集群内外的网络流量。它全面集成了Kubernetes API，这意味着可以使用与其他Kubernetes配置完全相同的方式来定义和管理Istio设置。权衡利弊,再做选择如果要开始使用Istio，首先应该问自己为什么。Istio提供了一些非常有价值的功能，如金丝雀发布等，但是如果不增加一些复杂性，就无法使用它们。你还需要投入一定的时间来学习它。也就是说，如果你的情况合适使用它，你可以（并且应该）在自己的集群中谨慎且逐步地采用Istio的功能。如果你要从头开始构建新环境，并且经过利弊权衡决定继续使用Istio，那么一定要从一开始就使用严格的相互TLS对其进行设置，并积极使用其强大的功能。具体操作请参考： https://istio.io/docs/setup/install/kubernetes/#installation-steps 为了使一切都有价值并且具有一定的性价比，我们需要在实际应用程序的上下文中考虑Istio，但是如果没有快速免责声明的话，最好不要这样做。如果你只需要管理少量服务（且位于单个集群内），那么引入Istio的性价比相对而言没有那么高。本文中的代码示例不一定能够完全帮助你解决你的问题，但是如果你需要所有的代码以及如何使用它的详细说明都可以在GitLab上找到： https://gitlab.com/ContainerSolutions/k8s-deployment-mtl/ 接下来是你在Cloud Native旅程中可能遇到的两个常见问题，以及如何使用Istio来解决这些问题。问题1：我不相信我的测试如果测试范围并没有完全涵盖你所更改的应用程序，那么你可能会很快采取行动进行新一轮测试，但也有可能应用程序无法正常运行了。在理想状况下，我们都想要确保每个代码经过全面的测试，否则就不会将功能添加到应用程序中。但是现实总归是骨感的，我们常常被ddl追赶，可能还未编写或者更新测试，功能就得上传到项目中了。解决方案：放慢速度那么，如何确保我绝大多数用户不受代码中潜伏的任何错误的影响，又如何进行更改和部署新功能呢？答案是通过先将新版本部署到最少数量的用户来最大程度地减少这些小问题的辐射范围。如果更改能够按照预期工作的话，你可以缓慢增加使用新版本的用户百分比。如果各项指标出现问题，你可以轻松回滚你的更改，然后重试。在没有Istio的情况下可以在Kubernetes上运行金丝雀部署吗？当然没问题，但是如果要自动化这一过程，你需要完全将自己的精力放在web服务器代码和自定义自动化脚本方面。这样的操作方式性价比并不高。 Istio有一些十分优雅的流量分配解决方案，我们可以使用它们在恰当的时间为合适的版本提供适当的客户端服务，并且我们只需调整其中的1个或2个参数。为了实现这一点，你需要设置一个网关入口（Ingress gateway）、一个虚拟服务（virtual service）和一个destination rule。这将位于一般的部署和服务之上，并为你分配流量。 apiVersion: networking.istio.io/v1alpha3 kind: Gateway metadata: name: http-gateway spec: selector: istio: ingressgateway servers: - port: number: 80 name: http protocol: HTTP hos ts: - "*" --- apiVersion: networking.istio.io/v1alpha3 kind: VirtualService metadata: name: my-app spec: hosts: - "*" gateways: - http-gateway http: - match: - uri: prefix: "/my-app" rewrite: uri: "/" route: - destination: host: my-app subset: v1 port: number: 80 weight: 90 - destination: host: my-app subset: v2 port: number: 80 weight: 10 --- apiVersion: networking.istio.io/v1alpha3 kind: DestinationRule metadata: name: my-app spec: host: my-app subsets: - name: v1 labels: version: v1.0.0 - name: v2 labels: version: v2.0.0 从虚拟服务的权重字段中可以看到，Istio将根据指定的值在应用程序的两个版本之间分配流量。这些值的总和必须为100％，否则，API将拒绝应用该定义。然后，你（或者理想情况下，在“持续集成/连续交付”流水线中手动执行一个或多个步骤）将调整权重，以将新版本推广给更多用户，直到所有请求由新版本满足为止，并且以前的版本可以停止维护。通过使用Istio的故障注入功能来模拟网络中断和实际流量性能下降，还可以将Istio集成到您的集成测试策略中。如果在生产中进行测试的想法给你留下了心理阴影，那一定是你的做法有所欠缺。例如，尝试在你的虚拟服务规范中添加以下代码片段以添加一些混乱，然后再找一篇文章来看看怎么用Istio解决这样的混乱。 spec: hosts: - my-app http: - fault: delay: fixedDelay: 7s percent: 100 route: - destination: host: ratings subset: v2 问题2：市场策略无法确定发布版本通常，业务需要针对实际用户测试应用程序的多个版本。但是有时实在无法搞清楚是哪种营销策略可以带来最佳转化率，或者哪种设计选择可以带来最佳的客户留存率。使用Kubernetes，你可以将流量分为两个版本，但是要想从练习中获得任何有价值的见解，则再次需要一大堆自定义代码来获取相关信息，并以非技术同事可以理解的方式对其进行处理。解决方案：使用Istio进行A/B测试 Istio的流量分配规则可以再次解决这一问题，它与Prometheus和Grafana的紧密集成可以帮助你获取直观的A/B测试的结果。一般而言，根据传入数据包内容的某些部分，几乎有无数种方法来决定哪些用户可以获取你的应用程序的版本。在这一示例中，我们将使用User-Agent字段为不同的浏览器提供不同的版本。 apiVersion: networking.istio.io/v1alpha3 kind: VirtualService metadata: name: my-app spec: hosts: - "*" gateways: - http-gateway http: - match: - headers: user-agent: regex: ".*Chrome.*" uri: prefix: "/my-app" rewrite: uri: "/" route: - destination: host: my-app subset: v1 port: number: 80 - match: - headers: user-agent: regex: ".*Mozilla.*" uri: prefix: "/my-app" rewrite: uri: "/" route: - destination: host: my-app subset: v2 port: number: 80 从上面的代码中可以看到，使用Firefox的用户将获得应用程序的版本1，而Chrome用户将获得版本2。如果浏览器的“User-Agent”字段不包含“mozilla”或“chrome”，则他们都将不会获得任一版本。要为其他客户提供服务，您需要添加一条默认路由，我将作为练习留给你。（嘿嘿）如果你不想安装其他浏览器，只是想尝试一下，则可以使用带有头部标志的curl伪装成所需的任何浏览器，例如： curl /my-app -H "User-Agent: Chrome" 通过更改user-agent的值，你可以从命令行测试所有不同的路由。总结以上两种情况大概能让你体验到Istio强大功能的冰山一角。正如上文所说，如果没有Istio，你依然可以进行金丝雀部署和A/B测试，只是你必须自己实现流量分配。但这大大增加了开发部署的复杂性，实属性价比低之选。我希望这篇文章可以让你对Istio的实际应用有很好的理解，并且十分期待你自己尝试一下。如果你想了解更多关于Istio的信息，可以访问它们的官网，上面有许多有用的资料：https://istio.io/ 值得一提的是，Rancher 2.3 Preview2版本上开始支持Istio，用户可以直接在UI界面中启动Istio并且可以为每个命名空间注入自动sidecar。此外，Rancher简化Istio的安装和配置，内置了一个支持Kiali的仪表盘，用于流量和遥测的可视化，然后用Jaeger进行追踪，甚至还有自己的Prometheus和Grafana（与用于高级监控的实例不同）。这一切让部署和管理Istio变得简单而快速。有关发行说明和安装步骤，请访问GitHub： https://github.com/rancher/rancher/releases/tag/v2.3.0-alpha5

2019-09-24

K8S中手动扩容云盘数据卷

K8S中手动扩容云盘数据卷介绍：云盘数据卷扩容包括以下几个部分：云盘物理空间扩容，需要在云盘控制台操作；文件系统扩容，需要挂载云盘到一个物理节点手动操作；PV、PVC Size更新，需要更新StorageClass

2019-09-18

云效发布不同租户 k8s 应用

1. 需求开发环境是开发测试人员使用的应用环境，除了应用运行依赖的云产品，还需要购买开发人员使用的云产品和运维产品。主要有：云效持续集成 maven 私有仓库 gitlib 代码仓库 Node模块仓库镜像仓库购买开发环境应用运行环境 2.云效与相关配置 2.1 maven 代码仓库：私有仓库配置： maven 工具的 profiles 节点，增加私有仓库的 repository; settings 文件加入代码库根目录或者根目录下 pom.xml 增加 repository节点，指向私有仓库。上传私有仓库：使用migrate-local-repo-tool.jar(来自开源工具) 上传： $ java -jar migrate-local-repo-tool.jar -cd "/$HOME/.m2/repositor

2019-08-27

容器服务K8S 实践与踩坑记录

1.前言：容器服务 kubernetes 是目前炙手可热的云原生基础设施，笔者过去一年上线了一个用户数极速增长的应用：该应用一个月内日活用户从零至四千万，用户数从零到一亿的裂变式增长，充分享受了容器服务快速简便的扩容操作和高可用特性。但是，容器服务毕竟是阿里云新产品，存在各式各样的坑，笔者使用容器服务 Kubernetes 集群将公司内系统完全上云1年多，记录一下其中的踩坑与优化记录。 2. 创建集群创建集群时，做好规划，选择优化好的集群配置，可以大大减少后期运维工作，其中部分集群的配置时候在建立后再也没法修改或者修改极其麻烦。 2.1 集群规划网络规划：网络类型: Flannel、Terway； Terway 是阿里云容器服务自研的网络插件，功能上完全兼容Flan

2019-08-27

K8S环境中NAS卷添加noresvport方法

通过K8S使用NAS卷，请区分以下场景：静态存储卷：使用阿里云ACK，PV、PVC方式，nfs驱动；使用阿里云ACK，PV、PVC方式，Flexvolume驱动；使用阿里云ACK，Volume方式

2019-07-02

K8S自己动手系列 - 2.5 - StatefulSet & Grafana

ACCESS MODES STORAGECLASS AGE grafana-pv-claim Bound grafana-pv-volume 2Gi RWX 24m 如果此处不明白或者有问题，请参考前面讲过的K8S

2019-06-26

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。