容器服务及相关云环境几次故障和问题排查记录
1. 镜像仓库被设置为公有,导致镜像泄露风险:
错误现象:
公有镜像仓库可能会被云上其它用户拉取,导致泄露镜像安全风险;部分运维或者开发同学,因为没有设置准确的 secret 到 Deployment,为了解决无法拉取镜像问题,直接开放镜像仓库为公有。
解决方法:
镜像仓库的命名空间一定要设置为私有,准确设置绑定云效中docker 镜像账号,通过云效发布应用;
严格设定容器镜像仓库的维护权限;
2. 镜像拉取失败:
错误现象:
## 查看 pod 部署日志
kubectl logs {pod}
## 错误信息
Failed to pull image "registry-vpc.{region_id}.aliyuncs.com/{app_name}-daily/{app_n