Ceph v17.2.0 Quincy 发布,中国开发者贡献凸显
Ceph v17.2.0 Quincy 现已发布。Quincy 是 Ceph 的第 17 个稳定版本, 它以海绵宝宝的章鱼 Quincy 触手命名,这是 Ceph Quincy 的第一个稳定版本。
相比于 Pacific 版本的大变化有:
-
FileStore在 Quincy 中已被弃用。BlueStore 成为 Ceph 的默认存储引擎。
-
ceph-mgr-modules-coredebian 软件包不再ceph-mgr-rook推荐.ceph-mgr-rook依赖于,当版本早于 1.19python3-numpy时,不能在不同的 Python 子解释器中多次导入。python3-numpy因为默认apt-get安装软件包,所以总是与debian 软件包一起作为间接依赖安装。如果您的工作流程取决于此行为,您可能需要单独安装。Recommendsceph-mgr-rookceph-mgrceph-mgr-rook -
device_health_metrics池已重命名.mgr。它现在用作所有ceph-mgr模块的公共存储。升级到 Quincy 后,该device_health_metrics池将.mgr在现有集群上重命名。 -
该
ceph pg dump命令现在打印三个附加列:LAST_SCRUB_DURATION显示最后完成的擦洗的持续时间(以秒为单位);SCRUB_SCHEDULING传达一个 PG 是否被安排在指定时间被擦洗,它是否排队等待擦洗,或者它是否正在被擦洗;OBJECTS_SCRUBBED显示擦洗开始后在 PG 中擦洗的对象数量。 -
require-osd-release如果在集群升级后未将标志设置为适当的版本,现在会报告运行状况警告。 -
LevelDB 支持已被删除。
WITH_LEVELDB不再是受支持的构建选项。用户 - 应该 - 在升级到 Quincy 之前将他们的监视器和 OSD 迁移到 RocksDB。 -
Cephadm:
osd_memory_target_autotune默认启用,设置mgr/cephadm/autotune_memory_target_ratio为0.7总 RAM。这不适合超融合基础架构。对于超融合 Ceph,请参考文档或设置mgr/cephadm/autotune_memory_target_ratio为0.2. -
遥测:改进了选择加入流程,以便用户可以继续共享相同的数据,即使有新的数据收集可用。现在可以选择使用一个新的“性能”频道来收集各种性能指标:
ceph telemetry onceph telemetry enable channel perf查看带有 的示例报告ceph telemetry preview。请注意,在大型集群中使用“perf”通道数据生成遥测报告可能需要一些时间。有关更多详细信息,请参阅:https ://docs.ceph.com/en/quincy/mgr/telemetry/ -
MGR:progress 模块默认禁用 pg 恢复事件,因为该事件代价高昂,并且当有 OSD 被标记为从集群中进入/退出时会中断其他服务。但是,用户仍然可以随时启用此事件。有关更多详细信息,请参阅https://docs.ceph.com/en/quincy/mgr/progress/
-
https://tracker.ceph.com/issues/55383是一个已知问题。
mon_cluster_log_to_journald当设置为 true 时需要设置为 falsemon_cluster_log_to_file以在日志轮换后继续将集群日志消息记录到文件中。
Cephadm
-
SNMP 支持
-
守护进程托管 (mgr, mds, rgw)
-
osd内存自动调整
-
与新的 NFS 管理模块集成
-
能够在 osd 被删除时对其进行删除
-
用于提高性能/可扩展性的 cephadm 代理
Dashboard
-
第 1 天:新的“集群扩展向导”将引导用户完成安装后的步骤:添加新主机、存储设备或服务。
-
NFS:仪表板现在允许用户从一个地方完全管理所有 NFS 导出。
-
新的 mgr 模块(反馈):用户可以直接从 Dashboard 或 CLI 快速报告 Ceph 跟踪器问题或建议。
-
新的“每日消息”:集群管理员可以在横幅中发布自定义消息。
-
Cephadm 集成改进:
-
主机管理:维护、规格和标签,
-
服务管理:编辑和显示日志,
-
守护进程管理(启动、停止、重启、重新加载),
-
支持的新服务:入口(HAProxy)和 SNMP 网关。
-
-
监控和警报:
-
添加了 43 个新警报(总共 68 个),提高了对影响以下事件的可观察性:集群运行状况、监视器、存储设备、PG 和 CephFS。
-
现在可以通过新的 SNMP 网关服务(提供 MIB)将警报作为 SNMP 陷阱发送到外部。
-
改进的集成完整/接近完整事件通知。
-
Grafana 仪表板现在使用 grafonnet 格式(尽管它们仍以 JSON 格式提供)。
-
堆栈更新:用于监控容器的图像已更新。Grafana 8.3.5、Prometheus 2.33.4、Alertmanager 0.23.0 和 Node Exporter 1.3.1。这减少了对多个 Grafana 漏洞(CVE-2021-43798、CVE-2021-39226、CVE-2021-43798、CVE-2020-29510、CVE-2020-29511)的暴露。
-
RADOS
-
OSD:Ceph 现在
mclock_scheduler默认使用 BlueStore OSDosd_op_queue来提供 QoS。Filestore OSD 不支持“mclock_scheduler”。因此,默认的 'osd_op_queue' 设置为wpq用于 Filestore OSD,即使用户尝试更改它也会强制执行。有关配置 mclock 的更多详细信息,请参阅,https://docs.ceph.com/en/quincy/rados/configuration/mclock-config-ref/
运行时存在一个突出问题,在使用命令切换到
custommclock 配置文件后,无法修改与预留、重量和限制相关的 mclock 配置选项。ceph config set ...这由https://tracker.ceph.com/issues/55153跟踪。在问题得到解决之前,建议用户避免使用“自定义”配置文件或使用跟踪器中提到的解决方法。 -
MGR:pg_autoscaler 现在可以使用标志在全局范围内
on转动。默认情况下,它设置为,但此标志可以派上用场,以防止在集群升级和维护期间由自动缩放触发重新平衡。现在可以使用该标志创建池,这允许自动缩放器将更多 PG 分配给此类池。这对于为数据密集型池获得更好的开箱即用性能很有用。offnoautoscaleon--bulk有关自动缩放的更多详细信息,请参阅:https ://docs.ceph.com/en/quincy/rados/operations/placement-groups/
-
offOSD:默认支持 osd-osd 通信的在线压缩。有关压缩模式的更多详细信息,请参阅:https ://docs.ceph.com/en/quincy/rados/configuration/msgr2/#compression-modes
-
OSD:集群日志中慢速操作的简明报告。可以通过设置
osd_aggregated_slow_ops_logging为 false 来恢复旧的和更详细的日志记录行为。 -
“kvs” Ceph 对象类不再打包。“kvs” Ceph 对象类提供了在 librados 对象 omap 之上实现的分布式平面 b 树键值存储。由于该对象类没有现有的内部用户,因此不再对其进行打包。
RBD block storage
-
rbd-nbd:
rbd device attach和rbd device detach添加的命令,这些允许在rbd-nbd守护进程自 Linux 内核 5.14 以来重新启动后安全重新连接。 -
rbd-nbd:
notrim添加了映射选项以支持厚配置映像,类似于 krbd。 -
SSD 设备上客户端持久缓存的大量稳定工作,也可在 16.2.8 中使用。有关使用的详细信息,请参阅https://docs.ceph.com/en/quincy/rbd/rbd-persistent-write-log-cache/
-
使用快速差异图像特征 + 整个对象(不精确)模式时,差异计算中的几个错误修复。在极少数情况下,这些长期存在的问题可能会导致不正确的
rbd export. 也在 15.2.16 和 16.2.8 中修复。 -
修复了在 krbd 上运行 Windows VM 时潜在的性能下降问题。详情见
rxbounce地图选项说明:https ://docs.ceph.com/en/quincy/man/8/rbd/#kernel-rbd-krbd-options
RGW object storage
-
RGW 现在支持按用户和/或按桶进行速率限制。使用此功能,可以限制用户和/或存储桶,可以交付总操作数和/或每分钟字节数。此功能允许管理员仅限制 READ 操作和/或 WRITE 操作。通过使用全局配置,可以将限速配置应用于所有用户和所有存储桶。
-
radosgw-admin realm delete已重命名为radosgw-admin realm rm. 这与帮助信息一致。 -
S3 存储桶通知事件现在包含一个
eTag键而不是etag,并且 eventName 值不再带有s3:前缀,从而修复了与在 AWS 上观察到的消息格式的偏差。 -
现在可以为野兽前端指定 ssl 选项和密码。默认 ssl 选项设置为“no_sslv2:no_sslv3:no_tlsv1:no_tlsv1_1”。如果要返回旧行为,请将 'ssl_options='(空)添加到
rgw frontends配置中。 -
分段上传的行为已修改,以便在分段上传结束时仅发送 CompleteMultipartUpload 通知。上传开始时的 POST 通知和每个部分上发送的 PUT 通知不再发送。
CephFS distributed file system
-
fs:可以使用特定 ID(“fscid”)创建文件系统。这在某些恢复方案中很有用(例如,当监视器数据库丢失并重新构建时,并且恢复的文件系统预计具有与以前相同的 ID)。
-
fs:可以使用该
fs rename命令重命名文件系统。任何为旧文件系统名称授权的 cephx 凭据都需要重新授权为新文件系统名称。由于使用这些重新授权的 ID 的客户端的操作可能会中断,因此该命令需要“--yes-i-really-mean-it”标志。此外,预计将在文件系统上禁用镜像。 -
MDS 升级不再需要在升级文件系统的唯一活动 MDS 之前停止所有备用 MDS 守护程序。
-
CephFS:如果备用重放守护进程重放日志失败,现在会导致等级被标记为“损坏”。
详情可查看官方公告。