PaddlePaddle 3.2.2 发布
PaddlePaddle 3.2.2 现已发布,该版本在分布式并行、算子机制、硬件适配三个方面完成多项优化与升级,进一步提升框架性能与稳定性。 1. 分布式训练 优化 FlexCheckpoint 的重切分通信流程; 为 paddle.nn.Layer 新增 full 接口, 用于返回完整模型参数; 支持加载 HuggingFace 开源格式的 Checkpoint。(#76249,#76291) 为 group_sharded_optimizer_stage2 优化器新增 sharded_state_dict 函数。#76311 为 paddle.load 接口修复加载 safetensor 文件 device_id 参数错误及 core_dump 问题。#76317 新增 PipelineDatasetPreprocessor 机制,消除流水线并行策略中可能出现的内存泄漏问题。#76260 2. 算子机制 修复针对 BFloat16 list 场景下的 to_tensor 精度问题。#76242 3. 硬件适配 修改了独立的 XPU 内存监控模块,以确保与最新的内存监控逻辑保持一致...

