PaddlePaddle 3.2.2 发布
PaddlePaddle 3.2.2 现已发布,该版本在分布式并行、算子机制、硬件适配三个方面完成多项优化与升级,进一步提升框架性能与稳定性。
1. 分布式训练
- 优化 FlexCheckpoint 的重切分通信流程; 为 paddle.nn.Layer 新增 full 接口, 用于返回完整模型参数; 支持加载 HuggingFace 开源格式的 Checkpoint。(#76249, #76291)
- 为 group_sharded_optimizer_stage2 优化器新增 sharded_state_dict 函数。#76311
- 为 paddle.load 接口修复加载 safetensor 文件 device_id 参数错误及 core_dump 问题。#76317
- 新增 PipelineDatasetPreprocessor 机制,消除流水线并行策略中可能出现的内存泄漏问题。 #76260
2. 算子机制
- 修复针对 BFloat16 list 场景下的 to_tensor 精度问题。 #76242
3. 硬件适配
- 修改了独立的 XPU 内存监控模块,以确保与最新的内存监控逻辑保持一致。 #76056
更新说明:https://github.com/PaddlePaddle/Paddle/releases/tag/v3.2.2