PaddlePaddle 3.2.2 正式上线,本次版本围绕分布式并行能力、算子实现机制以及硬件兼容性三大方向进行了多项关键优化与功能增强,显著提升了框架的整体运行效率与系统可靠性。
1. 分布式训练能力升级
paddle.nn.Layer 类新增 full 方法,支持便捷获取模型全部参数;增强对 Huggin
gFace 标准 Checkpoint 格式的原生加载支持。(#76249, #76291) group_sharded_optimizer_stage2 优化器中新增 sharded_state_dict 接口,便于分片状态的灵活管理与序列化。#76311 paddle.load 加载 safetensors 文件时 device_id 参数失效及潜在 core dump 问题。#76317 PipelineDatasetPreprocessor 预处理机制,有效规避流水线并行场景下的内存泄漏风险。#76260 2. 算子机制优化
to_tensor 在 BFloat16 类型列表输入场景下存在的精度偏差问题,保障低精度计算一致性。#76242 3. 硬件适配增强
更新详情请参阅:https://www./link/d72c5c85c6c5a1da806d45e917a714ee
源码获取地址:点击下载