应根据数据来源和使用方选择:Python内部暂存用pickle,跨语言或外部输入用json;pickle不安全,json需预处理类型。
Python中对象序列化主要用 _pickle(通常简写为 pickle)和 json,二者用途不同、限制不同、安全性也不同。选错方式可能导致数据无法读取、程序崩溃,甚至远程代码执行风险。
pickle 是 Python 原生序列化模块,能完整保存任意 Python 对象(如函数、类实例、嵌套对象等),反序列化时可恢复原始类型和行为。
protocol=4)json 是通用文本格式,只支持基础数据类型:字典、列表、字符串、数字、布尔值和 None。它不能直接保存 Python 特有对象(如 datetime、set、自定义类实例)。
JSONEncoder 和 JSONDecoder 扩展
支持更多类型(例如把 datetime 转成 ISO 字符串)遇到“Object of type X is not JSON serializable”错误,不是该换 pickle,而是该适配 json。
default 参数告诉 json.dumps() 遇到未知类型怎么转(如 lambda obj: obj.isoformat() if isinstance(obj, datetime) else str(obj))set、tuple 等,提前转成 list;对自定义对象,定义 to_dict() 方法再序列化{"_type": "Point", "x": 1, "y": 2}),反序列化时按需构造看数据来源和使用方:
pickle
json,并做好类型预处理pickle + gzip
pickle.loads(),优先用 json 或严格校验后的 pickle