Python处理JSON的核心是json模块,提供序列化(dumps/dump)和反序列化(loads/load)功能,需注意类型映射、中文支持、文件I/O用法及自定义Encoder/Decoder扩展。
Python 中处理 JSON 数据的核心是 json 模块,它提供 序列化(编码) 和 反序列化(解码) 两种基本能力:把 Python 对象转成 JSON 字符串叫序列化,把 JSON 字符串还原为 Python 对象叫反序列化。关键不在于记函数名,而在于理解数据类型映射和常见坑点。
JSON 是轻量级数据交换格式,只支持有限的几种原生类型。Python 的 json 模块在转换时会自动做类型映射,但不是所有 Python 类型都能直接处理:
注意:Python 的 tuple、set、自定义类实例、datetime 等类型默认无法直接序列化,需要额外处理。
这是最常用的两个函数,分别用于内存中对象与字符串之间的转换:
json.dumps(obj):把 Python 对象转成 JSON 字符串。可加参数如 indent=2 美化输出,ensure_ascii=False 支持中文不转义。json.loads(s):把 JSON 格式的字符串解析为 Python 对象。输入必须是合法 JSON,否则抛 json.JSONDecodeError。示例:
data = {"name": "张三", "scores": [85, 92, 78]}当 JSON 数据来自或要保存到文件时,推荐直接使用文件对象接口,更安全高效:
json.dump(obj, file_obj):把对象写入已打开的文件对象(需以 w 模式打开)。json.load(file_obj):从已打开的文件对象读取并解析 JSON(需以 r 模式打开)。典型用法:
with open("data.json", "w", encoding="utf-8") as f:遇到 datetime、Decimal 或自定义类时,需扩展序列化
逻辑:
json.JSONEncoder,重写 default() 方法,告诉它“遇到某类对象怎么转”。json.loads() 中传入 object_hook 函数,对每个 dict 做后处理。例如把 datetime 转为 ISO 格式字符串:
不复杂但容易忽略。掌握这四点,日常 JSON 处理基本够用。