SQL无原生数组类型,主流数据库通过扩展支持:PostgreSQL用ARRAY类型与unnest()展开,MySQL用JSON类型与JSON_CONTAINS等函数解析,通用场景应优先关系建模而非多值字段。
SQL本身没有原生数组类型,但主流数据库提供了类似数组或集合的扩展支持。处理“多值字段”时,核心思路是避免用字符串拼接存储(如"1,2,3"),优先使用规范的关系建模;若必须处理数组类字段,则需根据数据库类型选择对应解析方式。
PostgreSQL 支持 INTEGER[]、TEXT[] 等数组类型,可直接定义、查询和展开。
CREATE TABLE tags (id SERIAL, name TEXT, categories TEXT[]);
INSERT INTO tags VALUES (1, 'book', ARRAY['tech', 'python', 'database']);
WHERE 'python' = ANY(categories)
SELECT id, name, unnest(categories) AS cat FROM tags;
SELECT id, array_agg(DISTINCT cat) FROM (...) GROUP BY id;
MySQL 5.7+ 支持 JSON 类型,适合存储结构化多值数据,比逗号分隔更安全可靠。
CREATE TABLE items (id INT, props JSON);
INSERT INTO items VALUES (1, '["red", "large", "in_stock"]');
props->"$[0]" 获取第一个值,props->>"$[0]" 去引号JSON_CONTAINS(props, '"large"')
JSON_TABLE,MySQL 8.0+):SELECT jt.val FROM items, JSON_TAB
LE(props, '$[*]' COLUMNS (val TEXT PATH '$')) AS jt WHERE id = 1;
当字段是逗号分隔字符串(如 "a,b,c")且无法改造结构时,可用数据库内置函数临时拆解,但性能差、易出错,不推荐新项目使用。
SUBSTRING_INDEX 分段取值,或借助递归CTE(8.0+)生成数字序列再切分string_to_array() 转数组,再结合 unnest()
STRING_SPLIT()(2016+),返回表结果集真正健壮的方案不是“怎么解析数组”,而是“为什么需要数组”。绝大多数场景应拆分为关联表。
user_tags(user_id, tag_id) 中间表,而非在 users 表里加 tags VARCHAR
基本上就这些。选对类型、用对函数、想清模型,多值问题就不复杂但容易忽略设计本质。