SQLAlchemy实现upsert有三种方式:一是Core层数据库原生语法(PostgreSQL用on_conflict_do_update、MySQL用on_duplicate_key_update、SQLite用on_conflict_do_update),高效且避免竞态;二是ORM层bulk_upsert_mappings(2.0+),批量处理、不触发事件;三是merge(),自动查再更/插但有性能开销。
SQLAlchemy 提供了多种方式实现“存在则更新,不存在则插入”(upsert),具体写法取决于你用的是 Core 还是 ORM,以及后端数据库是否原生支持 upsert(如 PostgreSQL 的 ON CONFLICT、MySQL 的 ON DUPLICATE KEY UPDATE、SQLite 的 ON CONFLICT REPLACE/DO UPDATE)。
这是最直接、性能最好的方式,利用数据库原生语法,避免先查再插/更的竞态问题和额外查询开销。
insert().on_conflict_do_update()
from sqlalchemy.dialects.postgresql import insertstmt = insert(User).values( id=123, name='Alice', email='alice@example.com' ) stmt = stmt.on_conflict_do_update( indexelements=['id'], # 冲突依据(主键或唯一索引列) set=dict(name=stmt.excluded.name, email=stmt.excluded.email) # 更新字段 ) conn.execute(stmt)
insert().on_duplicate_key_update()
from sqlalchemy.dialects.mysql import insertstmt = insert(User).values(id=123, name='Alice', email='alice@example.com') stmt = stmt.on_d
uplicate_key_update( name=stmt.inserted.name, email=stmt.inserted.email ) conn.execute(stmt)
insert().on_conflict_do_update()
from sqlalchemy.dialects.sqlite import insertstmt = insert(User).values(id=123, name='Alice', email='alice@example.com') stmt = stmt.on_conflict_do_update( indexelements=['id'], set=dict(name=stmt.excluded.name, email=stmt.excluded.email) ) conn.execute(stmt)
适用于一次性处理多条记录,底层调用对应 dialect 的原生 upsert,比逐条 session.merge() 快得多。
session.bulk_upsert_mappings())data = [
{'id': 123, 'name': 'Alice', 'email': 'a1@example.com'},
{'id': 456, 'name': 'Bob', 'email': 'b1@example.com'},
]
session.bulk_upsert_mappings(User, data)
session.commit()
注意:bulk_upsert_mappings 不触发 ORM 事件(如 @event.listens_for),也不做对象实例化,纯数据层操作。
如果数据库不支持原生 upsert,或你需要 ORM 对象生命周期管理(如事件、关系加载),可用 session.merge():
user = User(id=123, name='Alice', email='alice@example.com') merged = session.merge(user) # 自动判断插入或更新 session.commit()
id 或 email)上有主键或唯一约束,否则 upsert 无法判断冲突index_elements 必须匹配某个唯一索引(可以是复合唯一索引的一部分)PRIMARY KEY 或 UNIQUE KEY
merge() 按主键比较,不支持按非主键字段(如 email)判断“存在”——除非你重写 __hash__ 和 __eq__,但这不推荐