Django 与 ClickHouse 多数据库迁移的正确实践_技术教程_南昌市广照天下广告策划有限公司

Django 与 ClickHouse 多数据库迁移的正确实践

本文详解如何在 django 多数据库（postgresql + clickhouse）架构下，安全、可靠地初始化并应用 clickhouse 的迁移，避免 `django_migrations` 表冲突、重复建表等典型错误。

在 Django 项目中集成 ClickHouse 作为分析型数据库时，常采用双数据库策略：PostgreSQL 承担事务性业务（如用户、权限、会话），ClickHouse 负责高性能聚合查询（如日志、事件流）。但 Django 原生不支持 ClickHouse，需借助第三方后端（如 django-clickhouse-backend）。此时一个关键挑战浮现：如何让 Django 的迁移系统（manage.py migrate）正确识别并管理 ClickHouse 数据库的状态？

问题根源在于迁移生命周期错位。如提问所述，早期直接使用 CREATE TABLE 手动建表，跳过了 Django 迁移流程，导致 django_migrations 表缺失，而后续执行 migrate --database clickhouse --fake-initial 时，Django 尝试自动创建该表（因检测到无迁移记录），却因 ClickHouse 中已存在同名表（如 edl.django_migrations）而报错 Code: 57 — Table already exists——这恰恰说明 Django 在“补全历史”过程中误判了初始状态。

✅ 正确解法不是强行修补迁移文件或反复 fake，而是重建迁移共识：

确认 ClickHouse 当前状态
首先检查 ClickHouse 中是否已存在 django_migrations 表（通常位于默认 database，如 edl）：
```
SELECT * FROM system.tables WHERE database = 'edl' AND name = 'django_migrations';
```
若存在，且其内容为空或不完整，可安全删除：
```
DROP TABLE IF EXISTS edl.django_migrations;
```
手动注入初始迁移记录（推荐用于生产环境）
既然所有模型表（如 edl.users_user, edl.contenttypes_contenttype）已由原始 SQL 创建完毕，只需告诉 Django “这些迁移已生效”。执行以下命令插入对应记录（以 contenttypes.0001_initial 为例）：
```
python manage.py migrate contenttypes 0001 --database clickhouse --fake
python manage.py migrate auth 0001 --database clickhouse --fake
python manage.py migrate admin 0001 --database clickhouse --fake
# ... 逐个对齐已存在的迁移
```
⚠️ 注意：--fake 仅写入 django_migrations 表，不执行 DDL。务必确保对应表结构与迁移文件定义完全一致（字段名、类型、引擎、排序键等），否则后续 makemigrations 可能生成错误差异。
验证与后续维护
执行 python manage.py showmigrations --database clickhouse 确认所有历史迁移标记为 [X]。此后新增模型变更时：
- 运行 python manage.py makemigrations（Django 会基于当前模型与 django_migrations 记录生成新迁移）
- 使用 python manage.py migrate --database clickhouse 应用（ClickHouse 后端将生成兼容的 ALTER TABLE 或 REPLACE PARTITION 语句）

❌ 避免以下高风险操作：

直接删除整个 ClickHouse 数据库（虽彻底但不可控，丢失所有历史数据）；
混用 --fake-initial 与已存在的表（该参数仅适用于 全新空库 场景）；
将 PostgreSQL 的 django_migrations 表导出导入 ClickHouse（结构/类型不兼容，ClickHouse 不支持 id SERIAL PRIMARY KEY 等）。

? 最佳实践建议：

为
ClickHouse 单独定义 clickhouse 数据库路由，明确区分读写逻辑；
在 settings.py 中配置 CLICKHOUSE_DATABASES 并禁用 django.contrib.* 的 ClickHouse 自动注册（除非真需在 CH 中存 auth 数据）；
对 ClickHouse 模型启用 managed = False（若纯作只读宽表），或使用 clickhouse_backend.models.ClickHouseModel 显式声明引擎与分区策略。

迁移不是一次性的任务，而是数据库演进的契约。尊重 Django 迁移系统的语义（--fake = 已存在，--fake-initial = 全新库），才能在多引擎环境中实现可持续的 schema 管理。

17370845950

关于我们

服务项目

广告推广

案例欣赏