本文介绍如何在 dvc 项目中使用 python 常量文件(如 `constants.py`)集中定义数据路径,并在 `dvc.yaml` 中通过 `vars` 正确引用,实现路径配置的单一维护源。
DVC 支持通过 vars 字段从外部 Python 文件导入变量,从而实现跨 stage 的路径复用与集中管理。你提出的方案——使用 constants.py 定义路径并在 dvc.yaml 中通过 vars: [- constants.py] 引入——完全正确且官方支持,无需额外插件或变通方式。
✅ 正确用法示例:
# constants.py MY_DATA = "data/location" MY_OUT = "data/out"
# dvc.yaml
vars:
- constants.py
stages:
preprocess:
deps:
- ${MY_DATA}
outs:
- ${MY_OUT}
cmd: python src/preprocess.py⚠️ 注意事项:

? 进阶建议:
若需环境差异化(如开发/生产路径不同),可结合 DVC 的 params.yaml + --params 参数,或使用 YAML 多环境变量(vars: [- params.yaml:paths]),但对纯静态路径场景,constants.py 是最轻量、最直观的选择。
总结:你的原始写法无误。若仍报错(如 Variable 'MY_DATA' not found),请检查:
如确认配置无误仍失败,建议升级 DVC 并提交最小复现案例至 DVC GitHub Issues。