python glue job 参数键名中连字符自动转换为下划线问题详解:aws glue python shell 作业中,`getresolvedoptions()` 会将命令行参数的连字符(`-`)自动替换为下划线(`_`),导致按原始键名(如 `'test-parameter'`)访问时抛出 `keyerror`;正确做法是使用下划线命名(如 `'test_parameter'`)作为参数键。
在 AWS Glue 中使用 Python Shell 类型作业时,常通过 awsglue.utils.getResolvedOptions() 解析传入的 Job 参数。但一个容易被忽视的细节是:该函数会对参数键名进行标准化处理——所有连字符 - 会被自动替换为下划线 _,而这一转换发生在参数解析阶段,与你在 Glue 控制台或 CLI 中定义的参数键形式无关。
例如,当你在 Glue 控制台中配置 Job 参数如下:
Glue 实际会将该参数以 --test-parameter=hello world 形式注入到 sys.argv 中。但 getResolvedOptions() 内部会解析并规范化键名,最终将 'test-parameter' 映射为字典中的 'test_parameter' 键。
✅ 正确用法如下:
import sys
from awsglue.utils import getResolvedOptions
# 注意:这里传入的是规范化后的键名(下划线),而非原始带连字符的键名
args = getResolvedOptions(sys.argv, ['test_parameter']) # ✅ 正确:使用 test_parameter
value = args['test_parameter'] # ✅ 成功获取
print(f'value = {value}') # 输出:value = hello world⚠️ 常见错误写法(会导致 KeyError):
# ❌ 错误:仍使用连字符形式作为 key 列表项和字典访问键 args = getResolvedOptions(sys.argv, ['test-parameter']) # 解析失败或返回空/不匹配 value = args['test-parameter'] # KeyError: 'test-parameter'
? 补充说明与最佳实践:
print("Raw argv:", sys.argv)
print("Parsed args:", args)总结:Glue 的 getResolvedOptions() 对参数键名执行了 - → _ 的自动归一化。开发者必须在 getResolvedOptions() 的字段列表及后续字典访问中,始终使用下划线命名的键名,才能正确读取 Job 参
数。