Python中requests设置代理需注意代理类型、格式及报错原因:支持HTTP/HTTPS/SOCKS五种协议,格式为字典;可通过单次传参、Session全局设置或环境变量三种方式配置;需用no_proxy绕过本地地址,验证推荐httpbin.org/ip接口。
Python中使用requests库设置代理很简单,关键在于理解代理类型、格式写法和常见报错原因。
requests支持HTTP、HTTPS、SOCKS五种代理协议,最常用的是HTTP/HTTPS代理。格式统一为字典结构:
{"http": "http://user:pass@host:port", "https": "http://user:pass@host:port"}
{"https": "http://host:port"}(注意:即使代理本身是HTTP,也常需填在https键下,因requests默认对HTTPS请求走https键)urllib.parse.quote处理特殊字符pysocks(pip install pysocks),格式如"http://user:pass@host:port"或"socks5://host:port"
方式不同,作用范围不同,按需选择:
requests.get("https://httpbin.org/ip", proxies=proxies)
s = requests.Session(); s.proxies = proxies; s.get(...)
os.environ["HTTP_PROXY"] = "http://host:port"
os.environ["HTTPS_PROXY"] = "http://host:port"
有些代理不希望转发内网或localhost请求,可用no_proxy控制:
os.environ["NO_PROXY"] = "127.0.0.1,localhost,192.168.1.0/24"
NO_PROXY必须全大写,且值为逗号分隔,不支持空格
代理不可用,requests默认抛出ConnectTimeout或ProxyError,建议用try/except捕获并降级处理快速确认代理是否起作用,推荐调用公开测试接口:
https://httpbin.org/ip返回当前出口IPhttps://httpbin.org/headers查看请求头中X-Forwarded-For或Via字段不复杂但容易忽略细节,比如HTTPS请求误配http键、未URL编码密码、忘记装pysocks导致SOCKS失败——逐项检查通常就能解决。