Python网络请求超时处理需区分connect和read超时,合理设置timeout元组、配置HTTPAdapter重试策略、分类捕获异常并显式关闭response资源。
Python网络请求超时处理不是加个timeout参数就完事,关键在于区分连接超时和读取超时,并配合重试、异常分类和资源清理,才能真正提升稳定性。
HTTP请求耗时分两个阶段:建立TCP连接(connect),以及接收响应数据(read)。requests库的timeout参数接受元组形式(connect_timeout, read_timeout),例如timeout=(3, 10)表示3秒内必须完成握手,之后最多等10秒收完全部响应体。只写单个数值(如timeout=5)会同时作用于两者,容易误判——比如服务器已连上但响应慢,却因总时间超限被中断。
默认适配器不自动重试,且DNS解析、SSL握手等环节未被timeout覆盖。通过自定义Adapter可统一管控:
max_retries启用指数退避重试(推荐urllib3自带的Retry类)pool_connections和pool_maxsize过大的连接池,避免阻塞线程pool_block=True让请求在连接池满时等待而非抛错示例:session.mount("https://", HTTPAdapter(max_retries=Retry(total=2, backoff_factor=1)))
立即学习“Python免费学习笔记(深入)”;
requests抛出的异常类型不同,处理策略应有区别:
requests.exceptions.Timeout:明确是超时,可记录并重试requests.exceptions.ConnectionError:DNS失败、拒绝连接、SSL证书错误等,多数不宜立即重试requests.exceptions.RequestException:基类,兜底捕获,但别用它吞掉所有异常json.JSONDecodeError等响应解析异常,不属于网络层,需单独处理即使超时,requests内部可能仍持有socket或response流
。显式关闭response可释放连接回池:
with requests.get(...) as r:自动调用r.close()
response.close(),尤其在未读取response.content或response.json()时不复杂但容易忽略。